Query         015062
Match_columns 414
No_of_seqs    245 out of 925
Neff          6.5 
Searched_HMMs 46136
Date          Fri Mar 29 02:43:27 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/015062.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/015062hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PF00150 Cellulase:  Cellulase   99.9 7.9E-26 1.7E-30  218.1  14.5  194    1-203    77-279 (281)
  2 COG2730 BglC Endoglucanase [Ca  99.6 5.6E-15 1.2E-19  152.4  11.1  172    1-172   131-326 (407)
  3 smart00458 RICIN Ricin-type be  98.7 6.5E-08 1.4E-12   81.0   8.2   95  260-361     3-106 (117)
  4 cd00161 RICIN Ricin-type beta-  98.6 3.5E-07 7.6E-12   76.2  10.1   95  262-362     8-115 (124)
  5 smart00633 Glyco_10 Glycosyl h  98.5   8E-06 1.7E-10   79.2  17.6  171   31-226    56-246 (254)
  6 PF00652 Ricin_B_lectin:  Ricin  98.3 1.1E-06 2.3E-11   74.1   6.2   93  263-361    11-116 (124)
  7 PRK10150 beta-D-glucuronidase;  98.2  0.0001 2.2E-09   80.1  18.7  179   31-227   389-581 (604)
  8 PF12876 Cellulase-like:  Sugar  98.1 9.7E-06 2.1E-10   66.1   6.3   78   41-124     1-88  (88)
  9 PF02836 Glyco_hydro_2_C:  Glyc  97.7 0.00061 1.3E-08   67.4  14.0   57   31-95    103-159 (298)
 10 PF07745 Glyco_hydro_53:  Glyco  97.6 0.00041 8.8E-09   70.1  10.4  140   41-201   115-296 (332)
 11 PF14200 RicinB_lectin_2:  Rici  97.5  0.0004 8.6E-09   58.0   8.2   76  284-361     2-93  (105)
 12 smart00458 RICIN Ricin-type be  97.5 0.00023   5E-09   59.3   6.0   71  257-328    40-116 (117)
 13 cd00161 RICIN Ricin-type beta-  97.4 0.00039 8.4E-09   57.6   6.3   65  263-328    51-124 (124)
 14 PF00331 Glyco_hydro_10:  Glyco  97.4  0.0033 7.1E-08   63.2  13.6  173   31-226   105-308 (320)
 15 PF11790 Glyco_hydro_cc:  Glyco  97.3  0.0043 9.4E-08   59.8  13.3  143   23-193    45-202 (239)
 16 PF00652 Ricin_B_lectin:  Ricin  97.3 0.00052 1.1E-08   57.5   5.6   70  256-326    47-124 (124)
 17 PF14200 RicinB_lectin_2:  Rici  97.2 0.00075 1.6E-08   56.3   5.7   75  254-329    15-105 (105)
 18 COG3934 Endo-beta-mannanase [C  97.0  0.0036 7.9E-08   65.2   9.7  187   23-229   112-310 (587)
 19 PF01229 Glyco_hydro_39:  Glyco  96.7  0.0071 1.5E-07   64.2   9.5  201   29-242   129-361 (486)
 20 COG3867 Arabinogalactan endo-1  96.1    0.18   4E-06   50.1  14.5  143   39-201   159-342 (403)
 21 PRK09525 lacZ beta-D-galactosi  95.6    0.13 2.9E-06   59.5  13.1   57   31-95    434-490 (1027)
 22 KOG3736 Polypeptide N-acetylga  95.3   0.056 1.2E-06   58.4   7.9  103  260-377   460-571 (578)
 23 PRK10340 ebgA cryptic beta-D-g  95.0     0.3 6.5E-06   56.7  13.3   55   32-94    422-476 (1021)
 24 PF14587 Glyco_hydr_30_2:  O-Gl  94.1       1 2.2E-05   46.5  13.3  169   31-210   153-365 (384)
 25 PF03198 Glyco_hydro_72:  Gluca  92.5     1.1 2.4E-05   45.0  10.4  152    1-173    94-252 (314)
 26 PF13204 DUF4038:  Protein of u  92.0    0.51 1.1E-05   46.8   7.5   65   27-96    124-188 (289)
 27 KOG3738 Predicted polypeptide   91.6    0.13 2.7E-06   53.0   2.7   92  264-362   441-543 (559)
 28 COG5309 Exo-beta-1,3-glucanase  90.7     5.2 0.00011   39.5  12.6  146   40-198   120-278 (305)
 29 KOG3736 Polypeptide N-acetylga  87.3    0.87 1.9E-05   49.4   5.2   64  265-330   507-574 (578)
 30 COG3693 XynA Beta-1,4-xylanase  85.3     2.8   6E-05   42.3   7.1   59   32-92    125-191 (345)
 31 TIGR03356 BGL beta-galactosida  84.6     3.9 8.4E-05   42.9   8.3   82    2-90    110-212 (427)
 32 PF02449 Glyco_hydro_42:  Beta-  84.3     1.3 2.9E-05   45.2   4.6   32   31-62    109-140 (374)
 33 KOG2233 Alpha-N-acetylglucosam  81.8       4 8.6E-05   43.3   6.9   86   11-100   203-288 (666)
 34 PF03662 Glyco_hydro_79n:  Glyc  80.7     1.5 3.2E-05   44.4   3.3  133   50-186   165-313 (319)
 35 PF03498 CDtoxinA:  Cytolethal   79.1     2.9 6.2E-05   37.7   4.3   74  298-379    59-142 (150)
 36 PF05089 NAGLU:  Alpha-N-acetyl  77.6     5.2 0.00011   40.6   6.1   66   27-94    153-218 (333)
 37 PF12891 Glyco_hydro_44:  Glyco  77.6     7.4 0.00016   37.7   6.8   64   31-98    106-182 (239)
 38 cd00257 Fascin Fascin-like dom  75.4      15 0.00033   30.7   7.6   61  295-358     4-66  (119)
 39 cd00257 Fascin Fascin-like dom  71.4      49  0.0011   27.6   9.8   71  285-359    34-107 (119)
 40 PF02156 Glyco_hydro_26:  Glyco  67.0      57  0.0012   32.9  10.6  135   38-203    42-205 (311)
 41 COG5520 O-Glycosyl hydrolase [  66.1 1.2E+02  0.0025   31.5  12.4  151   32-205   149-313 (433)
 42 PF02055 Glyco_hydro_30:  O-Gly  65.7      77  0.0017   34.1  11.9  152   31-201   203-379 (496)
 43 cd02068 radical_SAM_B12_BD B12  64.8      16 0.00036   31.0   5.6   42   47-98     38-79  (127)
 44 PF02310 B12-binding:  B12 bind  63.1      14  0.0003   30.8   4.7   43   47-98     50-92  (121)
 45 KOG3737 Predicted polypeptide   62.7     7.6 0.00017   40.3   3.4   97  256-361   482-586 (603)
 46 COG2240 PdxK Pyridoxal/pyridox  57.9      76  0.0017   31.6   9.4   68   24-100    48-117 (281)
 47 TIGR01370 cysRS possible cyste  55.6 2.4E+02  0.0051   28.6  14.8  147   32-195   143-299 (315)
 48 cd02067 B12-binding B12 bindin  47.7      35 0.00076   28.6   4.7   44   47-99     49-93  (119)
 49 KOG3738 Predicted polypeptide   46.2      17 0.00038   37.9   2.9   69  261-330   480-555 (559)
 50 PF06268 Fascin:  Fascin domain  45.6      96  0.0021   25.8   7.0   37  321-359    22-59  (111)
 51 PF00332 Glyco_hydro_17:  Glyco  41.1      46   0.001   33.4   5.1   44   46-90     81-124 (310)
 52 PF12697 Abhydrolase_6:  Alpha/  37.9   1E+02  0.0022   26.8   6.4   61   38-99     14-77  (228)
 53 PF02449 Glyco_hydro_42:  Beta-  37.8 2.9E+02  0.0063   28.1  10.5  135   73-227   214-356 (374)
 54 TIGR01233 lacG 6-phospho-beta-  37.8      87  0.0019   33.3   6.8   63   24-90    128-211 (467)
 55 PRK10673 acyl-CoA esterase; Pr  36.5 1.3E+02  0.0028   27.7   7.1   63   37-102    31-95  (255)
 56 PRK13511 6-phospho-beta-galact  36.4   1E+02  0.0022   32.9   7.0   61   24-88    129-210 (469)
 57 PF00167 FGF:  Fibroblast growt  36.0      76  0.0016   27.0   5.0   57  300-359     9-66  (122)
 58 PF00232 Glyco_hydro_1:  Glycos  35.6      42 0.00091   35.4   4.0   66   24-92    134-219 (455)
 59 PRK00865 glutamate racemase; P  35.4 1.6E+02  0.0035   28.5   7.8   60   35-95     18-77  (261)
 60 PF06229 FRG1:  FRG1-like famil  33.9      99  0.0021   29.0   5.7   36  321-358    25-61  (191)
 61 cd08165 MPP_MPPE1 human MPPE1   32.8 1.1E+02  0.0024   27.2   5.7   85    1-96      1-86  (156)
 62 PF06268 Fascin:  Fascin domain  32.7 1.7E+02  0.0036   24.3   6.5   69  285-358    25-98  (111)
 63 PF10035 DUF2179:  Uncharacteri  31.4      49  0.0011   24.0   2.6   23   73-95     28-50  (55)
 64 cd07366 3MGA_Dioxygenase Subun  29.7      64  0.0014   32.8   4.0   28   68-95     69-96  (328)
 65 PRK13364 protocatechuate 4,5-d  29.2      63  0.0014   32.0   3.8   30   68-97     31-60  (278)
 66 cd00058 FGF Acidic and basic f  28.9 3.8E+02  0.0081   23.1   8.9   55  301-358     8-63  (123)
 67 PLN02814 beta-glucosidase       28.9 1.1E+02  0.0024   33.0   5.8   67  158-227   385-462 (504)
 68 TIGR03101 hydr2_PEP hydrolase,  28.5 2.1E+02  0.0045   28.0   7.3   68   33-101    40-112 (266)
 69 TIGR03356 BGL beta-galactosida  28.3 1.8E+02  0.0038   30.6   7.2   67  158-227   335-415 (427)
 70 PRK13363 protocatechuate 4,5-d  28.2      73  0.0016   32.5   4.1   29   68-96     71-99  (335)
 71 cd07949 PCA_45_Doxase_B_like_1  27.8      70  0.0015   31.6   3.9   29   68-96     31-59  (276)
 72 KOG3737 Predicted polypeptide   27.6      45 0.00098   34.8   2.5   62  265-329   531-598 (603)
 73 cd02070 corrinoid_protein_B12-  27.6 1.4E+02   0.003   27.8   5.6   45   47-100   132-178 (201)
 74 KOG2230 Predicted beta-mannosi  27.4 1.3E+02  0.0027   33.2   5.8   85   39-128   424-525 (867)
 75 PF06838 Met_gamma_lyase:  Meth  27.3 1.2E+02  0.0025   31.7   5.3   54   38-94    144-197 (403)
 76 TIGR02026 BchE magnesium-proto  26.6 1.2E+02  0.0026   32.4   5.6   26   72-97     77-102 (497)
 77 PRK09593 arb 6-phospho-beta-gl  26.5 2.1E+02  0.0045   30.6   7.4   63   24-89    150-234 (478)
 78 TIGR00067 glut_race glutamate   26.3 2.9E+02  0.0063   26.7   7.8   61   35-96     11-72  (251)
 79 PLN02998 beta-glucosidase       26.3 1.5E+02  0.0032   32.0   6.2   77  148-227   379-467 (497)
 80 PRK09852 cryptic 6-phospho-bet  26.0 1.6E+02  0.0035   31.4   6.5   78  148-227   353-445 (474)
 81 KOG1959 Glycosyl hydrolase, fa  25.7 6.2E+02   0.013   29.4  10.8   87    3-96    229-330 (996)
 82 COG5111 RPC34 DNA-directed RNA  25.2   1E+02  0.0022   29.9   4.2   75    1-85    145-222 (301)
 83 PF00975 Thioesterase:  Thioest  25.0      67  0.0014   29.4   3.0   68   38-106    16-84  (229)
 84 PLN02899 alpha-galactosidase    24.7      53  0.0011   36.2   2.5   63  300-367   486-559 (633)
 85 cd07384 MPP_Cdc1_like Saccharo  24.5 2.4E+02  0.0053   25.4   6.5   90    1-96      1-97  (171)
 86 cd08163 MPP_Cdc1 Saccharomyces  24.5 2.6E+02  0.0056   27.2   7.1   61   33-95     32-93  (257)
 87 PLN02748 tRNA dimethylallyltra  24.4 1.6E+02  0.0035   31.5   6.0   31   66-97     92-122 (468)
 88 cd01828 sialate_O-acetylestera  24.3 3.9E+02  0.0085   23.1   7.8   49   46-95     46-95  (169)
 89 PLN02849 beta-glucosidase       24.1 2.4E+02  0.0051   30.5   7.3   67  158-227   383-462 (503)
 90 cd01833 XynB_like SGNH_hydrola  23.9 3.6E+02  0.0077   23.0   7.3   68   22-95     19-87  (157)
 91 PF15016 DUF4520:  Domain of un  23.9 2.6E+02  0.0057   22.8   5.8   57  312-370     4-60  (85)
 92 smart00442 FGF Acidic and basi  23.8 1.4E+02  0.0031   25.8   4.6   62  302-364    13-78  (126)
 93 cd07950 Gallate_Doxase_N The N  23.7      92   0.002   30.8   3.8   29   68-96     31-59  (277)
 94 cd07372 2A5CPDO_B The beta sub  23.6      97  0.0021   30.9   4.0   30   67-96     32-61  (294)
 95 cd07359 PCA_45_Doxase_B_like S  22.3 1.1E+02  0.0025   29.6   4.2   30   67-96     26-55  (271)
 96 PRK13370 mhpB 3-(2,3-dihydroxy  21.7      96  0.0021   31.3   3.6   39   58-98     17-55  (313)
 97 PRK14729 miaA tRNA delta(2)-is  21.2 2.3E+02   0.005   28.4   6.1   31   66-97     73-103 (300)
 98 cd02065 B12-binding_like B12 b  21.1 2.2E+02  0.0048   23.4   5.2   42   47-98     49-91  (125)
 99 TIGR02427 protocat_pcaD 3-oxoa  21.1 3.5E+02  0.0077   23.8   7.0   64   37-101    28-92  (251)
100 PRK13365 protocatechuate 4,5-d  20.8 1.1E+02  0.0024   30.2   3.8   31   67-97     30-60  (279)
101 cd07368 PhnC_Bs_like PhnC is a  20.4 1.1E+02  0.0024   30.1   3.7   32   67-98     28-59  (277)
102 PRK09589 celA 6-phospho-beta-g  20.2 1.7E+02  0.0038   31.2   5.3   69  158-228   366-449 (476)
103 PRK15014 6-phospho-beta-glucos  20.2 2.3E+02   0.005   30.2   6.2   35   24-61    146-180 (477)

No 1  
>PF00150 Cellulase:  Cellulase (glycosyl hydrolase family 5);  InterPro: IPR001547 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 5 GH5 from CAZY comprises enzymes with several known activities; endoglucanase (3.2.1.4 from EC); beta-mannanase (3.2.1.78 from EC); exo-1,3-glucanase (3.2.1.58 from EC); endo-1,6-glucanase (3.2.1.75 from EC); xylanase (3.2.1.8 from EC); endoglycoceramidase (3.2.1.123 from EC). The microbial degradation of cellulose and xylans requires several types of enzymes. Fungi and bacteria produces a spectrum of cellulolytic enzymes (cellulases) and xylanases which, on the basis of sequence similarities, can be classified into families. One of these families is known as the cellulase family A [] or as the glycosyl hydrolases family 5 []. One of the conserved regions in this family contains a conserved glutamic acid residue which is potentially involved [] in the catalytic mechanism.; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 3NDY_A 3NDZ_B 1LF1_A 1TVP_B 1TVN_A 3AYR_A 3AYS_A 1QI0_A 1W3K_A 1OCQ_A ....
Probab=99.93  E-value=7.9e-26  Score=218.12  Aligned_cols=194  Identities=24%  Similarity=0.415  Sum_probs=142.7

Q ss_pred             CEEEecCCCCCCcccCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCC-------ChhhHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDGNGFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQ-------NVKDWYRY   73 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dgn~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~-------n~~dW~~~   73 (414)
                      +||||+|.. |+|+...   +. +....-..+.+.++|+.||+|||+++.|++|||+|||+....       +..+|.++
T Consensus        77 ~vild~h~~-~~w~~~~---~~-~~~~~~~~~~~~~~~~~la~~y~~~~~v~~~el~NEP~~~~~~~~w~~~~~~~~~~~  151 (281)
T PF00150_consen   77 YVILDLHNA-PGWANGG---DG-YGNNDTAQAWFKSFWRALAKRYKDNPPVVGWELWNEPNGGNDDANWNAQNPADWQDW  151 (281)
T ss_dssp             EEEEEEEES-TTCSSST---ST-TTTHHHHHHHHHHHHHHHHHHHTTTTTTEEEESSSSGCSTTSTTTTSHHHTHHHHHH
T ss_pred             eEEEEeccC-ccccccc---cc-cccchhhHHHHHhhhhhhccccCCCCcEEEEEecCCccccCCccccccccchhhhhH
Confidence            599999977 6774332   11 111112346677899999999999999999999999998521       12678999


Q ss_pred             HHHHHHHHHhcCCCcEEEEcCccCCCcchh-hhcccccccCCCcEEEEEeecCCCCC-CCccCCCCCcchhhHHHHHHHH
Q 015062           74 MQLGAEAVHAANPEVLVILSGLNFDKDLSF-VRNQAVNLTFTGKLVFEAHWYGFTDG-QAWVDGNPNQVCGRVVDNVMRL  151 (414)
Q Consensus        74 ~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~-v~~~Pv~l~~~~klVYs~H~Y~p~~~-~~W~~~~~~~~~~~~~~~~~~~  151 (414)
                      +++++++||+++|+++|+|+|..|+.++.. ....|.  ...+++||++|.|.+... ..+... .......+...+...
T Consensus       152 ~~~~~~~Ir~~~~~~~i~~~~~~~~~~~~~~~~~~P~--~~~~~~~~~~H~Y~~~~~~~~~~~~-~~~~~~~~~~~~~~~  228 (281)
T PF00150_consen  152 YQRAIDAIRAADPNHLIIVGGGGWGADPDGAAADNPN--DADNNDVYSFHFYDPYDFSDQWNPG-NWGDASALESSFRAA  228 (281)
T ss_dssp             HHHHHHHHHHTTSSSEEEEEEHHHHTBHHHHHHHSTT--TTTTSEEEEEEEETTTCHHTTTSTC-SHHHHHHHHHHHHHH
T ss_pred             HHHHHHHHHhcCCcceeecCCCccccccchhhhcCcc--cccCceeEEeeEeCCCCcCCccccc-cchhhhHHHHHHHHH
Confidence            999999999999999999999999887766 444552  135789999999997652 222110 001122334455556


Q ss_pred             HHHHHhcCCCEEEeccCcCCCCCCccchHHHHHHHHHHHHCCCcEEEeccCc
Q 015062          152 SGFLLEQGWPLFVSEFGADLRGNNVNDNRYLNCFFGVAAELDWDWALWTLVG  203 (414)
Q Consensus       152 ~gfl~~~g~Pv~lGEFG~~~~~~~~~~~~~~~~~l~~l~e~~i~Wa~Wa~~G  203 (414)
                      ..++.+.|.||+|||||....+.. ....++..++++++++++||++|++++
T Consensus       229 ~~~~~~~g~pv~~gE~G~~~~~~~-~~~~~~~~~~~~~~~~~~g~~~W~~~~  279 (281)
T PF00150_consen  229 LNWAKKNGKPVVVGEFGWSNNDGN-GSTDYADAWLDYLEQNGIGWIYWSWKP  279 (281)
T ss_dssp             HHHHHHTTSEEEEEEEESSTTTSC-HHHHHHHHHHHHHHHTTCEEEECEESS
T ss_pred             HHHHHHcCCeEEEeCcCCcCCCCC-cCHHHHHHHHHHHHHCCCeEEEEecCC
Confidence            666677899999999999854332 346788888999999999999999974


No 2  
>COG2730 BglC Endoglucanase [Carbohydrate transport and metabolism]
Probab=99.58  E-value=5.6e-15  Score=152.43  Aligned_cols=172  Identities=19%  Similarity=0.238  Sum_probs=107.3

Q ss_pred             CEEEecCCCCCCcccCCCCC-CCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCC--CCCCh-hhHHHHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDG-NGFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRG--PKQNV-KDWYRYMQL   76 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dg-n~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~--~~~n~-~dW~~~~~~   76 (414)
                      +|+||+|....+.-|....+ ...+....-+.+++++.|++||.||++.++|||||++|||++  ....+ .....+...
T Consensus       131 ~V~iD~H~~~~~~~~~~~s~~~~~~~~~~~~~~~~~~~w~~ia~~f~~~~~VIg~~~~NEP~~~~~~~~w~~~~~~A~~~  210 (407)
T COG2730         131 YVLIDLHGYPGGNNGHEHSGYTSDYKEENENVEATIDIWKFIANRFKNYDTVIGFELINEPNGIVTSETWNGGDDEAYDV  210 (407)
T ss_pred             eEEEEecccCCCCCCcCcccccccccccchhHHHHHHHHHHHHHhccCCCceeeeeeecCCcccCCccccccchHHHHHH
Confidence            69999999886554543333 234444444559999999999999999999999999999996  21111 112344455


Q ss_pred             HHHHHHhcCCCcEEEEcCccCCC---------------cchhhhccccccc--CCCcEEEEEeecCCCCC--CCccCCCC
Q 015062           77 GAEAVHAANPEVLVILSGLNFDK---------------DLSFVRNQAVNLT--FTGKLVFEAHWYGFTDG--QAWVDGNP  137 (414)
Q Consensus        77 ~~~aIr~~dP~~LIiVeG~~~~~---------------dLs~v~~~Pv~l~--~~~klVYs~H~Y~p~~~--~~W~~~~~  137 (414)
                      +.++|.+..|..+|.++|..+..               ........|+..+  ...+++|++|.|++...  ..|.....
T Consensus       211 v~~~i~~~~~~~~I~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~~l~~~~~~~~~~  290 (407)
T COG2730         211 VRNAILSNAPHWLIRVGGQGLNGWRVIMAHTYGSSDGGNDNGVYIVPVDDPGLTANKHLYAPHVYGDDVLNGGSWTVGGE  290 (407)
T ss_pred             HHhhhhhcCceEEEEECcccccCCeeeccCCCccccccccCCceeeeccchhhhccceeccceeecchhhcCCCCCccCC
Confidence            55666677777799999986544               1111111222222  35689999999987642  24442111


Q ss_pred             CcchhhHHHHHHHHHHHH-HhcCCCEEEeccCcCCC
Q 015062          138 NQVCGRVVDNVMRLSGFL-LEQGWPLFVSEFGADLR  172 (414)
Q Consensus       138 ~~~~~~~~~~~~~~~gfl-~~~g~Pv~lGEFG~~~~  172 (414)
                      ..........+.+.+++- ...+.|+++||||+.++
T Consensus       291 ~~~~~~~~~~~~~~~~~~~~~~g~~~~~Ge~g~~~~  326 (407)
T COG2730         291 FDLAETDCAIWLNYVGHGARKNGYPTVIGEFGGNYN  326 (407)
T ss_pred             cccccccceeeecceeecccccceeeeeccccCccc
Confidence            111122222223333322 24799999999999884


No 3  
>smart00458 RICIN Ricin-type beta-trefoil. Carbohydrate-binding domain formed from presumed gene triplication.
Probab=98.69  E-value=6.5e-08  Score=80.98  Aligned_cols=95  Identities=24%  Similarity=0.520  Sum_probs=72.7

Q ss_pred             cCCCCceeeccCCCCceeeccCCC---CCCccccCCceeeeeccceeEeeccCC-cccEEeeecC--CCCCceEEEecCc
Q 015062          260 HPATGLCVQRKSFLDPLTLGPCTE---SEAWSYTPHKTISLKGAYFCLQAKHVG-KPAKLGIICT--DCGSTWEIISDSK  333 (414)
Q Consensus       260 ~~~tg~c~~~~~~~~~l~~~~c~~---~~~W~~~~~~~l~~~~~~~cl~a~~~g-~~~~~~~~c~--~~~~~W~~~s~s~  333 (414)
                      ...+|+|+++.+...++.+.+|.+   .+.|.|++++.|+++ +++||++.+.. .++.+ ..|.  +++|+|.+..++.
T Consensus         3 ~~~~~~Cl~~~~~~~~v~l~~c~~~~~~Q~w~~~~~g~~~~~-~~~Cl~~~~~~~~~v~l-~~c~~~~~~Q~W~~~~~~~   80 (117)
T smart00458        3 SGNTGKCLDVNGNSNPVGLFDCHGTGGNQLWKLTSDGAIRIA-TDLCLTANGNTGSTVTL-YSCDGDADNQYWTVNKDGT   80 (117)
T ss_pred             eccCCccEecCCCCceEEEEeCCCCCccceEEEeCCCeEEec-CCccCccCCCCCCEEEE-EECCCCCcCCEEEECCCee
Confidence            347899999855424689999988   379999999999887 89999998864 34444 8897  4789999988554


Q ss_pred             cEEeeecCCCceeEEEecCCC---ceeeeee
Q 015062          334 MHLSSKADNGTTVCLDVDSSN---TIVTNTC  361 (414)
Q Consensus       334 ~~~~~~~~~~~~lcld~~~~~---~ivt~~c  361 (414)
                      +  ...   .+.+|||+....   .|+.+.|
T Consensus        81 i--~~~---~~~~cl~~~~~~~~~~~~~~~c  106 (117)
T smart00458       81 I--RNP---DSGLCLDVKDGNTGTKVILWTC  106 (117)
T ss_pred             E--EeC---CCCEEEecCCCCCCceEEEEeC
Confidence            3  222   689999998543   6777887


No 4  
>cd00161 RICIN Ricin-type beta-trefoil; Carbohydrate-binding domain formed from presumed gene triplication. The domain is found in a variety of molecules serving diverse functions such as enzymatic activity, inhibitory toxicity and signal transduction. Highly specific ligand binding occurs on exposed surfaces of the compact domain sturcture.
Probab=98.60  E-value=3.5e-07  Score=76.20  Aligned_cols=95  Identities=27%  Similarity=0.595  Sum_probs=71.9

Q ss_pred             CCCceeeccCC--CCceeeccCCCC---CCccccCCceeeeeccceeEeeccC--CcccEEeeecC--CCCCceEEEecC
Q 015062          262 ATGLCVQRKSF--LDPLTLGPCTES---EAWSYTPHKTISLKGAYFCLQAKHV--GKPAKLGIICT--DCGSTWEIISDS  332 (414)
Q Consensus       262 ~tg~c~~~~~~--~~~l~~~~c~~~---~~W~~~~~~~l~~~~~~~cl~a~~~--g~~~~~~~~c~--~~~~~W~~~s~s  332 (414)
                      .+|+|+++.+.  ..++.+.+|.+.   +.|.++.++.|+++.+++||++.+.  |.++.+ ..|.  +++|+|++..+.
T Consensus         8 ~~~~cL~~~~~~~~~~v~~~~c~~~~~~Q~W~~~~~g~~~~~~~~~Cl~~~~~~~~~~~~~-~~c~~~~~~Q~W~~~~~~   86 (124)
T cd00161           8 NTGLCLDVNGGSDGGPVQLYPCHGNGNNQKWTLTSDGTIRIKSSNLCLDVGGDAPGSKVRL-YTCSGGSDNQRWTFNKDG   86 (124)
T ss_pred             CCCeEEECCCCCCCCEEEEEECCCCCccCCEEEeCCCeEEEcCCCeEEcccCCCCCCEEEE-EECCCCCcCCEEEECCCc
Confidence            39999998542  356899999975   7999999888988778899999886  566666 7898  467999998774


Q ss_pred             ccEEeeecCCCceeEEEecCC---C-ceeeeeee
Q 015062          333 KMHLSSKADNGTTVCLDVDSS---N-TIVTNTCK  362 (414)
Q Consensus       333 ~~~~~~~~~~~~~lcld~~~~---~-~ivt~~c~  362 (414)
                        +|...   .+.+|||+...   + .|+...|.
T Consensus        87 --~i~~~---~~~~cl~~~~~~~~~~~v~~~~c~  115 (124)
T cd00161          87 --TIRNL---KSGKCLDVKGGNTNGTNLILWTCD  115 (124)
T ss_pred             --EEEEC---CCCeEEeCCCCCCCCCEEEEEeCC
Confidence              34333   37899999853   3 55557663


No 5  
>smart00633 Glyco_10 Glycosyl hydrolase family 10.
Probab=98.49  E-value=8e-06  Score=79.22  Aligned_cols=171  Identities=13%  Similarity=0.194  Sum_probs=106.2

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCC---hhhHH-----HHHHHHHHHHHhcCCCcEEEEcCccCCCc--
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQN---VKDWY-----RYMQLGAEAVHAANPEVLVILSGLNFDKD--  100 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n---~~dW~-----~~~~~~~~aIr~~dP~~LIiVeG~~~~~d--  100 (414)
                      .+.+.+.-+.+++||++.  |...|+.|||....+.   ...|.     .++.++.+++|+++|+..+++-..+-...  
T Consensus        56 ~~~~~~~i~~v~~ry~g~--i~~wdV~NE~~~~~~~~~~~~~w~~~~G~~~i~~af~~ar~~~P~a~l~~Ndy~~~~~~~  133 (254)
T smart00633       56 LARLENHIKTVVGRYKGK--IYAWDVVNEALHDNGSGLRRSVWYQILGEDYIEKAFRYAREADPDAKLFYNDYNTEEPNA  133 (254)
T ss_pred             HHHHHHHHHHHHHHhCCc--ceEEEEeeecccCCCcccccchHHHhcChHHHHHHHHHHHHhCCCCEEEEeccCCcCccH
Confidence            567888889999999987  6679999999764211   12453     46788999999999999999964321111  


Q ss_pred             -----chhh---hcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcCCC
Q 015062          101 -----LSFV---RNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGADLR  172 (414)
Q Consensus       101 -----Ls~v---~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~~~  172 (414)
                           +..+   ...-+  ++ +-+=+..|++...           ...+.+.+.+.+    +.+.|.||+|+||++...
T Consensus       134 k~~~~~~~v~~l~~~g~--~i-DgiGlQ~H~~~~~-----------~~~~~~~~~l~~----~~~~g~pi~iTE~dv~~~  195 (254)
T smart00633      134 KRQAIYELVKKLKAKGV--PI-DGIGLQSHLSLGS-----------PNIAEIRAALDR----FASLGLEIQITELDISGY  195 (254)
T ss_pred             HHHHHHHHHHHHHHCCC--cc-ceeeeeeeecCCC-----------CCHHHHHHHHHH----HHHcCCceEEEEeecCCC
Confidence                 1111   11111  12 2355677876311           112334444443    344699999999999875


Q ss_pred             CCCccchHHHHHHHHHHHHCC--CcEEEeccCccccccccccCCCceeecccCCCC
Q 015062          173 GNNVNDNRYLNCFFGVAAELD--WDWALWTLVGSYYLREGVIGLNEYYGLFDWNWC  226 (414)
Q Consensus       173 ~~~~~~~~~~~~~l~~l~e~~--i~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~~dW~  226 (414)
                      .....+.++++.+++.+.++.  .|.++|.+.-.+--+.     ++.-||++.|++
T Consensus       196 ~~~~~qA~~~~~~l~~~~~~p~v~gi~~Wg~~d~~~W~~-----~~~~~L~d~~~~  246 (254)
T smart00633      196 PNPQAQAADYEEVFKACLAHPAVTGVTVWGVTDKYSWLD-----GGAPLLFDANYQ  246 (254)
T ss_pred             CcHHHHHHHHHHHHHHHHcCCCeeEEEEeCCccCCcccC-----CCCceeECCCCC
Confidence            322345678899998888865  5788997642111111     123467776664


No 6  
>PF00652 Ricin_B_lectin:  Ricin-type beta-trefoil lectin domain;  InterPro: IPR000772 Ricin is a legume lectin from the seeds of the castor bean plant, Ricinus communis. The seeds are poisonous to people, animals and insects and just one milligram of ricin can kill an adult. Primary structure analysis has shown the presence of a similar domain in many carbohydrate-recognition proteins like plant and bacterial AB-toxins, glycosidases or proteases [, , ]. This domain, known as the ricin B lectin domain, can be present in one or more copies and has been shown in some instance to bind simple sugars, such as galactose or lactose. The ricin B lectin domain is composed of three homologous subdomains of 40 amino acids (alpha, beta and gamma) and a linker peptide of around 15 residues (lambda). It has been proposed that the ricin B lectin domain arose by gene triplication from a primitive 40 residue galactoside-binding peptide [, ]. The most characteristic, though not completely conserved, sequence feature is the presence of a Q-W pattern. Consequently, the ricin B lectin domain as also been refered as the (QxW)3 domain and the three homologous regions as the QxW repeats [, ]. A disulphide bond is also conserved in some of the QxW repeats []. The 3D structure of the ricin B chain has shown that the three QxW repeats pack around a pseudo threefold axis that is stabilised by the lambda linker []. The ricin B lectin domain has no major segments of a helix or beta sheet but each of the QxW repeats contains an omega loop []. An idealized omega-loop is a compact, contiguous segment of polypeptide that traces a 'loop-shaped' path in three-dimensional space; the main chain resembles a Greek omega.; PDB: 2VLC_B 3A22_B 3A21_B 3A23_B 1GGP_B 1VCL_A 2Z48_B 2Z49_A 2D7R_A 2D7I_A ....
Probab=98.33  E-value=1.1e-06  Score=74.12  Aligned_cols=93  Identities=27%  Similarity=0.626  Sum_probs=67.7

Q ss_pred             CCceeecc---CCCCceeeccCCCC--CCccccCCceeeeeccc-eeEeeccCC--cccEEeeecC-C-CCCceEEEecC
Q 015062          263 TGLCVQRK---SFLDPLTLGPCTES--EAWSYTPHKTISLKGAY-FCLQAKHVG--KPAKLGIICT-D-CGSTWEIISDS  332 (414)
Q Consensus       263 tg~c~~~~---~~~~~l~~~~c~~~--~~W~~~~~~~l~~~~~~-~cl~a~~~g--~~~~~~~~c~-~-~~~~W~~~s~s  332 (414)
                      +|+|+++.   ....++.+.+|.++  +.|.+++++.|...... +||++.+.+  .++.+ ..|. . .+|+|.+..+.
T Consensus        11 ~~~cl~~~~~~~~~~~v~l~~c~~~~~Q~w~~~~~~~i~~~~~~~~CL~~~~~~~~~~i~l-~~C~~~~~~Q~W~~~~~~   89 (124)
T PF00652_consen   11 SGLCLDVQGSTKNGSPVVLYPCDGSDNQLWRFDPDGQIRSNNNPNLCLDVDGSSPGTKIVL-WPCDSNSSNQRWKFDPDG   89 (124)
T ss_dssp             GGEEEEEGGSSSTTTBEEEEE--SSGGGEEEEETTSBEEETTETTEEEEESSSSTTEBEEE-EETTTTGGGGBEEEETTS
T ss_pred             CCCeEEEcCCCCCCCEEEEEECCCCCceeEEEcCCCceeeccCcceEEEeeccCCCceEEE-eeccCCccCCeEEEcCCe
Confidence            99999997   22356999999996  68999999977765544 599999876  55666 8899 3 34899999844


Q ss_pred             ccEEeeecCCCceeEEEecC---CCceeeeee
Q 015062          333 KMHLSSKADNGTTVCLDVDS---SNTIVTNTC  361 (414)
Q Consensus       333 ~~~~~~~~~~~~~lcld~~~---~~~ivt~~c  361 (414)
                      .  |...   .+.+|||+..   +..++.+.|
T Consensus        90 ~--i~n~---~s~~cL~~~~~~~~~~l~~~~c  116 (124)
T PF00652_consen   90 R--IRNK---NSGLCLDVKGGSDGNPLVLWPC  116 (124)
T ss_dssp             B--EEET---TTTEEEEEGGGSTTEBEEEEE-
T ss_pred             e--EEeC---CCCEEEEecCCCCCCEEEEEEC
Confidence            4  4333   3789999994   457777877


No 7  
>PRK10150 beta-D-glucuronidase; Provisional
Probab=98.16  E-value=0.0001  Score=80.13  Aligned_cols=179  Identities=15%  Similarity=0.183  Sum_probs=102.3

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcchhhhccccc
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLSFVRNQAVN  110 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~v~~~Pv~  110 (414)
                      .+.+.+.++.|.+|++++|.|+...|.||+....   ..-..+++++.+.||+.||.++|..+.......    ....+ 
T Consensus       389 ~~~~~~~~~~mv~r~~NHPSIi~Ws~gNE~~~~~---~~~~~~~~~l~~~~k~~DptR~vt~~~~~~~~~----~~~~~-  460 (604)
T PRK10150        389 QQAHLQAIRELIARDKNHPSVVMWSIANEPASRE---QGAREYFAPLAELTRKLDPTRPVTCVNVMFATP----DTDTV-  460 (604)
T ss_pred             HHHHHHHHHHHHHhccCCceEEEEeeccCCCccc---hhHHHHHHHHHHHHHhhCCCCceEEEecccCCc----ccccc-
Confidence            4567778899999999999999999999987532   234456678889999999999999886422110    00011 


Q ss_pred             ccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHH-HHHHhcCCCEEEeccCcCCC------CCCc----cch
Q 015062          111 LTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLS-GFLLEQGWPLFVSEFGADLR------GNNV----NDN  179 (414)
Q Consensus       111 l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~-gfl~~~g~Pv~lGEFG~~~~------~~~~----~~~  179 (414)
                      ....  =|+++|.|-.     |....  .........+.... .+....+.|++++|||+...      ++..    .+.
T Consensus       461 ~~~~--Dv~~~N~Y~~-----wy~~~--~~~~~~~~~~~~~~~~~~~~~~kP~~isEyg~~~~~~~h~~~~~~~~ee~q~  531 (604)
T PRK10150        461 SDLV--DVLCLNRYYG-----WYVDS--GDLETAEKVLEKELLAWQEKLHKPIIITEYGADTLAGLHSMYDDMWSEEYQC  531 (604)
T ss_pred             cCcc--cEEEEcccce-----ecCCC--CCHHHHHHHHHHHHHHHHHhcCCCEEEEccCCccccccccCCCCCCCHHHHH
Confidence            0111  2888877632     11100  00111111111111 11112389999999996432      1111    123


Q ss_pred             HHHHHHHHHHHHCC--CcEEEeccCccccccccc-cCCCceeecccCCCCC
Q 015062          180 RYLNCFFGVAAELD--WDWALWTLVGSYYLREGV-IGLNEYYGLFDWNWCD  227 (414)
Q Consensus       180 ~~~~~~l~~l~e~~--i~Wa~Wa~~Gsyy~r~g~-~~~~et~Gll~~dW~t  227 (414)
                      .+++...+.++++.  +|-+.|++.- |..-.|. ...++..||++.|...
T Consensus       532 ~~~~~~~~~~~~~p~~~G~~iW~~~D-~~~~~g~~~~~g~~~Gl~~~dr~~  581 (604)
T PRK10150        532 AFLDMYHRVFDRVPAVVGEQVWNFAD-FATSQGILRVGGNKKGIFTRDRQP  581 (604)
T ss_pred             HHHHHHHHHHhcCCceEEEEEEeeec-cCCCCCCcccCCCcceeEcCCCCC
Confidence            45666666777655  5667787531 1010111 1234678999998743


No 8  
>PF12876 Cellulase-like:  Sugar-binding cellulase-like;  InterPro: IPR024778 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. This entry represents a family of putative cellulase enzymes.; PDB: 3GYC_B.
Probab=98.06  E-value=9.7e-06  Score=66.14  Aligned_cols=78  Identities=15%  Similarity=0.129  Sum_probs=46.1

Q ss_pred             HHHHhCCCceEEEEeccCC-CCCCC-------C--ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcchhhhccccc
Q 015062           41 MATIFNGVRNVVGMSLRNE-LRGPK-------Q--NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLSFVRNQAVN  110 (414)
Q Consensus        41 iA~ryk~~pnViG~dL~NE-P~~~~-------~--n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~v~~~Pv~  110 (414)
                      |-++|+..+.|++-||.|| |....       .  ....-.+.+++++++||++||++.|.++.  |+.+...+...+  
T Consensus         1 iv~~~~~~~~Il~Wdl~NE~p~~~~~~~~~~~~~~~~~~~~~~l~~~~~~iR~~dP~~pvt~g~--~~~~~~~~~~~~--   76 (88)
T PF12876_consen    1 IVTRFGYDPRILAWDLWNEPPNNWADGYPAEWGDPKAEAYAEWLKEAFRWIRAVDPSQPVTSGF--WGGDWEDLEQLQ--   76 (88)
T ss_dssp             -HHHTT-GGGEEEEESSTTTT-TT-TT-TT-TT-TTSHHHHHHHHHHHHHHHTT-TTS-EE--B----S-TTHHHHS---
T ss_pred             CchhhcCCCCEEEEEeecCCCCcccccccccccchhHHHHHHHHHHHHHHHHHhCCCCcEEeec--ccCCHHHHHHhc--
Confidence            4579999999999999999 66211       1  12456678899999999999999998753  333333333222  


Q ss_pred             ccCCCcEEEEEeec
Q 015062          111 LTFTGKLVFEAHWY  124 (414)
Q Consensus       111 l~~~~klVYs~H~Y  124 (414)
                      ++  .-=|+++|.|
T Consensus        77 ~~--~~DvisfH~Y   88 (88)
T PF12876_consen   77 AE--NLDVISFHPY   88 (88)
T ss_dssp             -T--T-SSEEB-EE
T ss_pred             hh--cCCEEeeecC
Confidence            11  1238999998


No 9  
>PF02836 Glyco_hydro_2_C:  Glycosyl hydrolases family 2, TIM barrel domain;  InterPro: IPR006103 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 2 GH2 from CAZY comprises enzymes with several known activities; beta-galactosidase (3.2.1.23 from EC); beta-mannosidase (3.2.1.25 from EC); beta-glucuronidase (3.2.1.31 from EC). These enzymes contain a conserved glutamic acid residue which has been shown [], in Escherichia coli lacZ (P00722 from SWISSPROT), to be the general acid/base catalyst in the active site of the enzyme. Beta-galactosidase from E. coli has a TIM-barrel-like core surrounded by four other largely beta domains [].; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 3CMG_A 3FN9_C 1YQ2_A 3K4D_B 3LPG_B 3LPF_A 3K4A_B 3K46_B 3GM8_A 3DEC_A ....
Probab=97.74  E-value=0.00061  Score=67.39  Aligned_cols=57  Identities=18%  Similarity=0.145  Sum_probs=48.1

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      .+.+.+-++.|.+|++++|.||...+.||+        .....++++.+.+|+.||.++|.....
T Consensus       103 ~~~~~~~~~~~v~~~~NHPSIi~W~~gNE~--------~~~~~~~~l~~~~k~~DptRpv~~~~~  159 (298)
T PF02836_consen  103 RENAEQELREMVRRDRNHPSIIMWSLGNES--------DYREFLKELYDLVKKLDPTRPVTYASN  159 (298)
T ss_dssp             HHHHHHHHHHHHHHHTT-TTEEEEEEEESS--------HHHHHHHHHHHHHHHH-TTSEEEEETG
T ss_pred             HHHHHHHHHHHHHcCcCcCchheeecCccC--------ccccchhHHHHHHHhcCCCCceeeccc
Confidence            567788899999999999999999999999        355667888899999999999987665


No 10 
>PF07745 Glyco_hydro_53:  Glycosyl hydrolase family 53;  InterPro: IPR011683 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. This domain is found in family 53 of the glycosyl hydrolase classification []. These enzymes are endo-1,4- beta-galactanases (3.2.1.89 from EC). The structure of this domain is known [] and has a TIM barrel fold.; GO: 0015926 glucosidase activity; PDB: 1HJQ_A 1HJS_A 1HJU_B 1FHL_A 1FOB_A 2GFT_A 1UR4_B 1UR0_A 1R8L_B 2CCR_A ....
Probab=97.59  E-value=0.00041  Score=70.10  Aligned_cols=140  Identities=19%  Similarity=0.291  Sum_probs=81.3

Q ss_pred             HHHHhCC---CceEEEEeccCCCCC-------CCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCc------chhh
Q 015062           41 MATIFNG---VRNVVGMSLRNELRG-------PKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKD------LSFV  104 (414)
Q Consensus        41 iA~ryk~---~pnViG~dL~NEP~~-------~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~d------Ls~v  104 (414)
                      +-+.+|.   .|..|  -+=||-..       ...++....++...+++|||+++|+..|+|--.+-+..      +..+
T Consensus       115 vl~~l~~~G~~pd~V--QVGNEin~Gmlwp~g~~~~~~~~a~ll~ag~~AVr~~~p~~kV~lH~~~~~~~~~~~~~f~~l  192 (332)
T PF07745_consen  115 VLQALKAAGVTPDMV--QVGNEINNGMLWPDGKPSNWDNLAKLLNAGIKAVREVDPNIKVMLHLANGGDNDLYRWFFDNL  192 (332)
T ss_dssp             HHHHHHHTT--ESEE--EESSSGGGESTBTTTCTT-HHHHHHHHHHHHHHHHTHSSTSEEEEEES-TTSHHHHHHHHHHH
T ss_pred             HHHHHHHCCCCccEE--EeCccccccccCcCCCccCHHHHHHHHHHHHHHHHhcCCCCcEEEEECCCCchHHHHHHHHHH
Confidence            3344443   34443  77888433       22356677788899999999999999999964432221      1222


Q ss_pred             hcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHH-hcCCCEEEeccCcCCCC----------
Q 015062          105 RNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLL-EQGWPLFVSEFGADLRG----------  173 (414)
Q Consensus       105 ~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~-~~g~Pv~lGEFG~~~~~----------  173 (414)
                      ...-+  +++   |..+++|.+.+.          ..+.+...+.    .+. +++.||+|.|.|.+.+.          
T Consensus       193 ~~~g~--d~D---viGlSyYP~w~~----------~l~~l~~~l~----~l~~ry~K~V~V~Et~yp~t~~d~D~~~n~~  253 (332)
T PF07745_consen  193 KAAGV--DFD---VIGLSYYPFWHG----------TLEDLKNNLN----DLASRYGKPVMVVETGYPWTLDDGDGTGNII  253 (332)
T ss_dssp             HHTTG--G-S---EEEEEE-STTST-----------HHHHHHHHH----HHHHHHT-EEEEEEE---SBS--SSSS--SS
T ss_pred             HhcCC--Ccc---eEEEecCCCCcc----------hHHHHHHHHH----HHHHHhCCeeEEEeccccccccccccccccC
Confidence            22222  332   889999986542          1223333333    222 36899999999976540          


Q ss_pred             -----------CCccchHHHHHHHHHHHH----CCCcEEEecc
Q 015062          174 -----------NNVNDNRYLNCFFGVAAE----LDWDWALWTL  201 (414)
Q Consensus       174 -----------~~~~~~~~~~~~l~~l~e----~~i~Wa~Wa~  201 (414)
                                 ....+.+|++++++.+.+    +++|-+||.-
T Consensus       254 ~~~~~~~~yp~t~~GQ~~~l~~l~~~v~~~p~~~g~GvfYWeP  296 (332)
T PF07745_consen  254 GATSLISGYPATPQGQADFLRDLINAVKNVPNGGGLGVFYWEP  296 (332)
T ss_dssp             SSSTGGTTS-SSHHHHHHHHHHHHHHHHTS--TTEEEEEEE-T
T ss_pred             ccccccCCCCCCHHHHHHHHHHHHHHHHHhccCCeEEEEeecc
Confidence                       001257889999998887    6789999953


No 11 
>PF14200 RicinB_lectin_2:  Ricin-type beta-trefoil lectin domain-like; PDB: 2X2S_C 2X2T_A 2VSE_B 2VSA_A 3EF2_A 2IHO_A 3HZB_H 1YBI_B 3PHZ_A 3NBE_A ....
Probab=97.55  E-value=0.0004  Score=57.95  Aligned_cols=76  Identities=16%  Similarity=0.270  Sum_probs=52.9

Q ss_pred             CCCccccC----Cc--eeeeeccceeEeeccC----CcccEEeeecC-CCCCceEEEecCccEEeeecCCCceeEEEecC
Q 015062          284 SEAWSYTP----HK--TISLKGAYFCLQAKHV----GKPAKLGIICT-DCGSTWEIISDSKMHLSSKADNGTTVCLDVDS  352 (414)
Q Consensus       284 ~~~W~~~~----~~--~l~~~~~~~cl~a~~~----g~~~~~~~~c~-~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~  352 (414)
                      +++|++++    .+  .|+-+.+++||++.+.    |.++.+ ..|+ .++|+|++...+..+...+.. .+.+|||+..
T Consensus         2 nQ~W~~~~~~~~~g~Y~i~n~~sg~~L~v~~~~~~~g~~v~~-~~~~~~~~Q~W~i~~~~~g~y~I~n~-~s~~~Ldv~~   79 (105)
T PF14200_consen    2 NQQWTFTPVGDSDGYYKIRNVNSGKYLDVAGGSTANGTNVQQ-WTCNGNDNQQWKIEPVGDGYYRIRNK-NSGKVLDVAG   79 (105)
T ss_dssp             GGEEEEEEEETTTTEEEEEETTTTEEEEEGCTTCSTTEBEEE-EESSSSGGGEEEEEESTTSEEEEEET-STTEEEEEGG
T ss_pred             CCEEEEEEecCCCCEEEEEECCCCCEEEeCCCCcCCCcEEEE-ecCCCCcCcEEEEEEecCCeEEEEEC-CCCcEEEECC
Confidence            36787765    33  4555679999999985    444444 7887 788999998887664433322 6789999983


Q ss_pred             ----CC-ceeeeee
Q 015062          353 ----SN-TIVTNTC  361 (414)
Q Consensus       353 ----~~-~ivt~~c  361 (414)
                          +| .|+.+.|
T Consensus        80 ~~~~~g~~v~~~~~   93 (105)
T PF14200_consen   80 GSTANGTNVQQWEY   93 (105)
T ss_dssp             GSSSTTEBEEEEE-
T ss_pred             CCCCCCCEEEEEeC
Confidence                45 6777887


No 12 
>smart00458 RICIN Ricin-type beta-trefoil. Carbohydrate-binding domain formed from presumed gene triplication.
Probab=97.48  E-value=0.00023  Score=59.27  Aligned_cols=71  Identities=21%  Similarity=0.389  Sum_probs=54.2

Q ss_pred             eeecCCCCceeeccCCC-CceeeccCCC-C--CCccccCCceeeeeccceeEeeccCCcc-cEEeeecC-CCCCceEE
Q 015062          257 VIYHPATGLCVQRKSFL-DPLTLGPCTE-S--EAWSYTPHKTISLKGAYFCLQAKHVGKP-AKLGIICT-DCGSTWEI  328 (414)
Q Consensus       257 ~~~~~~tg~c~~~~~~~-~~l~~~~c~~-~--~~W~~~~~~~l~~~~~~~cl~a~~~g~~-~~~~~~c~-~~~~~W~~  328 (414)
                      .++.. +++|+++.+.. .++.+..|.. +  ++|.+.+++.|....+++||++.+.... ......|+ .++|+|.+
T Consensus        40 ~~~~~-~~~Cl~~~~~~~~~v~l~~c~~~~~~Q~W~~~~~~~i~~~~~~~cl~~~~~~~~~~~~~~~c~~~~~Q~W~~  116 (117)
T smart00458       40 AIRIA-TDLCLTANGNTGSTVTLYSCDGDADNQYWTVNKDGTIRNPDSGLCLDVKDGNTGTKVILWTCNGNPNQKWIF  116 (117)
T ss_pred             eEEec-CCccCccCCCCCCEEEEEECCCCCcCCEEEECCCeeEEeCCCCEEEecCCCCCCceEEEEeCCCCccccEEe
Confidence            34444 89999985543 4689999986 3  6999998888888889999999876542 33447888 67899986


No 13 
>cd00161 RICIN Ricin-type beta-trefoil; Carbohydrate-binding domain formed from presumed gene triplication. The domain is found in a variety of molecules serving diverse functions such as enzymatic activity, inhibitory toxicity and signal transduction. Highly specific ligand binding occurs on exposed surfaces of the compact domain sturcture.
Probab=97.40  E-value=0.00039  Score=57.64  Aligned_cols=65  Identities=22%  Similarity=0.426  Sum_probs=52.4

Q ss_pred             CCceeeccCC--CCceeeccCCC---CCCccccCCceeeeeccceeEeeccC---CcccEEeeecC-CCCCceEE
Q 015062          263 TGLCVQRKSF--LDPLTLGPCTE---SEAWSYTPHKTISLKGAYFCLQAKHV---GKPAKLGIICT-DCGSTWEI  328 (414)
Q Consensus       263 tg~c~~~~~~--~~~l~~~~c~~---~~~W~~~~~~~l~~~~~~~cl~a~~~---g~~~~~~~~c~-~~~~~W~~  328 (414)
                      +++|+++.+.  ..++.+.+|..   .++|.+.+++.|..+.+++||++.+.   |.++.+ ..|. ..+|+|++
T Consensus        51 ~~~Cl~~~~~~~~~~~~~~~c~~~~~~Q~W~~~~~~~i~~~~~~~cl~~~~~~~~~~~v~~-~~c~~~~~Q~W~~  124 (124)
T cd00161          51 SNLCLDVGGDAPGSKVRLYTCSGGSDNQRWTFNKDGTIRNLKSGKCLDVKGGNTNGTNLIL-WTCDGGPNQKWKF  124 (124)
T ss_pred             CCeEEcccCCCCCCEEEEEECCCCCcCCEEEECCCcEEEECCCCeEEeCCCCCCCCCEEEE-EeCCCCccceEeC
Confidence            8999998543  25689999987   37999998888888788999999886   565555 8898 77899974


No 14 
>PF00331 Glyco_hydro_10:  Glycosyl hydrolase family 10;  InterPro: IPR001000 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 10 GH10 from CAZY comprises enzymes with a number of known activities; xylanase (3.2.1.8 from EC); endo-1,3-beta-xylanase (3.2.1.32 from EC); cellobiohydrolase (3.2.1.91 from EC). These enzymes were formerly known as cellulase family F.  The microbial degradation of cellulose and xylans requires several types of enzymes such as endoglucanases (3.2.1.4 from EC), cellobiohydrolases (3.2.1.91 from EC) (exoglucanases), or xylanases (3.2.1.8 from EC) [, ]. Fungi and bacteria produces a spectrum of cellulolytic enzymes (cellulases) and xylanases which, on the basis of sequence similarities, can be classified into families. One of these families is known as the cellulase family F [] or as the glycosyl hydrolases family 10 []. ; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 1UQZ_A 1UQY_A 1UR2_A 1UR1_A 2CNC_A 1OD8_A 1E0W_A 1E0V_A 1V0M_A 1E0X_B ....
Probab=97.37  E-value=0.0033  Score=63.25  Aligned_cols=173  Identities=14%  Similarity=0.236  Sum_probs=105.2

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCC-----ChhhHHH-----HHHHHHHHHHhcCCCcEEEEcCccCCCc
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQ-----NVKDWYR-----YMQLGAEAVHAANPEVLVILSGLNFDKD  100 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~-----n~~dW~~-----~~~~~~~aIr~~dP~~LIiVeG~~~~~d  100 (414)
                      .+.+.+..+.|++||++...|...|+.|||.....     ....|+.     ++.++-+..|+++|+...|+  +.|+..
T Consensus       105 ~~~l~~~I~~v~~~y~~~g~i~~WDVvNE~i~~~~~~~~~r~~~~~~~lG~~yi~~aF~~A~~~~P~a~L~~--NDy~~~  182 (320)
T PF00331_consen  105 RARLENHIKTVVTRYKDKGRIYAWDVVNEAIDDDGNPGGLRDSPWYDALGPDYIADAFRAAREADPNAKLFY--NDYNIE  182 (320)
T ss_dssp             HHHHHHHHHHHHHHTTTTTTESEEEEEES-B-TTSSSSSBCTSHHHHHHTTCHHHHHHHHHHHHHTTSEEEE--EESSTT
T ss_pred             HHHHHHHHHHHHhHhccccceEEEEEeeecccCCCccccccCChhhhcccHhHHHHHHHHHHHhCCCcEEEe--cccccc
Confidence            35566778899999998777999999999987532     1135764     67889999999999999999  334321


Q ss_pred             c-----------hhhhcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCc
Q 015062          101 L-----------SFVRNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGA  169 (414)
Q Consensus       101 L-----------s~v~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~  169 (414)
                      -           ..+..+-+  +. +-+=+-.|+-...           . .+.+.+.+++    +.+.|.||.|+||-+
T Consensus       183 ~~~k~~~~~~lv~~l~~~gv--pI-dgIG~Q~H~~~~~-----------~-~~~i~~~l~~----~~~~Gl~i~ITElDv  243 (320)
T PF00331_consen  183 SPAKRDAYLNLVKDLKARGV--PI-DGIGLQSHFDAGY-----------P-PEQIWNALDR----FASLGLPIHITELDV  243 (320)
T ss_dssp             STHHHHHHHHHHHHHHHTTH--CS--EEEEEEEEETTS-----------S-HHHHHHHHHH----HHTTTSEEEEEEEEE
T ss_pred             chHHHHHHHHHHHHHHhCCC--cc-ceechhhccCCCC-----------C-HHHHHHHHHH----HHHcCCceEEEeeee
Confidence            1           11111111  22 2477888875421           1 2333333333    355799999999988


Q ss_pred             CCCCCC------ccchHHHHHHHHHHHHCC---C-cEEEeccCccccccccccCCCceeecccCCCC
Q 015062          170 DLRGNN------VNDNRYLNCFFGVAAELD---W-DWALWTLVGSYYLREGVIGLNEYYGLFDWNWC  226 (414)
Q Consensus       170 ~~~~~~------~~~~~~~~~~l~~l~e~~---i-~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~~dW~  226 (414)
                      ......      .....+++.+++.+.++.   + +.++|.+.-.+--+....  .+.-+|++.||.
T Consensus       244 ~~~~~~~~~~~~~~qA~~~~~~~~~~~~~~~~~v~git~Wg~~D~~sW~~~~~--~~~~~lfd~~~~  308 (320)
T PF00331_consen  244 RDDDNPPDAEEEEAQAEYYRDFLTACFSHPPAAVEGITWWGFTDGYSWRPDTP--PDRPLLFDEDYQ  308 (320)
T ss_dssp             ESSSTTSCHHHHHHHHHHHHHHHHHHHHTTHCTEEEEEESSSBTTGSTTGGHS--EG--SSB-TTSB
T ss_pred             cCCCCCcchHHHHHHHHHHHHHHHHHHhCCccCCCEEEEECCCCCCcccCCCC--CCCCeeECCCcC
Confidence            765432      134678888888888877   4 678887753221111111  123456666664


No 15 
>PF11790 Glyco_hydro_cc:  Glycosyl hydrolase catalytic core;  InterPro: IPR024655 This entry represents the glycosyl hydrolase catalytic core of a group of uncharacterised proteins.
Probab=97.32  E-value=0.0043  Score=59.80  Aligned_cols=143  Identities=17%  Similarity=0.196  Sum_probs=76.3

Q ss_pred             CCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCC---ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCC
Q 015062           23 FFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQ---NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDK   99 (414)
Q Consensus        23 ~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~---n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~   99 (414)
                      +|+....+    ...++.+++. +.....  +-.+|||....+   +..+-.....+..+.+|  .+...|+-..+.+.+
T Consensus        45 lwg~~~~~----~~~~~~v~~~-~~~~~~--ll~fNEPD~~~qsn~~p~~aa~~w~~~~~~~~--~~~~~l~sPa~~~~~  115 (239)
T PF11790_consen   45 LWGPGSDD----DDWLANVQNA-HPGSKH--LLGFNEPDLPGQSNMSPEEAAALWKQYMNPLR--SPGVKLGSPAVAFTN  115 (239)
T ss_pred             ccCCCCCc----hHHHHHHHhh-ccCccc--eeeecCCCCCCCCCCCHHHHHHHHHHHHhHhh--cCCcEEECCeecccC
Confidence            56655443    2335566666 333222  356899988644   23333333334444455  366666655554332


Q ss_pred             -----cchhhhc----ccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcC
Q 015062          100 -----DLSFVRN----QAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGAD  170 (414)
Q Consensus       100 -----dLs~v~~----~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~  170 (414)
                           .++.+..    -+....   ==+.++|+|...             ...+...+.+..   ...+.||+|+|||..
T Consensus       116 ~~~~~g~~Wl~~F~~~~~~~~~---~D~iavH~Y~~~-------------~~~~~~~i~~~~---~~~~kPIWITEf~~~  176 (239)
T PF11790_consen  116 GGTPGGLDWLSQFLSACARGCR---VDFIAVHWYGGD-------------ADDFKDYIDDLH---NRYGKPIWITEFGCW  176 (239)
T ss_pred             CCCCCccHHHHHHHHhcccCCC---ccEEEEecCCcC-------------HHHHHHHHHHHH---HHhCCCEEEEeeccc
Confidence                 2333322    110111   128899999311             122333333221   225799999999975


Q ss_pred             CC---CCCccchHHHHHHHHHHHHCC
Q 015062          171 LR---GNNVNDNRYLNCFFGVAAELD  193 (414)
Q Consensus       171 ~~---~~~~~~~~~~~~~l~~l~e~~  193 (414)
                      ..   ........+++.++.+|++..
T Consensus       177 ~~~~~~~~~~~~~fl~~~~~~ld~~~  202 (239)
T PF11790_consen  177 NGGSQGSDEQQASFLRQALPWLDSQP  202 (239)
T ss_pred             CCCCCCCHHHHHHHHHHHHHHHhcCC
Confidence            32   222234789999999998775


No 16 
>PF00652 Ricin_B_lectin:  Ricin-type beta-trefoil lectin domain;  InterPro: IPR000772 Ricin is a legume lectin from the seeds of the castor bean plant, Ricinus communis. The seeds are poisonous to people, animals and insects and just one milligram of ricin can kill an adult. Primary structure analysis has shown the presence of a similar domain in many carbohydrate-recognition proteins like plant and bacterial AB-toxins, glycosidases or proteases [, , ]. This domain, known as the ricin B lectin domain, can be present in one or more copies and has been shown in some instance to bind simple sugars, such as galactose or lactose. The ricin B lectin domain is composed of three homologous subdomains of 40 amino acids (alpha, beta and gamma) and a linker peptide of around 15 residues (lambda). It has been proposed that the ricin B lectin domain arose by gene triplication from a primitive 40 residue galactoside-binding peptide [, ]. The most characteristic, though not completely conserved, sequence feature is the presence of a Q-W pattern. Consequently, the ricin B lectin domain as also been refered as the (QxW)3 domain and the three homologous regions as the QxW repeats [, ]. A disulphide bond is also conserved in some of the QxW repeats []. The 3D structure of the ricin B chain has shown that the three QxW repeats pack around a pseudo threefold axis that is stabilised by the lambda linker []. The ricin B lectin domain has no major segments of a helix or beta sheet but each of the QxW repeats contains an omega loop []. An idealized omega-loop is a compact, contiguous segment of polypeptide that traces a 'loop-shaped' path in three-dimensional space; the main chain resembles a Greek omega.; PDB: 2VLC_B 3A22_B 3A21_B 3A23_B 1GGP_B 1VCL_A 2Z48_B 2Z49_A 2D7R_A 2D7I_A ....
Probab=97.26  E-value=0.00052  Score=57.52  Aligned_cols=70  Identities=24%  Similarity=0.560  Sum_probs=55.6

Q ss_pred             eeeecCCCCceeeccCCC--CceeeccCCCC---CCccccCCceeeeeccceeEeecc--CCcccEEeeecC-CCCCce
Q 015062          256 KVIYHPATGLCVQRKSFL--DPLTLGPCTES---EAWSYTPHKTISLKGAYFCLQAKH--VGKPAKLGIICT-DCGSTW  326 (414)
Q Consensus       256 ~~~~~~~tg~c~~~~~~~--~~l~~~~c~~~---~~W~~~~~~~l~~~~~~~cl~a~~--~g~~~~~~~~c~-~~~~~W  326 (414)
                      .++......+|+.+.+..  .++.+.+|...   ++|.+.+++.|.-..+++||++.+  .+.++.+ ..|. +++|+|
T Consensus        47 ~i~~~~~~~~CL~~~~~~~~~~i~l~~C~~~~~~Q~W~~~~~~~i~n~~s~~cL~~~~~~~~~~l~~-~~c~~~~~Q~W  124 (124)
T PF00652_consen   47 QIRSNNNPNLCLDVDGSSPGTKIVLWPCDSNSSNQRWKFDPDGRIRNKNSGLCLDVKGGSDGNPLVL-WPCNGSPNQQW  124 (124)
T ss_dssp             BEEETTETTEEEEESSSSTTEBEEEEETTTTGGGGBEEEETTSBEEETTTTEEEEEGGGSTTEBEEE-EE-TSSGGGBE
T ss_pred             ceeeccCcceEEEeeccCCCceEEEeeccCCccCCeEEEcCCeeEEeCCCCEEEEecCCCCCCEEEE-EECCCCccccC
Confidence            355555556699986543  46999999977   699999988888878899999999  7888888 6898 778988


No 17 
>PF14200 RicinB_lectin_2:  Ricin-type beta-trefoil lectin domain-like; PDB: 2X2S_C 2X2T_A 2VSE_B 2VSA_A 3EF2_A 2IHO_A 3HZB_H 1YBI_B 3PHZ_A 3NBE_A ....
Probab=97.18  E-value=0.00075  Score=56.29  Aligned_cols=75  Identities=13%  Similarity=0.123  Sum_probs=57.5

Q ss_pred             cceeeecCCCCceeeccCC----CCceeeccCCCC--CCccccCCc----eeeeeccceeEeeccC----CcccEEeeec
Q 015062          254 LHKVIYHPATGLCVQRKSF----LDPLTLGPCTES--EAWSYTPHK----TISLKGAYFCLQAKHV----GKPAKLGIIC  319 (414)
Q Consensus       254 ~~~~~~~~~tg~c~~~~~~----~~~l~~~~c~~~--~~W~~~~~~----~l~~~~~~~cl~a~~~----g~~~~~~~~c  319 (414)
                      .++.|....||+|+.+.+.    .+++.+++|.+.  ++|...+.+    .|.-+.+++||++.+.    |+++.+ +.|
T Consensus        15 g~Y~i~n~~sg~~L~v~~~~~~~g~~v~~~~~~~~~~Q~W~i~~~~~g~y~I~n~~s~~~Ldv~~~~~~~g~~v~~-~~~   93 (105)
T PF14200_consen   15 GYYKIRNVNSGKYLDVAGGSTANGTNVQQWTCNGNDNQQWKIEPVGDGYYRIRNKNSGKVLDVAGGSTANGTNVQQ-WEY   93 (105)
T ss_dssp             TEEEEEETTTTEEEEEGCTTCSTTEBEEEEESSSSGGGEEEEEESTTSEEEEEETSTTEEEEEGGGSSSTTEBEEE-EE-
T ss_pred             CEEEEEECCCCCEEEeCCCCcCCCcEEEEecCCCCcCcEEEEEEecCCeEEEEECCCCcEEEECCCCCCCCCEEEE-EeC
Confidence            4688888899999999542    356999999765  699997554    5777789999999875    455555 888


Q ss_pred             -C-CCCCceEEE
Q 015062          320 -T-DCGSTWEII  329 (414)
Q Consensus       320 -~-~~~~~W~~~  329 (414)
                       . +++|+|++.
T Consensus        94 ~~~~~~Q~W~l~  105 (105)
T PF14200_consen   94 DNGSDNQQWKLE  105 (105)
T ss_dssp             STSSGGGEEEEE
T ss_pred             CCCCccCEEEeC
Confidence             5 889999973


No 18 
>COG3934 Endo-beta-mannanase [Carbohydrate transport and metabolism]
Probab=97.01  E-value=0.0036  Score=65.19  Aligned_cols=187  Identities=17%  Similarity=0.071  Sum_probs=101.6

Q ss_pred             CCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCC-CC---ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC
Q 015062           23 FFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGP-KQ---NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFD   98 (414)
Q Consensus        23 ~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~-~~---n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~   98 (414)
                      +..|+.+ ...+.++-..+.+-||-+|.+.|..|.|||.-. ..   +.-+|.+.|.   .-|...||+|+|-|+-..+-
T Consensus       112 ~iyD~k~-~~~~kkyvedlVk~yk~~ptI~gw~l~Ne~lv~~p~s~N~f~~w~~emy---~yiK~ldd~hlvsvGD~~sp  187 (587)
T COG3934         112 VIYDPKF-RGPGKKYVEDLVKPYKLDPTIAGWALRNEPLVEAPISVNNFWDWSGEMY---AYIKWLDDGHLVSVGDPASP  187 (587)
T ss_pred             cccchhh-cccHHHHHHHHhhhhccChHHHHHHhcCCccccccCChhHHHHHHHHHH---HHhhccCCCCeeecCCcCCc
Confidence            3444434 455677778888899999999999999998763 12   2346666554   67899999999998655432


Q ss_pred             CcchhhhcccccccCCCcE-EEEEeecCCCCCCCccCCCCCcchhhHHHHH-HHHHHHHHhcC-CCEEEeccCcCCCCCC
Q 015062           99 KDLSFVRNQAVNLTFTGKL-VFEAHWYGFTDGQAWVDGNPNQVCGRVVDNV-MRLSGFLLEQG-WPLFVSEFGADLRGNN  175 (414)
Q Consensus        99 ~dLs~v~~~Pv~l~~~~kl-VYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~-~~~~gfl~~~g-~Pv~lGEFG~~~~~~~  175 (414)
                      -.    ...|-+..  .-+ -=++|.|...+.     .+    ..++...+ ...-......| .||++=|||....-+.
T Consensus       188 ~~----~~~pyN~r--~~vDya~~hLY~hyd~-----sl----~~r~s~~yg~~~l~i~~~~g~~pV~leefGfsta~g~  252 (587)
T COG3934         188 WP----QYAPYNAR--FYVDYAANHLYRHYDT-----SL----VSRVSTVYGKPYLDIPTIMGWQPVNLEEFGFSTAFGQ  252 (587)
T ss_pred             cc----ccCCcccc--eeeccccchhhhhccC-----Ch----hheeeeeecchhhccchhcccceeeccccCCcccccc
Confidence            11    11121110  000 114566642221     00    00000000 00001112256 8999999999876332


Q ss_pred             ccchHHHHHHHHHHHHCCCcEEEeccCccccccc-cccC----CCceeecccCCCCCCC
Q 015062          176 VNDNRYLNCFFGVAAELDWDWALWTLVGSYYLRE-GVIG----LNEYYGLFDWNWCDIR  229 (414)
Q Consensus       176 ~~~~~~~~~~l~~l~e~~i~Wa~Wa~~Gsyy~r~-g~~~----~~et~Gll~~dW~t~~  229 (414)
                      .....|+--....++-.+.|-.+|++.+- .+++ +.+.    .+..|||.+.|-...-
T Consensus       253 e~s~ayfiw~~lal~~ggdGaLiwclsdf-~~gsdd~ey~w~p~el~fgiIradgpek~  310 (587)
T COG3934         253 ENSPAYFIWIRLALDTGGDGALIWCLSDF-HLGSDDSEYTWGPMELEFGIIRADGPEKI  310 (587)
T ss_pred             cccchhhhhhhhHHhhcCCceEEEEecCC-ccCCCCCCCccccccceeeeecCCCchhh
Confidence            22223322222255556778899999752 1111 1111    2567888888865433


No 19 
>PF01229 Glyco_hydro_39:  Glycosyl hydrolases family 39;  InterPro: IPR000514 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 39 GH39 from CAZY comprises enzymes with several known activities; alpha-L-iduronidase (3.2.1.76 from EC); beta-xylosidase (3.2.1.37 from EC). The most highly conserved regions in these enzymes are located in their N-terminal sections. These contain a glutamic acid residue which, on the basis of similarities with other families of glycosyl hydrolases [], probably acts as the proton donor in their catalytic mechanism.; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 2BS9_D 2BFG_E 1W91_B 1UHV_D 1PX8_A.
Probab=96.72  E-value=0.0071  Score=64.22  Aligned_cols=201  Identities=16%  Similarity=0.272  Sum_probs=97.1

Q ss_pred             CCHHHHHHHHHHHHHHhCCC------ceEEEEeccCCCCCC--C--CChhhHHHHHHHHHHHHHhcCCCcEEEEcCc--c
Q 015062           29 FNPDLWIKGLTKMATIFNGV------RNVVGMSLRNELRGP--K--QNVKDWYRYMQLGAEAVHAANPEVLVILSGL--N   96 (414)
Q Consensus        29 ~~~d~~~~~W~~iA~ryk~~------pnViG~dL~NEP~~~--~--~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~--~   96 (414)
                      -+.++|.++.+.+++||.+.      ..- -||+.|||...  +  ....++.++.+.++++||+++|...|  +|.  .
T Consensus       129 ~~~~~W~~lv~~~~~h~~~RYG~~ev~~W-~fEiWNEPd~~~f~~~~~~~ey~~ly~~~~~~iK~~~p~~~v--GGp~~~  205 (486)
T PF01229_consen  129 KDYEKWRDLVRAFARHYIDRYGIEEVSTW-YFEIWNEPDLKDFWWDGTPEEYFELYDATARAIKAVDPELKV--GGPAFA  205 (486)
T ss_dssp             S-HHHHHHHHHHHHHHHHHHHHHHHHTTS-EEEESS-TTSTTTSGGG-HHHHHHHHHHHHHHHHHH-TTSEE--EEEEEE
T ss_pred             ccHHHHHHHHHHHHHHHHhhcCCccccce-eEEeCcCCCcccccCCCCHHHHHHHHHHHHHHHHHhCCCCcc--cCcccc
Confidence            45689999888888887531      111 38999999875  1  23467889999999999999999874  555  3


Q ss_pred             CCCc------chhhhcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhh---HHHHHHHHHHHHHh---cCCCEEE
Q 015062           97 FDKD------LSFVRNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGR---VVDNVMRLSGFLLE---QGWPLFV  164 (414)
Q Consensus        97 ~~~d------Ls~v~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~---~~~~~~~~~gfl~~---~g~Pv~l  164 (414)
                      ++..      +.....+.+.++     .+|+|.|+...... ...........   +...+......+.+   -++|+++
T Consensus       206 ~~~~~~~~~~l~~~~~~~~~~D-----fiS~H~y~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~p~~~~~~  279 (486)
T PF01229_consen  206 WAYDEWCEDFLEFCKGNNCPLD-----FISFHSYGTDSAED-INENMYERIEDSRRLFPELKETRPIINDEADPNLPLYI  279 (486)
T ss_dssp             TT-THHHHHHHHHHHHCT---S-----EEEEEEE-BESESE--SS-EEEEB--HHHHHHHHHHHHHHHHTSSSTT--EEE
T ss_pred             ccHHHHHHHHHHHHhcCCCCCC-----EEEEEecccccccc-cchhHHhhhhhHHHHHHHHHHHHHHHhhccCCCCceee
Confidence            3321      122222222221     58999997432100 00000001111   11222222233333   3578999


Q ss_pred             eccCcCCCCC-CccchHHHHH-HHH-HHHHCC--Cc-EEEeccCcccccccccc--CCCceeecccCCCCCCCchhHHHH
Q 015062          165 SEFGADLRGN-NVNDNRYLNC-FFG-VAAELD--WD-WALWTLVGSYYLREGVI--GLNEYYGLFDWNWCDIRNSSFLER  236 (414)
Q Consensus       165 GEFG~~~~~~-~~~~~~~~~~-~l~-~l~e~~--i~-Wa~Wa~~Gsyy~r~g~~--~~~et~Gll~~dW~t~~~~~~l~~  236 (414)
                      +||....... ...+..|..+ ++. .++..+  ++ ..||++.-.|.- .+.+  -.-..+||++.+  ..+.| .-.+
T Consensus       280 tE~n~~~~~~~~~~dt~~~aA~i~k~lL~~~~~~l~~~sywt~sD~Fee-~~~~~~pf~ggfGLlt~~--gI~KP-a~~A  355 (486)
T PF01229_consen  280 TEWNASISPRNPQHDTCFKAAYIAKNLLSNDGAFLDSFSYWTFSDRFEE-NGTPRKPFHGGFGLLTKL--GIPKP-AYYA  355 (486)
T ss_dssp             EEEES-SSTT-GGGGSHHHHHHHHH-HHHHGGGT-SEEEES-SBS---T-TSS-SSSSSS-S-SEECC--CEE-H-HHHH
T ss_pred             cccccccCCCcchhccccchhhHHHHHHHhhhhhhhhhhccchhhhhhc-cCCCCCceecchhhhhcc--CCCch-HHHH
Confidence            9999865432 2334444333 334 344433  44 789998543321 0111  123458999998  44443 2234


Q ss_pred             hhcccC
Q 015062          237 ISSLQS  242 (414)
Q Consensus       237 l~~l~~  242 (414)
                      +..|..
T Consensus       356 ~~~L~~  361 (486)
T PF01229_consen  356 FQLLNK  361 (486)
T ss_dssp             HHHHTT
T ss_pred             HHHHHh
Confidence            444444


No 20 
>COG3867 Arabinogalactan endo-1,4-beta-galactosidase [Carbohydrate transport and metabolism]
Probab=96.13  E-value=0.18  Score=50.07  Aligned_cols=143  Identities=15%  Similarity=0.213  Sum_probs=85.1

Q ss_pred             HHHHHHhCCC---ceEEEEeccCCCCCC----C---CChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCC--cchhh--
Q 015062           39 TKMATIFNGV---RNVVGMSLRNELRGP----K---QNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDK--DLSFV--  104 (414)
Q Consensus        39 ~~iA~ryk~~---pnViG~dL~NEP~~~----~---~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~--dLs~v--  104 (414)
                      +.+-++++++   |..+  -+=||-.+.    +   .+.+.|.+...+++.|||+++|+.+|++-=.+-.+  -.+.+  
T Consensus       159 k~~l~~m~~eGi~pdmV--QVGNEtn~gflwp~Ge~~~f~k~a~L~n~g~~avrev~p~ikv~lHla~g~~n~~y~~~fd  236 (403)
T COG3867         159 KYVLTTMKKEGILPDMV--QVGNETNGGFLWPDGEGRNFDKMAALLNAGIRAVREVSPTIKVALHLAEGENNSLYRWIFD  236 (403)
T ss_pred             HHHHHHHHHcCCCccce--EeccccCCceeccCCCCcChHHHHHHHHHHhhhhhhcCCCceEEEEecCCCCCchhhHHHH
Confidence            3444555543   3332  566887664    1   25677888899999999999999999884332221  12222  


Q ss_pred             --hcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcCCC---CC-----
Q 015062          105 --RNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGADLR---GN-----  174 (414)
Q Consensus       105 --~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~~~---~~-----  174 (414)
                        ..+-++     --|+..-+|.+-++          .-.++...+.+..   .+++.-|+|-|-+..++   +.     
T Consensus       237 ~ltk~nvd-----fDVig~SyYpyWhg----------tl~nL~~nl~dia---~rY~K~VmV~Etay~yTlEdgDg~~Nt  298 (403)
T COG3867         237 ELTKRNVD-----FDVIGSSYYPYWHG----------TLNNLTTNLNDIA---SRYHKDVMVVETAYTYTLEDGDGHENT  298 (403)
T ss_pred             HHHHcCCC-----ceEEeeeccccccC----------cHHHHHhHHHHHH---HHhcCeEEEEEecceeeeccCCCCCCc
Confidence              222222     34888888876542          2334444444431   23678889988876322   10     


Q ss_pred             ---------C----ccchHHHHHHHHHHH----HCCCcEEEecc
Q 015062          175 ---------N----VNDNRYLNCFFGVAA----ELDWDWALWTL  201 (414)
Q Consensus       175 ---------~----~~~~~~~~~~l~~l~----e~~i~Wa~Wa~  201 (414)
                               .    +.+..+++++++...    .+|+|-+||.-
T Consensus       299 ~~~~~~t~~ypitVQGQat~vrDvie~V~nvp~~~GlGvFYWEp  342 (403)
T COG3867         299 FPSSEQTGGYPITVQGQATFVRDVIEAVKNVPKSNGLGVFYWEP  342 (403)
T ss_pred             CCcccccCCCceEEechhhHHHHHHHHHHhCCCCCceEEEEecc
Confidence                     0    124566777777775    47899999953


No 21 
>PRK09525 lacZ beta-D-galactosidase; Reviewed
Probab=95.63  E-value=0.13  Score=59.51  Aligned_cols=57  Identities=16%  Similarity=0.028  Sum_probs=47.0

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      .+.+.+-++.|.+|.+++|.|+...|-||+...        ....++.+.+|+.||.++|..+|.
T Consensus       434 ~~~~~~~~~~mV~RdrNHPSIi~WSlgNE~~~g--------~~~~~l~~~~k~~DptRpV~y~~~  490 (1027)
T PRK09525        434 LPAMSERVTRMVQRDRNHPSIIIWSLGNESGHG--------ANHDALYRWIKSNDPSRPVQYEGG  490 (1027)
T ss_pred             HHHHHHHHHHHHHhCCCCCEEEEEeCccCCCcC--------hhHHHHHHHHHhhCCCCcEEECCC
Confidence            456777788999999999999999999998542        123566778999999999999974


No 22 
>KOG3736 consensus Polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=95.26  E-value=0.056  Score=58.35  Aligned_cols=103  Identities=23%  Similarity=0.507  Sum_probs=74.1

Q ss_pred             cCCCCceeeccC--C--CCceeeccCCCC---CCccccCCceeeeeccceeEeeccCCcccEEeeecC-CCCCceEEEec
Q 015062          260 HPATGLCVQRKS--F--LDPLTLGPCTES---EAWSYTPHKTISLKGAYFCLQAKHVGKPAKLGIICT-DCGSTWEIISD  331 (414)
Q Consensus       260 ~~~tg~c~~~~~--~--~~~l~~~~c~~~---~~W~~~~~~~l~~~~~~~cl~a~~~g~~~~~~~~c~-~~~~~W~~~s~  331 (414)
                      ...|++|++...  .  ..++.+.+|.+.   |-|+||.+++|+.  ...|++....|. +.+ ..|. ..+|.|..-.+
T Consensus       460 ~~~~~~cld~~~~~~~~~~~~~~~~Ch~~~~~Q~~~yT~~~eir~--~~~cl~~~~~~~-v~l-~~C~~~~~q~w~~~~~  535 (578)
T KOG3736|consen  460 NGNPNLCLDTERAPAGQGMAVGLYPCHGPGGNQYFPYTKQGEIRI--GDLCLDVDDAGK-VTL-YDCHKMGNQLWHYDKD  535 (578)
T ss_pred             cCCcchhhhhhchhccCCCcceEecCCCccccccccccCCcceEE--CCEEeccccCCc-eEE-EecccccccceEEcCC
Confidence            377899998844  1  246889999875   6999999999986  449998765555 666 8997 33899999888


Q ss_pred             CccEEeeecCCCceeEEEecCCC-ceeeeeeeEeCCCCCCCccCceE
Q 015062          332 SKMHLSSKADNGTTVCLDVDSSN-TIVTNTCKCLSRDKTCDPASQWF  377 (414)
Q Consensus       332 s~~~~~~~~~~~~~lcld~~~~~-~ivt~~c~c~~~~~~c~p~~qwf  377 (414)
                      +.  |   -+.+++.||++..+. .++-..|.|-      +|..||.
T Consensus       536 ~~--i---~~~~sg~CL~~~~~~~~~~l~~c~~~------~~~Q~W~  571 (578)
T KOG3736|consen  536 GT--L---YHRNSGKCLEAAVDKNGLILVACDPS------DPTQQWL  571 (578)
T ss_pred             Cc--e---EcCCCCccccccCCCCCceEeecCCC------CCcceEE
Confidence            44  2   233688999999643 2444777664      4567884


No 23 
>PRK10340 ebgA cryptic beta-D-galactosidase subunit alpha; Reviewed
Probab=94.97  E-value=0.3  Score=56.66  Aligned_cols=55  Identities=15%  Similarity=0.091  Sum_probs=45.5

Q ss_pred             HHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcC
Q 015062           32 DLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSG   94 (414)
Q Consensus        32 d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG   94 (414)
                      +.+.+-.+.|.+|++++|.|+...|-||....        ..++++++.||+.||.++|..+|
T Consensus       422 ~~~~~~~~~mV~RdrNHPSIi~WslGNE~~~g--------~~~~~~~~~~k~~DptR~v~~~~  476 (1021)
T PRK10340        422 KVYVDRIVRHIHAQKNHPSIIIWSLGNESGYG--------CNIRAMYHAAKALDDTRLVHYEE  476 (1021)
T ss_pred             HHHHHHHHHHHHhCCCCCEEEEEECccCcccc--------HHHHHHHHHHHHhCCCceEEeCC
Confidence            45566678899999999999999999998432        12357788999999999999887


No 24 
>PF14587 Glyco_hydr_30_2:  O-Glycosyl hydrolase family 30; PDB: 3CLW_B.
Probab=94.08  E-value=1  Score=46.48  Aligned_cols=169  Identities=13%  Similarity=0.121  Sum_probs=76.1

Q ss_pred             HHHHHHHHHHHHHHhCCCc-eEEEEeccCCCCCCC----C-----ChhhHHHHHHHHHHHHHhcCCCcEEEE-cCccCCC
Q 015062           31 PDLWIKGLTKMATIFNGVR-NVVGMSLRNELRGPK----Q-----NVKDWYRYMQLGAEAVHAANPEVLVIL-SGLNFDK   99 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~p-nViG~dL~NEP~~~~----~-----n~~dW~~~~~~~~~aIr~~dP~~LIiV-eG~~~~~   99 (414)
                      .++|+.++..++++|+..- +|--++.+|||.-.+    +     +..+-.+.+..+..++++...+..|.+ |...|..
T Consensus       153 y~~FA~YLa~Vv~~~~~~GI~f~~IsP~NEP~~~W~~~~QEG~~~~~~e~a~vI~~L~~~L~~~GL~t~I~~~Ea~~~~~  232 (384)
T PF14587_consen  153 YDAFADYLADVVKHYKKWGINFDYISPFNEPQWNWAGGSQEGCHFTNEEQADVIRALDKALKKRGLSTKISACEAGDWEY  232 (384)
T ss_dssp             HHHHHHHHHHHHHHHHCTT--EEEEE--S-TTS-GG--SS-B----HHHHHHHHHHHHHHHHHHT-S-EEEEEEESSGGG
T ss_pred             HHHHHHHHHHHHHHHHhcCCccceeCCcCCCCCCCCCCCcCCCCCCHHHHHHHHHHHHHHHHhcCCCceEEecchhhHHH
Confidence            5899999999999995532 466689999997653    1     234556777888888999999877666 3333311


Q ss_pred             -------------cchhh-hcc-ccccc-CCC-cEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhc--CC
Q 015062          100 -------------DLSFV-RNQ-AVNLT-FTG-KLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQ--GW  160 (414)
Q Consensus       100 -------------dLs~v-~~~-Pv~l~-~~~-klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~--g~  160 (414)
                                   .+..+ ..+ +..+. ..+ .-+.+.|-|-...           ..+.+...-......+.+.  ++
T Consensus       233 l~~~~~~~~~r~~~i~~ff~~~s~~yi~~l~~v~~~i~~HsYwt~~-----------~~~~l~~~R~~~~~~~~~~~~~~  301 (384)
T PF14587_consen  233 LYKTDKNDWGRGNQIEAFFNPDSSTYIGDLPNVPNIISGHSYWTDS-----------PWDDLRDIRKQLADKLDKYSPGL  301 (384)
T ss_dssp             GS---S-TTS---HHHHHHSTTSTT--TT-TTEEEEEEE--TT-SS-----------SHHHHHHHHHHHHHHHHTTSS--
T ss_pred             HhhccCCchhhhhhHHhhcCCCchhhhhccccchhheeecccccCC-----------CHHHHHHHHHHHHHHHHhhCcCC
Confidence                         11111 000 11110 111 2367889884221           1122333222233344446  89


Q ss_pred             CEEEeccCcCCCCC------CccchHHHHHHHHHH--------HHCCCcEEEeccCcccccccc
Q 015062          161 PLFVSEFGADLRGN------NVNDNRYLNCFFGVA--------AELDWDWALWTLVGSYYLREG  210 (414)
Q Consensus       161 Pv~lGEFG~~~~~~------~~~~~~~~~~~l~~l--------~e~~i~Wa~Wa~~Gsyy~r~g  210 (414)
                      .++.+||...-+..      .......|++-|-++        ..+--+|.||..-+.|-+++|
T Consensus       302 ~~wqtE~~il~~~~~~~~~~g~~~~~~m~~aLy~arviH~DL~~anassW~wW~a~~~~~ykdg  365 (384)
T PF14587_consen  302 KYWQTEYCILGDNYEIIEGGGYDRDLGMDTALYVARVIHNDLTYANASSWQWWTAISPYDYKDG  365 (384)
T ss_dssp             EEEE----S----TTT-SSS-HHHHHHH--HHHHHHHHHHHHHTS--SEEEEEESEESS--SSS
T ss_pred             ceeeeeeeeccCCcccccCCCcccchhHHHHHHHHHHHHhhhhhcccchhHHHHHhccccccCc
Confidence            99999998754421      111123344333322        234457999987655544554


No 25 
>PF03198 Glyco_hydro_72:  Glucanosyltransferase;  InterPro: IPR004886 This family is a group of yeast glycolipid proteins anchored to the membrane. It includes Candida albicans (Yeast) pH-regulated protein, which is required for apical growth and plays a role in morphogenesis and Saccharomyces cerevisiae glycolipid anchored surface protein.; PDB: 2W61_A 2W62_A 2W63_A.
Probab=92.49  E-value=1.1  Score=44.96  Aligned_cols=152  Identities=15%  Similarity=0.145  Sum_probs=63.7

Q ss_pred             CEEEecCCCCCCcccCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCC--ChhhHHHHHHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDGNGFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQ--NVKDWYRYMQLGA   78 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dgn~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~--n~~dW~~~~~~~~   78 (414)
                      |||||+-...    ++-+..+.+   ..++. .+.+-...+...|++++|++||-.=||-.....  ......+++.|-.
T Consensus        94 Yvi~Dl~~p~----~sI~r~~P~---~sw~~-~l~~~~~~vid~fa~Y~N~LgFf~GNEVin~~~~t~aap~vKAavRD~  165 (314)
T PF03198_consen   94 YVILDLNTPN----GSINRSDPA---PSWNT-DLLDRYFAVIDAFAKYDNTLGFFAGNEVINDASNTNAAPYVKAAVRDM  165 (314)
T ss_dssp             EEEEES-BTT----BS--TTS---------H-HHHHHHHHHHHHHTT-TTEEEEEEEESSS-STT-GGGHHHHHHHHHHH
T ss_pred             EEEEecCCCC----ccccCCCCc---CCCCH-HHHHHHHHHHHHhccCCceEEEEecceeecCCCCcccHHHHHHHHHHH
Confidence            7999998552    222222210   13433 556667788999999999999999999765321  2344555555555


Q ss_pred             HH-HHhcCCCcEEEEc--CccCCCcchhhhcccccccC--CCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHH
Q 015062           79 EA-VHAANPEVLVILS--GLNFDKDLSFVRNQAVNLTF--TGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSG  153 (414)
Q Consensus        79 ~a-Ir~~dP~~LIiVe--G~~~~~dLs~v~~~Pv~l~~--~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~g  153 (414)
                      ++ |++...+. |-|+  ...- .+++.....=+.-..  ..--.|.+-.|.+=+..        +.-   ...+.+...
T Consensus       166 K~Yi~~~~~R~-IPVGYsaaD~-~~~r~~~a~Yl~Cg~~~~~iDf~g~N~Y~WCg~S--------tf~---~SGy~~l~~  232 (314)
T PF03198_consen  166 KAYIKSKGYRS-IPVGYSAADD-AEIRQDLANYLNCGDDDERIDFFGLNSYEWCGDS--------TFE---TSGYDRLTK  232 (314)
T ss_dssp             HHHHHHSSS-----EEEEE----TTTHHHHHHHTTBTT-----S-EEEEE----SS----------HH---HHSHHHHHH
T ss_pred             HHHHHhcCCCC-CceeEEccCC-hhHHHHHHHHhcCCCcccccceeeeccceecCCC--------ccc---cccHHHHHH
Confidence            55 55555433 4443  2111 111111000000000  11125666666543211        100   112333322


Q ss_pred             HHHhcCCCEEEeccCcCCCC
Q 015062          154 FLLEQGWPLFVSEFGADLRG  173 (414)
Q Consensus       154 fl~~~g~Pv~lGEFG~~~~~  173 (414)
                      .+....+|+|++|||.....
T Consensus       233 ~f~~y~vPvffSEyGCn~~~  252 (314)
T PF03198_consen  233 EFSNYSVPVFFSEYGCNTVT  252 (314)
T ss_dssp             HHTT-SS-EEEEEE---SSS
T ss_pred             HhhCCCCCeEEcccCCCCCC
Confidence            33346899999999998653


No 26 
>PF13204 DUF4038:  Protein of unknown function (DUF4038); PDB: 3KZS_D.
Probab=91.99  E-value=0.51  Score=46.82  Aligned_cols=65  Identities=14%  Similarity=0.202  Sum_probs=45.5

Q ss_pred             CCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           27 QYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        27 ~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      ..+++|...+..+.|++||+..|||| ..|-||=........+|.    ++++.|++.+|..|+.+=...
T Consensus       124 ~~m~~e~~~~Y~~yv~~Ry~~~~Nvi-W~l~gd~~~~~~~~~~w~----~~~~~i~~~dp~~L~T~H~~~  188 (289)
T PF13204_consen  124 NIMPPENAERYGRYVVARYGAYPNVI-WILGGDYFDTEKTRADWD----AMARGIKENDPYQLITIHPCG  188 (289)
T ss_dssp             TSS-HHHHHHHHHHHHHHHTT-SSEE-EEEESSS--TTSSHHHHH----HHHHHHHHH--SS-EEEEE-B
T ss_pred             cCCCHHHHHHHHHHHHHHHhcCCCCE-EEecCccCCCCcCHHHHH----HHHHHHHhhCCCCcEEEeCCC
Confidence            56889999999999999999999998 889999811112445565    456699999998888774443


No 27 
>KOG3738 consensus Predicted polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=91.65  E-value=0.13  Score=53.00  Aligned_cols=92  Identities=24%  Similarity=0.523  Sum_probs=60.8

Q ss_pred             CceeeccC-CC-CceeeccCCCC---CCccc--cCCceeeeeccceeEeecc--CCcccEEeeecCCCCCceEEEecCcc
Q 015062          264 GLCVQRKS-FL-DPLTLGPCTES---EAWSY--TPHKTISLKGAYFCLQAKH--VGKPAKLGIICTDCGSTWEIISDSKM  334 (414)
Q Consensus       264 g~c~~~~~-~~-~~l~~~~c~~~---~~W~~--~~~~~l~~~~~~~cl~a~~--~g~~~~~~~~c~~~~~~W~~~s~s~~  334 (414)
                      -+|++..+ +. +.+.++.|-++   ++|.+  +....+  ....+||.+..  .|+|++| .-|.....+|+.+-.+. 
T Consensus       441 ~~Cl~s~~~~~~~~~gl~~C~~s~~nqqwa~~~t~~~~~--~~~elCL~v~~~~pg~~v~l-~~C~~~e~~q~~v~~~~-  516 (559)
T KOG3738|consen  441 DNCLDSQGQNSQEALGLASCHGSGGNQQWAFLRTSTQLI--THRELCLAVGSNTPGSPVAL-VPCGNNETKQRWVELGG-  516 (559)
T ss_pred             chhhhhhhcccccCcceeecccCCCCcchhhhhhhhhHH--HHHhhhheeecCCCCCeEEE-EecCCCCCceEEEecCC-
Confidence            35888733 22 33789999877   79999  443322  36789999887  4899999 78984444555554443 


Q ss_pred             EEeeecCCCceeEEEecCCC--ceeeeeee
Q 015062          335 HLSSKADNGTTVCLDVDSSN--TIVTNTCK  362 (414)
Q Consensus       335 ~~~~~~~~~~~lcld~~~~~--~ivt~~c~  362 (414)
                      |+   ...++.||||...-|  -|.-+.|.
T Consensus       517 ~l---~h~~s~KOGd~~~~g~~~l~~~~C~  543 (559)
T KOG3738|consen  517 HL---LHAGSHLCLDNPLKGRWLLEVSTCE  543 (559)
T ss_pred             ch---hcccccceeccccCCCcceeecccc
Confidence            32   344899999998544  35555554


No 28 
>COG5309 Exo-beta-1,3-glucanase [Carbohydrate transport and metabolism]
Probab=90.70  E-value=5.2  Score=39.45  Aligned_cols=146  Identities=16%  Similarity=0.204  Sum_probs=80.0

Q ss_pred             HHHHHh---CCCceEEEEeccCCCCCC-CCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcchhhhcccccccCCC
Q 015062           40 KMATIF---NGVRNVVGMSLRNELRGP-KQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLSFVRNQAVNLTFTG  115 (414)
Q Consensus        40 ~iA~ry---k~~pnViG~dL~NEP~~~-~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~v~~~Pv~l~~~~  115 (414)
                      +++..|   .+.+.|..+-+=||.--. .....+.-.++.+.-.++.+++-+.-|.- --.|.    .+..+|.-....+
T Consensus       120 til~ay~~~~~~d~v~~v~VGnEal~r~~~tasql~~~I~~vrsav~~agy~gpV~T-~dsw~----~~~~np~l~~~SD  194 (305)
T COG5309         120 TILSAYLPYNGWDDVTTVTVGNEALNRNDLTASQLIEYIDDVRSAVKEAGYDGPVTT-VDSWN----VVINNPELCQASD  194 (305)
T ss_pred             HHHHHHhccCCCCceEEEEechhhhhcCCCCHHHHHHHHHHHHHHHHhcCCCCceee-cccce----eeeCChHHhhhhh
Confidence            555555   557889999999996433 33567788888877777776654443211 00110    1111232112234


Q ss_pred             cEEEEEeecCCCCCCCccCCCCCcchhhHH-HHHHHHHHHHHhcCCCEEEeccCcCCCCCCc--------cchHHHHHHH
Q 015062          116 KLVFEAHWYGFTDGQAWVDGNPNQVCGRVV-DNVMRLSGFLLEQGWPLFVSEFGADLRGNNV--------NDNRYLNCFF  186 (414)
Q Consensus       116 klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~-~~~~~~~gfl~~~g~Pv~lGEFG~~~~~~~~--------~~~~~~~~~l  186 (414)
                      -++--+|.|       |..++....-..+. ..+++-.. +...+.+++|||-|.+.+|+..        +...+++.++
T Consensus       195 fia~N~~aY-------wd~~~~a~~~~~f~~~q~e~vqs-a~g~~k~~~v~EtGWPS~G~~~G~a~pS~anq~~~~~~i~  266 (305)
T COG5309         195 FIAANAHAY-------WDGQTVANAAGTFLLEQLERVQS-ACGTKKTVWVTETGWPSDGRTYGSAVPSVANQKIAVQEIL  266 (305)
T ss_pred             hhhcccchh-------ccccchhhhhhHHHHHHHHHHHH-hcCCCccEEEeeccCCCCCCccCCcCCChhHHHHHHHHHH
Confidence            455556666       22221111111111 11222110 0113489999999999876432        2467889999


Q ss_pred             HHHHHCCCcEEE
Q 015062          187 GVAAELDWDWAL  198 (414)
Q Consensus       187 ~~l~e~~i~Wa~  198 (414)
                      .-|++.|++-++
T Consensus       267 ~~~~~~G~d~fv  278 (305)
T COG5309         267 NALRSCGYDVFV  278 (305)
T ss_pred             hhhhccCccEEE
Confidence            999999998654


No 29 
>KOG3736 consensus Polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=87.28  E-value=0.87  Score=49.38  Aligned_cols=64  Identities=23%  Similarity=0.429  Sum_probs=48.7

Q ss_pred             ceeeccCCCCceeeccC--CCCCCccccCCceeeeeccceeEeeccCCcccEEeeecC--CCCCceEEEe
Q 015062          265 LCVQRKSFLDPLTLGPC--TESEAWSYTPHKTISLKGAYFCLQAKHVGKPAKLGIICT--DCGSTWEIIS  330 (414)
Q Consensus       265 ~c~~~~~~~~~l~~~~c--~~~~~W~~~~~~~l~~~~~~~cl~a~~~g~~~~~~~~c~--~~~~~W~~~s  330 (414)
                      .|..+..... +.+.+|  .+++.|.|..++.|.-+.+++||++...+..+.+ ..|.  ++.|+|.+..
T Consensus       507 ~cl~~~~~~~-v~l~~C~~~~~q~w~~~~~~~i~~~~sg~CL~~~~~~~~~~l-~~c~~~~~~Q~W~~~~  574 (578)
T KOG3736|consen  507 LCLDVDDAGK-VTLYDCHKMGNQLWHYDKDGTLYHRNSGKCLEAAVDKNGLIL-VACDPSDPTQQWLFEH  574 (578)
T ss_pred             EEeccccCCc-eEEEecccccccceEEcCCCceEcCCCCccccccCCCCCceE-eecCCCCCcceEEEEe
Confidence            6777632213 889999  5567999998898888899999999998766555 5555  5589999864


No 30 
>COG3693 XynA Beta-1,4-xylanase [Carbohydrate transport and metabolism]
Probab=85.26  E-value=2.8  Score=42.32  Aligned_cols=59  Identities=17%  Similarity=0.411  Sum_probs=44.6

Q ss_pred             HHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCC--ChhhHHH------HHHHHHHHHHhcCCCcEEEE
Q 015062           32 DLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQ--NVKDWYR------YMQLGAEAVHAANPEVLVIL   92 (414)
Q Consensus        32 d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~--n~~dW~~------~~~~~~~aIr~~dP~~LIiV   92 (414)
                      +...+....+..|||+.  |+.-|+.|||.....  -.+.|+.      +++.+-..-|+++|+...++
T Consensus       125 ~~~e~hI~tV~~rYkg~--~~sWDVVNE~vdd~g~~R~s~w~~~~~gpd~I~~aF~~AreadP~AkL~~  191 (345)
T COG3693         125 KMVEEHIKTVVGRYKGS--VASWDVVNEAVDDQGSLRRSAWYDGGTGPDYIKLAFHIAREADPDAKLVI  191 (345)
T ss_pred             HHHHHHHHHHHHhccCc--eeEEEecccccCCCchhhhhhhhccCCccHHHHHHHHHHHhhCCCceEEe
Confidence            45555677899999998  788999999977321  1245664      66777777899999988887


No 31 
>TIGR03356 BGL beta-galactosidase.
Probab=84.58  E-value=3.9  Score=42.91  Aligned_cols=82  Identities=13%  Similarity=0.080  Sum_probs=52.2

Q ss_pred             EEEecCC-CCCCcccCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCC-------------CCh
Q 015062            2 VILDNHI-SKPGWCCSNSDGNGFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPK-------------QNV   67 (414)
Q Consensus         2 VILD~H~-~~p~wcc~~~dgn~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~-------------~n~   67 (414)
                      +|+++|- .-|.|--   +.+||.. +.+ .+.|++.++.+++||++....  ..++|||....             .+.
T Consensus       110 pivtL~Hfd~P~~l~---~~gGw~~-~~~-~~~f~~ya~~~~~~~~d~v~~--w~t~NEp~~~~~~~y~~G~~~P~~~~~  182 (427)
T TIGR03356       110 PFVTLYHWDLPQALE---DRGGWLN-RDT-AEWFAEYAAVVAERLGDRVKH--WITLNEPWCSAFLGYGLGVHAPGLRDL  182 (427)
T ss_pred             eEEeeccCCccHHHH---hcCCCCC-hHH-HHHHHHHHHHHHHHhCCcCCE--EEEecCcceecccchhhccCCCCCccH
Confidence            5777753 3354421   1244444 434 699999999999999996443  48999996320             011


Q ss_pred             -------hhHHHHHHHHHHHHHhcCCCcEE
Q 015062           68 -------KDWYRYMQLGAEAVHAANPEVLV   90 (414)
Q Consensus        68 -------~dW~~~~~~~~~aIr~~dP~~LI   90 (414)
                             ..-..+.-++++++|+..|+..|
T Consensus       183 ~~~~~~~hnll~Aha~A~~~~~~~~~~~~I  212 (427)
T TIGR03356       183 RAALQAAHHLLLAHGLAVQALRANGPGAQV  212 (427)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHhCCCCeE
Confidence                   12234557788999999997443


No 32 
>PF02449 Glyco_hydro_42:  Beta-galactosidase;  InterPro: IPR013529 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. This group of beta-galactosidase enzymes (3.2.1.23 from EC) belong to the glycosyl hydrolase 42 family GH42 from CAZY. The enzyme catalyses the hydrolysis of terminal, non-reducing terminal beta-D-galactosidase residues.; GO: 0004565 beta-galactosidase activity, 0005975 carbohydrate metabolic process, 0009341 beta-galactosidase complex; PDB: 1KWK_A 1KWG_A 3U7V_A.
Probab=84.26  E-value=1.3  Score=45.25  Aligned_cols=32  Identities=16%  Similarity=0.163  Sum_probs=28.8

Q ss_pred             HHHHHHHHHHHHHHhCCCceEEEEeccCCCCC
Q 015062           31 PDLWIKGLTKMATIFNGVRNVVGMSLRNELRG   62 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~   62 (414)
                      .+.+.++.+.||+||+++|+|+++.+-|||..
T Consensus       109 r~~~~~~~~~l~~~y~~~p~vi~~~i~NE~~~  140 (374)
T PF02449_consen  109 REYARRFIRALAERYGDHPAVIGWQIDNEPGY  140 (374)
T ss_dssp             HHHHHHHHHHHHHHHTTTTTEEEEEECCSTTC
T ss_pred             HHHHHHHHHHHHhhccccceEEEEEeccccCc
Confidence            46677889999999999999999999999966


No 33 
>KOG2233 consensus Alpha-N-acetylglucosaminidase [Intracellular trafficking, secretion, and vesicular transport]
Probab=81.84  E-value=4  Score=43.29  Aligned_cols=86  Identities=19%  Similarity=0.182  Sum_probs=61.9

Q ss_pred             CCcccCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEE
Q 015062           11 PGWCCSNSDGNGFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLV   90 (414)
Q Consensus        11 p~wcc~~~dgn~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LI   90 (414)
                      ..|||.--- +  =.|+-| ++-=-.+++.+.+.|++..|+.+.|.+||--.+...++--...+.++.++++++|++.+-
T Consensus       203 s~~~C~l~v-~--P~dplF-~eIgs~Flr~~~kefG~~tniy~~DpFNE~~Pp~sepey~~staaAiyesm~kvdknaVW  278 (666)
T KOG2233|consen  203 SRYSCMLLV-S--PFDPLF-QEIGSTFLRHQIKEFGGVTNIYSADPFNEILPPESEPEYVKSTAAAIYESMKKVDKNAVW  278 (666)
T ss_pred             cceeeeEEc-c--CCcchH-HHHHHHHHHHHHHHhCCcccccccCcccccCCCCCChHHHHHHHHHHHHHHhccCcceEE
Confidence            578886321 1  012334 455566789999999999999999999997766444444455667777889999999999


Q ss_pred             EEcCccCCCc
Q 015062           91 ILSGLNFDKD  100 (414)
Q Consensus        91 iVeG~~~~~d  100 (414)
                      ++.|=.+..|
T Consensus       279 llQgWlF~~d  288 (666)
T KOG2233|consen  279 LLQGWLFTYD  288 (666)
T ss_pred             eeecceeecC
Confidence            9988665443


No 34 
>PF03662 Glyco_hydro_79n:  Glycosyl hydrolase family 79, N-terminal domain ;  InterPro: IPR005199 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. This is a family of endo-beta-N-glucuronidase, or heparanase belonging to glycoside hydrolase family 79 (GH79 from CAZY). Heparan sulphate proteoglycans (HSPGs) play a key role in the self- assembly, insolubility and barrier properties of basement membranes and extracellular matrices. Hence, cleavage of heparan sulphate (HS) affects the integrity and functional state of tissues and thereby fundamental normal and pathological phenomena involving cell migration and response to changes in the extracellular microenvironment. Heparanase degrades HS at specific intrachain sites. The enzyme is synthesized as a latent approximately 65 kDa protein that is processed at the N terminus into a highly active approximately 50 kDa form. Experimental evidence suggests that heparanase may facilitate both tumor cell invasion and neovascularization, both critical steps in cancer progression. The enzyme is also involved in cell migration associated with inflammation and autoimmunity [].; GO: 0016798 hydrolase activity, acting on glycosyl bonds, 0016020 membrane; PDB: 3VNY_A 3VO0_A 3VNZ_A.
Probab=80.74  E-value=1.5  Score=44.35  Aligned_cols=133  Identities=21%  Similarity=0.297  Sum_probs=45.2

Q ss_pred             eEEEEeccCCCCCCC----CChhhHHHHH---HHHHHHHHh-cCCCcEEEEcCccCCCc-ch-hhhcccccccCCCcEEE
Q 015062           50 NVVGMSLRNELRGPK----QNVKDWYRYM---QLGAEAVHA-ANPEVLVILSGLNFDKD-LS-FVRNQAVNLTFTGKLVF  119 (414)
Q Consensus        50 nViG~dL~NEP~~~~----~n~~dW~~~~---~~~~~aIr~-~dP~~LIiVeG~~~~~d-Ls-~v~~~Pv~l~~~~klVY  119 (414)
                      +|.+.||-|||.+..    .+..+..+-.   +++++.|.+ +-+.-+|+-.|..++.+ ++ ++....-.  .  ==+.
T Consensus       165 ~I~~WELGNEl~g~g~~~~v~a~qyakD~~~Lr~il~~iy~~~~~~P~v~gP~~~~d~~w~~~FL~~~g~~--~--vD~v  240 (319)
T PF03662_consen  165 NIDSWELGNELNGSGVGASVSAEQYAKDFIQLRKILNEIYKNALPGPLVVGPGGFFDADWLKEFLKASGPG--V--VDAV  240 (319)
T ss_dssp             GG--------HHHHSSSTT--HHHHHHHH---HHHHHHHHHH-TT---EEEEEESS-GGGHHHHHHHTTTT------SEE
T ss_pred             CccccccccccCCCCCCCccCHHHHHHHHHHHHHHHHHHHhcCCCCCeEECCCCCCCHHHHHHHHHhcCCC--c--cCEE
Confidence            466899999997742    1333333322   233344433 23444555555444433 22 22221000  0  1278


Q ss_pred             EEeecCCCCCCCccC---CCCCcchhhHHHHHHHHHHHHHh--cCCCEEEeccCcCCCC-CCccchHHHHHHH
Q 015062          120 EAHWYGFTDGQAWVD---GNPNQVCGRVVDNVMRLSGFLLE--QGWPLFVSEFGADLRG-NNVNDNRYLNCFF  186 (414)
Q Consensus       120 s~H~Y~p~~~~~W~~---~~~~~~~~~~~~~~~~~~gfl~~--~g~Pv~lGEFG~~~~~-~~~~~~~~~~~~l  186 (414)
                      +.|.|.......-..   .-....-+.+...+......+.+  .+.|++|||-|..+.+ .+....+|+..++
T Consensus       241 T~H~Y~lg~g~d~~l~~~~l~p~~Ld~~~~~~~~~~~~v~~~~p~~~~WlGEtg~Ay~gG~~~vSdtFv~~Fw  313 (319)
T PF03662_consen  241 TWHHYNLGSGRDPALIEDFLNPSYLDTLADTFQKLQQVVQEYGPGKPVWLGETGSAYNGGAPGVSDTFVAGFW  313 (319)
T ss_dssp             EEEEEEE--TT-TT-HHHHTS--HHHHHHHHHHHHH-----HHH---EEEEEEEEESTT--TTTTTSTHHHHH
T ss_pred             EEEecCCCCCchHHHHHHhcChhhhhHHHHHHHHHhhhhcccCCCCCeEEeCcccccCCCCCCccHHHHHHHH
Confidence            999995321100000   00001111222222222222222  5789999999998754 3333456666653


No 35 
>PF03498 CDtoxinA:  Cytolethal distending toxin A/C family;  InterPro: IPR003558 Escherichia coli, Haemophilus spp and Campylobacter spp. all produce a toxin that is seen to cause distension in certain cell lines [, ], which eventually disintegrate and die. This novel toxin, termed cytolethal distending toxin (cdt), has three subunits: A, B and C. Their sizes are approx. 27.7, 29.5 and 19.9kDa respectively [], and they appear to be entirely novel [].  Further research on the complete toxin has revealed that it blocks the cell cycle at stage G2, through inactivation of the cyclin-dependent kinase Cdk1, and without induction of DNA breaks. This leads to multipolar abortive mitosis and micronucleation, associated with centrosomal amplification []. The roles of each subunit are unclear, but it is believed that they have separate roles in pathogenicity. This entry represents the A and C subunits.; GO: 0009405 pathogenesis; PDB: 2F2F_A 1SR4_C.
Probab=79.07  E-value=2.9  Score=37.72  Aligned_cols=74  Identities=22%  Similarity=0.345  Sum_probs=40.7

Q ss_pred             eccceeEeeccCCcccEEeeecCCCC--CceEEEecC--ccEEeeecCCCceeEEEecCCC------ceeeeeeeEeCCC
Q 015062          298 KGAYFCLQAKHVGKPAKLGIICTDCG--STWEIISDS--KMHLSSKADNGTTVCLDVDSSN------TIVTNTCKCLSRD  367 (414)
Q Consensus       298 ~~~~~cl~a~~~g~~~~~~~~c~~~~--~~W~~~s~s--~~~~~~~~~~~~~lcld~~~~~------~ivt~~c~c~~~~  367 (414)
                      ..++.||.+.+.|.-..-  .|...+  |.|+++--+  .+.|.+   .++..||-...++      .|-...|   ...
T Consensus        59 ~~~~~CL~~~~~G~~~~~--~C~~~~~~q~F~iiPtttgAVQIks---~~~~~Cl~~~~~~~~~~~~~i~l~~C---d~~  130 (150)
T PF03498_consen   59 PKTGTCLAAYGNGVFHYK--SCDQDNLEQVFSIIPTTTGAVQIKS---LSTGECLQTFNNSRTPIYYSIGLTPC---DKS  130 (150)
T ss_dssp             TTTSEEEEEETTCEEEE----TTTCHGHH-EEEEEBTTS-EEEEE---TTT--EEEE-STTSS-SSEEEEEE------S-
T ss_pred             CCCCcceeecCCCeEeec--ccCCCChhceEEEEEcCCCcEEEEe---cCCCceEEecCCCceeEEeeEEeeeC---CCc
Confidence            346669999888864332  299444  999996555  446655   3677999998654      4555777   222


Q ss_pred             CCCCccCceEEE
Q 015062          368 KTCDPASQWFKL  379 (414)
Q Consensus       368 ~~c~p~~qwf~~  379 (414)
                      ..=+...|||=.
T Consensus       131 ~~~~l~~lw~it  142 (150)
T PF03498_consen  131 KEINLDQLWFIT  142 (150)
T ss_dssp             EEETGGGEEEEE
T ss_pred             CCCCHHHcEEEc
Confidence            233667788743


No 36 
>PF05089 NAGLU:  Alpha-N-acetylglucosaminidase (NAGLU) tim-barrel domain;  InterPro: IPR024733 Alpha-N-acetylglucosaminidase is a lysosomal enzyme that is required for the stepwise degradation of heparan sulphate []. Mutations on the alpha-N-acetylglucosaminidase gene can lead to mucopolysaccharidosis type IIIB (MPS IIIB; or Sanfilippo syndrome type B), characterised by neurological dysfunction but relatively mild somatic manifestations [].  Alpha-N-acetylglucosaminidase is composed of three domains. This entry represents the central domain, which has a tim barrel fold [].; PDB: 4A4A_A 2VC9_A 2VCC_A 2VCB_A 2VCA_A.
Probab=77.64  E-value=5.2  Score=40.60  Aligned_cols=66  Identities=14%  Similarity=0.185  Sum_probs=41.0

Q ss_pred             CCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcC
Q 015062           27 QYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSG   94 (414)
Q Consensus        27 ~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG   94 (414)
                      +.| .+.-..+.++.-+.|. ..++.+.|++||-..+...........+++.+++.++||+.+=++.|
T Consensus       153 plF-~~i~~~F~~~q~~~yG-~~~~Y~~D~FnE~~p~~~~~~~l~~~s~~v~~am~~~dp~AvWvmQg  218 (333)
T PF05089_consen  153 PLF-AEIAKLFYEEQIKLYG-TDHIYAADPFNEGGPPSGDPEYLANVSKAVYKAMQAADPDAVWVMQG  218 (333)
T ss_dssp             -HH-HHHHHHHHHHHHHHH----SEEE--TTTTS---TTS---HHHHHHHHHHHHHHH-TT-EEEEEE
T ss_pred             chH-HHHHHHHHHHHHHhcC-CCceeCCCccCCCCCCCCchHHHHHHHHHHHHHHHhhCCCcEEEEcc
Confidence            344 2444556777788887 88899999999966553333457788888999999999999999988


No 37 
>PF12891 Glyco_hydro_44:  Glycoside hydrolase family 44;  InterPro: IPR024745 This is a family of putative bacterial glycoside hydrolases.; PDB: 3IK2_A 3ZQ9_A 2YJQ_B 2YKK_A 2YIH_A 2EEX_A 2EQD_A 2E0P_A 2E4T_A 2EO7_A ....
Probab=77.59  E-value=7.4  Score=37.75  Aligned_cols=64  Identities=22%  Similarity=0.256  Sum_probs=37.4

Q ss_pred             HHHHHHHHHHHHHHhCCC---ceEEEEeccCCCCC---------C-CCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           31 PDLWIKGLTKMATIFNGV---RNVVGMSLRNELRG---------P-KQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~---pnViG~dL~NEP~~---------~-~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      .++|+   ..|-++|...   ..|-+|.|=|||.-         + ..+.++......+.++|||+++|...|+= ...|
T Consensus       106 ~~ewV---~~l~~~~g~a~~~~gvk~y~lDNEP~LW~~TH~dVHP~~~t~~El~~r~i~~AkaiK~~DP~a~v~G-P~~w  181 (239)
T PF12891_consen  106 MDEWV---NYLVNKYGNASTNGGVKYYSLDNEPDLWHSTHRDVHPEPVTYDELRDRSIEYAKAIKAADPDAKVFG-PVEW  181 (239)
T ss_dssp             HHHHH---HHHHHHH--TTSTTS--EEEESS-GGGHHHHTTTT--S---HHHHHHHHHHHHHHHHHH-TTSEEEE-EEE-
T ss_pred             HHHHH---HHHHHHHhccccCCCceEEEecCchHhhcccccccCCCCCCHHHHHHHHHHHHHHHHhhCCCCeEee-chhh
Confidence            45665   3455667543   45888999999932         1 11345677777888999999999988764 3344


Q ss_pred             C
Q 015062           98 D   98 (414)
Q Consensus        98 ~   98 (414)
                      +
T Consensus       182 g  182 (239)
T PF12891_consen  182 G  182 (239)
T ss_dssp             S
T ss_pred             c
Confidence            3


No 38 
>cd00257 Fascin Fascin-like domain; members include actin-bundling/crosslinking proteins facsin, histoactophilin and singed;  identified in sea urchin, Drosophila, Xenopus, rodents, and humans; The fascin-like domain adopts a beta-trefoil topology and contains an internal threefold repeat; the fascin subgroup contains four copies of the domain; Structurally similar to fibroblast  growth factor (FGF)
Probab=75.44  E-value=15  Score=30.74  Aligned_cols=61  Identities=15%  Similarity=0.157  Sum_probs=38.4

Q ss_pred             eeeec-cceeEeeccCCcccEEeeecC-CCCCceEEEecCccEEeeecCCCceeEEEecCCCceee
Q 015062          295 ISLKG-AYFCLQAKHVGKPAKLGIICT-DCGSTWEIISDSKMHLSSKADNGTTVCLDVDSSNTIVT  358 (414)
Q Consensus       295 l~~~~-~~~cl~a~~~g~~~~~~~~c~-~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~~~~ivt  358 (414)
                      ++|+. ++++|.++..|..+. .+... ++.+.|++.-.+...++.++.+|.+|+++  .+|.|..
T Consensus         4 v~Lrs~~gkyl~~~~~g~~v~-a~~~~~~~~e~F~l~~~~~g~v~Lrs~~G~yls~~--~~g~l~~   66 (119)
T cd00257           4 VVLRSVNGRYLSAEAGGDKVD-ANRDSLKGDETFTLEFDNTGKYALRSHDGKYLSAD--SDGGVQL   66 (119)
T ss_pred             EEEEEcCCCEEEEeccCCEEE-EcCccCCCceEEEEEECCCCeEEEEECCCcEEEEE--CCCCEEe
Confidence            44444 688999998884222 23333 45688998665444455566789999886  3555433


No 39 
>cd00257 Fascin Fascin-like domain; members include actin-bundling/crosslinking proteins facsin, histoactophilin and singed;  identified in sea urchin, Drosophila, Xenopus, rodents, and humans; The fascin-like domain adopts a beta-trefoil topology and contains an internal threefold repeat; the fascin subgroup contains four copies of the domain; Structurally similar to fibroblast  growth factor (FGF)
Probab=71.38  E-value=49  Score=27.64  Aligned_cols=71  Identities=17%  Similarity=0.144  Sum_probs=44.0

Q ss_pred             CCccccC--Cceeeee-ccceeEeeccCCcccEEeeecCCCCCceEEEecCccEEeeecCCCceeEEEecCCCceeee
Q 015062          285 EAWSYTP--HKTISLK-GAYFCLQAKHVGKPAKLGIICTDCGSTWEIISDSKMHLSSKADNGTTVCLDVDSSNTIVTN  359 (414)
Q Consensus       285 ~~W~~~~--~~~l~~~-~~~~cl~a~~~g~~~~~~~~c~~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~~~~ivt~  359 (414)
                      +.|....  ++.+.|+ .+++.|.+..+|. +..... -++..+|++.-.+..+++.+..+|.+|+.+.  +|.+..+
T Consensus        34 e~F~l~~~~~g~v~Lrs~~G~yls~~~~g~-l~~~~~-~~~~e~F~~e~~~~g~~al~~~~G~yl~~~~--~g~l~~~  107 (119)
T cd00257          34 ETFTLEFDNTGKYALRSHDGKYLSADSDGG-VQLEGH-PNADCRFTLEFHGDGKWALRAENGRYLGGDG--SGTLKAS  107 (119)
T ss_pred             eEEEEEECCCCeEEEEECCCcEEEEECCCC-EEecCC-CCCCcEEEEEECCCCeEEEEcCCCCEEeecC--CCeEEEe
Confidence            5566643  4444333 4778999888885 344333 4667788875444334566777999999875  5654433


No 40 
>PF02156 Glyco_hydro_26:  Glycosyl hydrolase family 26;  InterPro: IPR022790 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 26 GH26 from CAZY encompasses mainly mannan endo-1,4-beta-mannosidases (3.2.1.78 from EC). Mannan endo-1,4-beta-mannosidase hydrolyses mannan and galactomannan, but displays little activity towards other plant cell wall polysaccharides []. The enzyme randomly hydrolyses 1,4-beta-D-linkages in mannans, galacto-mannans, glucomannans and galactoglucomannans.  This entry also incoporates the enzyme Endogluconase H 3.2.1.4 from EC catalyzes the endohydrolysis of 1,4-beta-glucosidic linkages in cellulose, lichenin and cereal beta-D-glucans. ; GO: 0008810 cellulase activity, 0016985 mannan endo-1,4-beta-mannosidase activity, 0006080 substituted mannan metabolic process; PDB: 2QHA_A 3CBW_A 2WHK_A 2VI0_A 2BVD_A 2BV9_A 2CIT_A 2V3G_A 2CIP_A 2X2Y_B ....
Probab=66.95  E-value=57  Score=32.89  Aligned_cols=135  Identities=13%  Similarity=0.207  Sum_probs=67.8

Q ss_pred             HHHHHHHhCCCceEEEEeccCCCCCCCC-ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcchhhhcccccccCCCc
Q 015062           38 LTKMATIFNGVRNVVGMSLRNELRGPKQ-NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLSFVRNQAVNLTFTGK  116 (414)
Q Consensus        38 W~~iA~ryk~~pnViG~dL~NEP~~~~~-n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~v~~~Pv~l~~~~k  116 (414)
                      ...|-+.-+.+|.|+|+|++++-..... ...+. ..++++++..+   -.                           .=
T Consensus        42 ~~~v~~~tG~yPAv~G~D~~~~~~~~~~~~~~~~-~~~~~a~~~~~---~G---------------------------gI   90 (311)
T PF02156_consen   42 RSDVKDVTGKYPAVRGFDFGFWYSPSNNADGVDF-DIIEEAIEWWK---RG---------------------------GI   90 (311)
T ss_dssp             HHHHHHHHSS-BSEEEEEEEETSCCSSGGGGBCH-TTHHHHHHHHH---TT----------------------------E
T ss_pred             HHHHHHHhCCCCeEEEeecccccCCccccccCch-HHHHHHHHHHH---CC---------------------------CE
Confidence            4567777889999999999993211110 00011 11233332222   11                           12


Q ss_pred             EEEEEeecCCCCCC--CccCCCC------------CcchhhHHHHHHHHHHHHHh---cCCCEEE---eccCcCC--CCC
Q 015062          117 LVFEAHWYGFTDGQ--AWVDGNP------------NQVCGRVVDNVMRLSGFLLE---QGWPLFV---SEFGADL--RGN  174 (414)
Q Consensus       117 lVYs~H~Y~p~~~~--~W~~~~~------------~~~~~~~~~~~~~~~gfl~~---~g~Pv~l---GEFG~~~--~~~  174 (414)
                      +-++.|++.|....  .|.....            ...+..+.+.+++.+.++.+   .++||++   =|+.+.-  -+.
T Consensus        91 vT~sWH~~~P~~~~~~~f~~~~t~~~~~~~l~~~~t~~~~~~~~~ld~iA~~l~~l~~~~vPVl~Rp~HE~nG~WfwWg~  170 (311)
T PF02156_consen   91 VTFSWHWNNPSTGGGSAFYTEATTFDISKILTGGPTAEYEAFKADLDRIADFLKQLKDAGVPVLFRPFHEMNGGWFWWGA  170 (311)
T ss_dssp             EEEEEE--BTTTSSS-STTSTSTCHHHHHHCCTTTSHCHHHHHHHHHHHHHHHHHHHCTTS-EEEEESTSTTSSSSTTST
T ss_pred             EEEEecCCCCCCCCccccccCCCHHHHHHHhCCCChHHHHHHHHHHHHHHHHHHHhhcCCCeEEEeehhhcCCCccccCC
Confidence            45677777665321  2221110            12344566666666666643   7899985   4555422  122


Q ss_pred             C----c-cchHHHHHHHHHHHH-CCCcEEEeccCc
Q 015062          175 N----V-NDNRYLNCFFGVAAE-LDWDWALWTLVG  203 (414)
Q Consensus       175 ~----~-~~~~~~~~~l~~l~e-~~i~Wa~Wa~~G  203 (414)
                      .    + .-.+..+.+.+++++ +++.-..|.+++
T Consensus       171 ~~~~~~~~y~~lwr~~~~~l~~~~g~~Nliwvw~~  205 (311)
T PF02156_consen  171 KGHCTPEQYKALWRHMVDYLRNVKGLHNLIWVWSP  205 (311)
T ss_dssp             TSTCHHHHHHHHHHHHHHHHHTTST-TSEEEEE-E
T ss_pred             CCCCCHHHHHHHHHHHHHHHHhccCCceEEEEecC
Confidence            1    1 124557778899875 788888887765


No 41 
>COG5520 O-Glycosyl hydrolase [Cell envelope biogenesis, outer membrane]
Probab=66.12  E-value=1.2e+02  Score=31.54  Aligned_cols=151  Identities=19%  Similarity=0.217  Sum_probs=79.8

Q ss_pred             HHHHHHHHHHHHHhCCC-ceEEEEeccCCCCCCC-C-----ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC-Ccch-
Q 015062           32 DLWIKGLTKMATIFNGV-RNVVGMSLRNELRGPK-Q-----NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFD-KDLS-  102 (414)
Q Consensus        32 d~~~~~W~~iA~ryk~~-pnViG~dL~NEP~~~~-~-----n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~-~dLs-  102 (414)
                      .+|.+++......+|++ -|+.++++-|||.-.. .     ..++-.+.|.+   -.+.++...-||+---.++ -+++ 
T Consensus       149 a~yA~~l~~fv~~m~~nGvnlyalSVQNEPd~~p~~d~~~wtpQe~~rF~~q---yl~si~~~~rV~~pes~~~~~~~~d  225 (433)
T COG5520         149 ADYADYLNDFVLEMKNNGVNLYALSVQNEPDYAPTYDWCWWTPQEELRFMRQ---YLASINAEMRVIIPESFKDLPNMSD  225 (433)
T ss_pred             HHHHHHHHHHHHHHHhCCCceeEEeeccCCcccCCCCcccccHHHHHHHHHH---hhhhhccccEEecchhccccccccc
Confidence            46777777777777775 4688999999996641 1     22334444443   3344444555555332222 1222 


Q ss_pred             hhhcccccccCCCcEEEEEeecCCCCC-CCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcCCCCCCccchHH
Q 015062          103 FVRNQAVNLTFTGKLVFEAHWYGFTDG-QAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGADLRGNNVNDNRY  181 (414)
Q Consensus       103 ~v~~~Pv~l~~~~klVYs~H~Y~p~~~-~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~~~~~~~~~~~~  181 (414)
                      .+-++|-.+  .+=-+...|+|+-.+. ++.                 ..+.+ .-.|.-||++|-=....+++-.++..
T Consensus       226 p~lnDp~a~--a~~~ilg~H~Ygg~v~~~p~-----------------~lak~-~~~gKdlwmte~y~~esd~~s~dr~~  285 (433)
T COG5520         226 PILNDPKAL--ANMDILGTHLYGGQVSDQPY-----------------PLAKQ-KPAGKDLWMTECYPPESDPNSADREA  285 (433)
T ss_pred             ccccCHhHh--cccceeEeeecccccccchh-----------------hHhhC-CCcCCceEEeecccCCCCCCcchHHH
Confidence            112233332  3445889999986553 110                 00000 01367899999877766654433322


Q ss_pred             HH---HHHHHHHHCCC-cEEEeccCccc
Q 015062          182 LN---CFFGVAAELDW-DWALWTLVGSY  205 (414)
Q Consensus       182 ~~---~~l~~l~e~~i-~Wa~Wa~~Gsy  205 (414)
                      +.   .++.-+-+-+. +..+|-+..+|
T Consensus       286 ~~~~~hi~~gm~~gg~~ayv~W~i~~~~  313 (433)
T COG5520         286 LHVALHIHIGMTEGGFQAYVWWNIRLDY  313 (433)
T ss_pred             HHHHHHHHhhccccCccEEEEEEEeecc
Confidence            22   22222223343 57888776443


No 42 
>PF02055 Glyco_hydro_30:  O-Glycosyl hydrolase family 30;  InterPro: IPR001139 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 30 GH30 from CAZY comprises enzymes with only one known activity; glucosylceramidase (3.2.1.45 from EC). Family 30 encompasses the mammalian glucosylceramidases. Human acid beta-glucosidase (D-glucosyl-N-acylsphingosine glucohydrolase), cleaves the glucosidic bonds of glucosylceramide and synthetic beta-glucosides []. Any one of over 50 different mutations in the gene of glucocerebrosidase have been found to affect activity of this hydrolase, producing variants of Gaucher disease, the most prevalent lysosomal storage disease [, ].; GO: 0004348 glucosylceramidase activity, 0006665 sphingolipid metabolic process, 0007040 lysosome organization, 0005764 lysosome; PDB: 2VT0_B 1NOF_A 2Y24_A 2WCG_B 2J25_A 3GXM_D 1Y7V_B 2NT0_C 3GXF_C 3GXD_A ....
Probab=65.66  E-value=77  Score=34.09  Aligned_cols=152  Identities=14%  Similarity=0.201  Sum_probs=80.0

Q ss_pred             HHHHHHHHHHHHHHhCCC-ceEEEEeccCCCCCCC---C--ChhhHH-----HHHH-HHHHHHHhcCC--CcEEEE-cCc
Q 015062           31 PDLWIKGLTKMATIFNGV-RNVVGMSLRNELRGPK---Q--NVKDWY-----RYMQ-LGAEAVHAANP--EVLVIL-SGL   95 (414)
Q Consensus        31 ~d~~~~~W~~iA~ryk~~-pnViG~dL~NEP~~~~---~--n~~dW~-----~~~~-~~~~aIr~~dP--~~LIiV-eG~   95 (414)
                      -+.|++.+.+..+.|+.+ =+|.++.+-|||....   .  ..-.|-     ..+. .++.++++.++  +.-|++ +-.
T Consensus       203 ~~~yA~Y~vkfi~aY~~~GI~i~aiT~QNEP~~~~~~~~~~~s~~~t~~~~~~Fi~~~LgP~l~~~~~g~d~kI~~~D~n  282 (496)
T PF02055_consen  203 YQAYADYFVKFIQAYKKEGIPIWAITPQNEPDNGSDPNYPWPSMGWTPEEQADFIKNYLGPALRKAGLGKDVKILIYDHN  282 (496)
T ss_dssp             HHHHHHHHHHHHHHHHCTT--ESEEESSSSCCGGGSTT-SSC--B--HHHHHHHHHHTHHHHHHTSTT-TTSEEEEEEEE
T ss_pred             HHHHHHHHHHHHHHHHHCCCCeEEEeccCCCCCCCCCCCCCCcCCCCHHHHHHHHHHHHHHHHHhcCCCCceEEEEEecC
Confidence            368999999999999765 3588999999997420   1  111232     2232 36778999988  665555 322


Q ss_pred             cCCCc-c-hhhhcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcCCCC
Q 015062           96 NFDKD-L-SFVRNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGADLRG  173 (414)
Q Consensus        96 ~~~~d-L-s~v~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~~~~  173 (414)
                      .+... . ..+-.+|-...+  =-.-.+|+|+-...           ...+. ...+.  |   -+..++.+|-......
T Consensus       283 ~~~~~~~~~~il~d~~A~~y--v~GiA~HwY~g~~~-----------~~~l~-~~h~~--~---P~k~l~~TE~~~g~~~  343 (496)
T PF02055_consen  283 RDNLPDYADTILNDPEAAKY--VDGIAFHWYGGDPS-----------PQALD-QVHNK--F---PDKFLLFTEACCGSWN  343 (496)
T ss_dssp             GGGTTHHHHHHHTSHHHHTT--EEEEEEEETTCS-H-----------CHHHH-HHHHH--S---TTSEEEEEEEESS-ST
T ss_pred             CcccchhhhhhhcChhhHhh--eeEEEEECCCCCch-----------hhHHH-HHHHH--C---CCcEEEeeccccCCCC
Confidence            22111 0 011112211111  13678999974321           11111 11111  0   2467999997443221


Q ss_pred             CC----cc----chHHHHHHHHHHHHCCCcEEEecc
Q 015062          174 NN----VN----DNRYLNCFFGVAAELDWDWALWTL  201 (414)
Q Consensus       174 ~~----~~----~~~~~~~~l~~l~e~~i~Wa~Wa~  201 (414)
                      .+    ..    ..+|...++..+...--+|..|.+
T Consensus       344 ~~~~~~~g~w~~~~~y~~~ii~~lnn~~~gw~~WNl  379 (496)
T PF02055_consen  344 WDTSVDLGSWDRAERYAHDIIGDLNNWVSGWIDWNL  379 (496)
T ss_dssp             TS-SS-TTHHHHHHHHHHHHHHHHHTTEEEEEEEES
T ss_pred             cccccccccHHHHHHHHHHHHHHHHhhceeeeeeee
Confidence            11    10    134667777777655458999987


No 43 
>cd02068 radical_SAM_B12_BD B12 binding domain_like associated with radical SAM domain. This domain shows similarity with B12 (adenosylcobamide) binding domains found in several enzymes, such as glutamate mutase, methionine synthase and methylmalonyl-CoA mutase, but it lacks the signature motif Asp-X-His-X-X-Gly, which contains the histidine that acts as a cobalt ligand. The function of this domain remains unclear.
Probab=64.82  E-value=16  Score=31.05  Aligned_cols=42  Identities=24%  Similarity=0.212  Sum_probs=33.2

Q ss_pred             CCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC
Q 015062           47 GVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFD   98 (414)
Q Consensus        47 ~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~   98 (414)
                      ..|.++||..+..-         . ..+.++++.||+..|+..|+++|..-.
T Consensus        38 ~~pdiv~~S~~~~~---------~-~~~~~~~~~ik~~~p~~~iv~GG~~~t   79 (127)
T cd02068          38 LKPDVVGISLMTSA---------I-YEALELAKIAKEVLPNVIVVVGGPHAT   79 (127)
T ss_pred             cCCCEEEEeecccc---------H-HHHHHHHHHHHHHCCCCEEEECCcchh
Confidence            68899999975331         2 257788899999999999999997643


No 44 
>PF02310 B12-binding:  B12 binding domain;  InterPro: IPR006158  The cobalamin (vitamin B12) binding domain can bind two different forms of the cobalamin cofactor, with cobalt bonded either to a methyl group (methylcobalamin) or to 5'-deoxyadenosine (adenosylcobalamin). Cobalamin-binding domains are mainly found in two families of enzymes present in animals and prokaryotes, which perform distinct kinds of reactions at the cobalt-carbon bond. Enzymes that require methylcobalamin carry out methyl transfer reactions. Enzymes that require adenosylcobalamin catalyse reactions in which the first step is the cleavage of adenosylcobalamin to form cob(II)alamin and the 5'-deoxyadenosyl radical, and thus act as radical generators. In both types of enzymes the B12-binding domain uses a histidine to bind the cobalt atom of cobalamin cofactors. This histidine is embedded in a DXHXXG sequence, the most conserved primary sequence motif of the domain [, , ]. Proteins containing the cobalamin-binding domain include:    Animal and prokaryotic methionine synthase (2.1.1.13 from EC), which catalyse the transfer of a methyl group from methyl-cobalamin to homocysteine, yielding enzyme-bound cob(I)alamin and methionine. Animal and prokaryotic methylmalonyl-CoA mutase (5.4.99.2 from EC), which are involved in the degradation of several amino acids, odd-chain fatty acids and cholesterol via propionyl-CoA to the tricarboxylic acid cycle.  Prokaryotic lysine 5,6-aminomutase (5.4.3.4 from EC).  Prokaryotic glutamate mutase (5.4.99.1 from EC) [].  Prokaryotic methyleneglutarate mutase (5.4.99.4 from EC).  Prokaryotic isobutyryl-CoA mutase (5.4.99.13 from EC).    The core structure of the cobalamin-binding domain is characterised by a five-stranded alpha/beta (Rossmann) fold, which consists of 5 parallel beta-sheets surrounded by 4-5 alpha helices in three layers (alpha/beta/alpha) []. Upon binding cobalamin, important elements of the binding site appear to become structured, including an alpha-helix that forms on one side of the cleft accommodating the nucleotide 'tail' of the cofactor. In cobalamin, the cobalt atom can be either free (dmb-off) or bound to dimethylbenzimidazole (dmb-on) according to the pH. When bound to the cobalamin-binding domain, the dimethylbenzimidazole ligand is replaced by the active histidine (His-on) of the DXHXXG motif. The replacement of dimethylbenzimidazole by histidine allows switching between the catalytic and activation cycles []. In methionine synthase the cobalamin cofactor is sandwiched between the cobalamin-binding domain and an approximately 90 residues N-terminal domain forming a helical bundle comprising two pairs of antiparallel helices []. In methionine synthase, there is a second, adjacent domain involved in cobalamin binding that forms a 4-helical bundle cap (IPR003759 from INTERPRO); in the conversion to the active conformation of this enzyme, the 4-helical cap rotates to allow the cobalamin cofactor to bind the activation domain (IPR004223 from INTERPRO) [].; GO: 0031419 cobalamin binding, 0046872 metal ion binding; PDB: 1Y80_A 3BUL_A 1K7Y_A 1BMT_A 3IV9_A 1K98_A 3IVA_A 3KP1_A 3KOW_A 3KOZ_A ....
Probab=63.07  E-value=14  Score=30.81  Aligned_cols=43  Identities=21%  Similarity=0.262  Sum_probs=32.9

Q ss_pred             CCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC
Q 015062           47 GVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFD   98 (414)
Q Consensus        47 ~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~   98 (414)
                      .+|.++++.....+         -...+.+.++.+|+.+|+..|+++|..-.
T Consensus        50 ~~pd~V~iS~~~~~---------~~~~~~~l~~~~k~~~p~~~iv~GG~~~t   92 (121)
T PF02310_consen   50 ERPDVVGISVSMTP---------NLPEAKRLARAIKERNPNIPIVVGGPHAT   92 (121)
T ss_dssp             TTCSEEEEEESSST---------HHHHHHHHHHHHHTTCTTSEEEEEESSSG
T ss_pred             CCCcEEEEEccCcC---------cHHHHHHHHHHHHhcCCCCEEEEECCchh
Confidence            37778888876333         23456778888999999999999998754


No 45 
>KOG3737 consensus Predicted polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=62.65  E-value=7.6  Score=40.30  Aligned_cols=97  Identities=19%  Similarity=0.285  Sum_probs=67.1

Q ss_pred             eeeecCCCCceeeccCCC--CceeeccCCCC---CCccccCCceeeeeccceeEeeccCCcccEEeeecC-CC-CCceEE
Q 015062          256 KVIYHPATGLCVQRKSFL--DPLTLGPCTES---EAWSYTPHKTISLKGAYFCLQAKHVGKPAKLGIICT-DC-GSTWEI  328 (414)
Q Consensus       256 ~~~~~~~tg~c~~~~~~~--~~l~~~~c~~~---~~W~~~~~~~l~~~~~~~cl~a~~~g~~~~~~~~c~-~~-~~~W~~  328 (414)
                      ..+..++|+-|++..+.+  ..+.+++|-+.   +--..+.+|+|  ..+..||+|.|.+  +. .+.|. +. +..|+-
T Consensus       482 GE~R~~at~~ClDsMG~~p~g~mglt~CHg~GgNQL~RlN~agQl--~qge~CltAdg~~--i~-~~hC~lgtv~g~WqY  556 (603)
T KOG3737|consen  482 GEIRGFATAYCLDSMGKTPGGFMGLTPCHGMGGNQLFRLNEAGQL--MQGEQCLTADGSK--IM-ITHCNLGTVKGEWQY  556 (603)
T ss_pred             hhccCcccchhHHhcCCCCCCccccccccCCCCceEEEeccccch--hccceeeecCCce--EE-EEEeecccccCceeh
Confidence            578889999999995542  45789999665   44555555655  3577899988764  33 37898 44 569998


Q ss_pred             EecCccEEeeecCCCceeEEEecCCCceee-eee
Q 015062          329 ISDSKMHLSSKADNGTTVCLDVDSSNTIVT-NTC  361 (414)
Q Consensus       329 ~s~s~~~~~~~~~~~~~lcld~~~~~~ivt-~~c  361 (414)
                      .-+.+-.    ...-+..|||+...+.-|+ ..|
T Consensus       557 ~~~tk~~----~H~~~~kC~~~se~~~qv~l~~C  586 (603)
T KOG3737|consen  557 FKNTKRF----THIPSGKCLDRSEVLHQVFLSNC  586 (603)
T ss_pred             hhcchhe----eeccccccccccchhheeeeccc
Confidence            7777632    2224789999987665444 554


No 46 
>COG2240 PdxK Pyridoxal/pyridoxine/pyridoxamine kinase [Coenzyme metabolism]
Probab=57.85  E-value=76  Score=31.60  Aligned_cols=68  Identities=18%  Similarity=0.165  Sum_probs=48.7

Q ss_pred             CCCCCCCHHHHHHHHHHHHH--HhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCc
Q 015062           24 FGDQYFNPDLWIKGLTKMAT--IFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKD  100 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~--ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~d  100 (414)
                      |.-....+|++.++.+-+.+  .......|+        .|.-++.. =.+.+.+++.+||+.+|+.++++..+-.+.+
T Consensus        48 ~~g~v~~~e~l~~~l~~l~~~~~~~~~davl--------tGYlgs~~-qv~~i~~~v~~vk~~~P~~~~l~DPVMGD~g  117 (281)
T COG2240          48 WTGIVMPPEQLADLLNGLEAIDKLGECDAVL--------TGYLGSAE-QVRAIAGIVKAVKEANPNALYLCDPVMGDPG  117 (281)
T ss_pred             CCCcCCCHHHHHHHHHHHHhcccccccCEEE--------EccCCCHH-HHHHHHHHHHHHhccCCCeEEEeCCcccCCC
Confidence            44445778888888888887  555666665        23333332 3456677888999999999999999887765


No 47 
>TIGR01370 cysRS possible cysteinyl-tRNA synthetase, Methanococcus type. Assignment of this protein family as cysteinyl-tRNA synthetase is controversial, supported by PubMed:11333988 but challenged by PubMed:14679218. Members of this family from Deinococcus radiodurans (bacterial) and Methanococcus jannaschii (archaeal), species lacking a conventional cysteinyl-tRNA synthetase (Cys--tRNA ligase), have been indicated to be a novel form of that enzyme, perhaps distantly related to class I tRNA ligases. The member from Thermotoga maritima is presumed to be a second isozyme of cysteinyl-tRNA synthetase. A number of homologous but more distantly related proteins are annotated as alpha-1,4 polygalactosaminidases.
Probab=55.64  E-value=2.4e+02  Score=28.60  Aligned_cols=147  Identities=13%  Similarity=0.068  Sum_probs=73.5

Q ss_pred             HHHHHHHHHHHHHh--CCCceEEEEeccC------CCCCCC-CChhhHHHHHHHHHHHHHhcCCCcEEEE-cCccCCCcc
Q 015062           32 DLWIKGLTKMATIF--NGVRNVVGMSLRN------ELRGPK-QNVKDWYRYMQLGAEAVHAANPEVLVIL-SGLNFDKDL  101 (414)
Q Consensus        32 d~~~~~W~~iA~ry--k~~pnViG~dL~N------EP~~~~-~n~~dW~~~~~~~~~aIr~~dP~~LIiV-eG~~~~~dL  101 (414)
                      .+|.+++..-..+.  +|...|. .|.+.      |..... ....+-..+..++++.+|+..|+.+||. .|...-...
T Consensus       143 ~~W~~il~~rl~~l~~kGfDGvf-LD~lDsy~~~~~~~~~~~~~~~~m~~~i~~Ia~~ar~~~P~~~II~NnG~eil~~~  221 (315)
T TIGR01370       143 PEWKAIAFSYLDRVIAQGFDGVY-LDLIDAFEYWAENGDNRPGAAAEMIAFVCEIAAYARAQNPQFVIIPQNGEELLRDD  221 (315)
T ss_pred             HHHHHHHHHHHHHHHHcCCCeEe-eccchhhhhhcccCCcchhhHHHHHHHHHHHHHHHHHHCCCEEEEecCchhhhhcc
Confidence            45655554444454  6666554 45443      332211 1234566677778888899999988875 343321110


Q ss_pred             hhhhcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHHHHHHHhcCCCEEEeccCcCCCCCCccchHH
Q 015062          102 SFVRNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRLSGFLLEQGWPLFVSEFGADLRGNNVNDNRY  181 (414)
Q Consensus       102 s~v~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~~gfl~~~g~Pv~lGEFG~~~~~~~~~~~~~  181 (414)
                      .    ..+ .+.-+-++.|-=+|.....          ..+.-.+.+......+.+.|.||++=|+..+.... ..+..-
T Consensus       222 ~----g~~-~~~idgV~~Eslf~~~~~~----------~~e~dr~~~l~~L~~~~~~G~~Vl~IDY~~~~~~~-~~n~~~  285 (315)
T TIGR01370       222 H----GGL-AATVSGWAVEELFYYAANR----------PTEAERQRRLLALYRLWQQGKFVLTVDYVDDGTKT-NENPAR  285 (315)
T ss_pred             c----cch-hhhceEEEecceEEcCCCC----------CCHHHHHHHHHHHHHHHHCCCcEEEEEecCCcccc-hhhHHH
Confidence            0    000 0111123333222332211          11111121222222334579999999998764321 123455


Q ss_pred             HHHHHHHHHHCCCc
Q 015062          182 LNCFFGVAAELDWD  195 (414)
Q Consensus       182 ~~~~l~~l~e~~i~  195 (414)
                      .+.+.+.++++|+.
T Consensus       286 ~~~~~~~~~~~Gf~  299 (315)
T TIGR01370       286 MKDAAEKARAAGLI  299 (315)
T ss_pred             HHHHHHHHHHcCCe
Confidence            68888888888863


No 48 
>cd02067 B12-binding B12 binding domain (B12-BD). This domain binds different cobalamid derivates, like B12 (adenosylcobamide) or methylcobalamin or methyl-Co(III) 5-hydroxybenzimidazolylcobamide, it is found in several enzymes, such as glutamate mutase, methionine synthase and methylmalonyl-CoA mutase. Cobalamin undergoes a conformational change on binding the protein; the dimethylbenzimidazole group, which is coordinated to the cobalt in the free cofactor, moves away from the corrin and is replaced by a histidine contributed by the protein. The sequence Asp-X-His-X-X-Gly, which contains this histidine ligand, is conserved in many cobalamin-binding proteins.
Probab=47.68  E-value=35  Score=28.57  Aligned_cols=44  Identities=16%  Similarity=0.163  Sum_probs=34.5

Q ss_pred             CCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCC-CcEEEEcCccCCC
Q 015062           47 GVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANP-EVLVILSGLNFDK   99 (414)
Q Consensus        47 ~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP-~~LIiVeG~~~~~   99 (414)
                      .+|.++++...++.+.         ..+.+.++++|+..| +..|+++|.....
T Consensus        49 ~~pdvV~iS~~~~~~~---------~~~~~~i~~l~~~~~~~~~i~vGG~~~~~   93 (119)
T cd02067          49 EDADAIGLSGLLTTHM---------TLMKEVIEELKEAGLDDIPVLVGGAIVTR   93 (119)
T ss_pred             cCCCEEEEeccccccH---------HHHHHHHHHHHHcCCCCCeEEEECCCCCh
Confidence            4777888887766643         556788889999999 8999999987554


No 49 
>KOG3738 consensus Predicted polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=46.17  E-value=17  Score=37.85  Aligned_cols=69  Identities=22%  Similarity=0.406  Sum_probs=51.1

Q ss_pred             CCCCceeeccCC--CCceeeccCCCCC---CccccCCceeeeeccceeEeeccCCcccEEeeecCCC--CCceEEEe
Q 015062          261 PATGLCVQRKSF--LDPLTLGPCTESE---AWSYTPHKTISLKGAYFCLQAKHVGKPAKLGIICTDC--GSTWEIIS  330 (414)
Q Consensus       261 ~~tg~c~~~~~~--~~~l~~~~c~~~~---~W~~~~~~~l~~~~~~~cl~a~~~g~~~~~~~~c~~~--~~~W~~~s  330 (414)
                      ...++|+.+.++  +.++.+-.|+.++   +|.-.+. .|.-.++.+||+..-.|.-......|.+.  .|+|++..
T Consensus       480 ~~~elCL~v~~~~pg~~v~l~~C~~~e~~q~~v~~~~-~l~h~~s~KOGd~~~~g~~~l~~~~C~~~~~sQ~w~f~~  555 (559)
T KOG3738|consen  480 THRELCLAVGSNTPGSPVALVPCGNNETKQRWVELGG-HLLHAGSHLCLDNPLKGRWLLEVSTCESHLVSQSWQFAL  555 (559)
T ss_pred             HHHhhhheeecCCCCCeEEEEecCCCCCceEEEecCC-chhcccccceeccccCCCcceeecccccccccceeeeeh
Confidence            456889998663  3678899999884   5655553 44445789999998888876667889954  49999864


No 50 
>PF06268 Fascin:  Fascin domain;  InterPro: IPR022768  This family consists of several eukaryotic fascin or singed proteins. The fascins are a structurally unique and evolutionarily conserved group of actin cross-linking proteins. Fascins function in the organisation of two major forms of actin-based structures: dynamic, cortical cell protrusions and cytoplasmic microfilament bundles. The cortical structures, which include filopodia, spikes, lamellipodial ribs, oocyte microvilli and the dendrites of dendritic cells, have roles in cell-matrix adhesion, cell interactions and cell migration, whereas the cytoplasmic actin bundles appear to participate in cell architecture []. Dictyostelium hisactophilin, another actin-binding protein, is a submembranous pH sensor that signals slight changes of the H+ concentration to actin by inducing actin polymerisation and binding to microfilaments only at pH values below seven []. Members of this family are histidine rich, typically contain the repeated motif of HHXH []. ; GO: 0030674 protein binding, bridging, 0051015 actin filament binding; PDB: 1DFC_B 3P53_B 3LLP_A 1HCE_A 1HCD_A.
Probab=45.59  E-value=96  Score=25.80  Aligned_cols=37  Identities=16%  Similarity=0.363  Sum_probs=27.1

Q ss_pred             CCCCceEEE-ecCccEEeeecCCCceeEEEecCCCceeee
Q 015062          321 DCGSTWEII-SDSKMHLSSKADNGTTVCLDVDSSNTIVTN  359 (414)
Q Consensus       321 ~~~~~W~~~-s~s~~~~~~~~~~~~~lcld~~~~~~ivt~  359 (414)
                      ++.+.|+|. .+.+..++.+..+|.+|++|.  +|.|+..
T Consensus        22 ~~~e~f~le~~~~~~~v~lrs~~GkYls~~~--~G~v~~~   59 (111)
T PF06268_consen   22 SDWETFQLEFDDGSYKVALRSHNGKYLSVDS--DGSVVAD   59 (111)
T ss_dssp             SCGGSEEEEEETTEEEEEEECTTSEEEEEET--TSEEEEE
T ss_pred             cccEEEEEEEECCCCEEEEEcCCCCEEEEcC--CCeEEec
Confidence            556899998 555567777888899988865  6766653


No 51 
>PF00332 Glyco_hydro_17:  Glycosyl hydrolases family 17;  InterPro: IPR000490 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 17 GH17 from CAZY comprises enzymes with several known activities; endo-1,3-beta-glucosidase (3.2.1.39 from EC); lichenase (3.2.1.73 from EC); exo-1,3-glucanase (3.2.1.58 from EC). Currently these enzymes have only been found in plants and in fungi. ; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 1AQ0_B 1GHR_A 1GHS_B 2CYG_A 3UR8_A 3UR7_B 3EM5_C 3F55_D.
Probab=41.06  E-value=46  Score=33.44  Aligned_cols=44  Identities=20%  Similarity=0.040  Sum_probs=26.5

Q ss_pred             CCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEE
Q 015062           46 NGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLV   90 (414)
Q Consensus        46 k~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LI   90 (414)
                      ....++-.+=.-||.-..... ......|+-+-+++.+..=..-|
T Consensus        81 ~~~~~i~~i~VGnEv~~~~~~-~~lvpAm~ni~~aL~~~~L~~~I  124 (310)
T PF00332_consen   81 LPAVNIRYIAVGNEVLTGTDN-AYLVPAMQNIHNALTAAGLSDQI  124 (310)
T ss_dssp             TTTSEEEEEEEEES-TCCSGG-GGHHHHHHHHHHHHHHTT-TTTS
T ss_pred             CcccceeeeecccccccCccc-eeeccHHHHHHHHHHhcCcCCcc
Confidence            334556666677887654221 25777888888888887766433


No 52 
>PF12697 Abhydrolase_6:  Alpha/beta hydrolase family; PDB: 3LLC_A 3A2N_E 3A2M_A 3A2L_A 3AFI_F 3C5V_A 3C5W_P 3E0X_A 2ZJF_A 3QYJ_A ....
Probab=37.92  E-value=1e+02  Score=26.83  Aligned_cols=61  Identities=15%  Similarity=0.133  Sum_probs=38.9

Q ss_pred             HHHHHHHhCCCceEEEEeccCCCCCCC---CChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCC
Q 015062           38 LTKMATIFNGVRNVVGMSLRNELRGPK---QNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDK   99 (414)
Q Consensus        38 W~~iA~ryk~~pnViG~dL~NEP~~~~---~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~   99 (414)
                      |..++++++..-.|+.+|+..--....   .....+...++.+.+.|++.+.+.+++| |-++|+
T Consensus        14 ~~~~~~~l~~~~~v~~~d~~G~G~s~~~~~~~~~~~~~~~~~l~~~l~~~~~~~~~lv-G~S~Gg   77 (228)
T PF12697_consen   14 WDPLAEALARGYRVIAFDLPGHGRSDPPPDYSPYSIEDYAEDLAELLDALGIKKVILV-GHSMGG   77 (228)
T ss_dssp             GHHHHHHHHTTSEEEEEECTTSTTSSSHSSGSGGSHHHHHHHHHHHHHHTTTSSEEEE-EETHHH
T ss_pred             HHHHHHHHhCCCEEEEEecCCccccccccccCCcchhhhhhhhhhccccccccccccc-cccccc
Confidence            444555554566788999986322211   1234577778888888888888776666 555554


No 53 
>PF02449 Glyco_hydro_42:  Beta-galactosidase;  InterPro: IPR013529 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. This group of beta-galactosidase enzymes (3.2.1.23 from EC) belong to the glycosyl hydrolase 42 family GH42 from CAZY. The enzyme catalyses the hydrolysis of terminal, non-reducing terminal beta-D-galactosidase residues.; GO: 0004565 beta-galactosidase activity, 0005975 carbohydrate metabolic process, 0009341 beta-galactosidase complex; PDB: 1KWK_A 1KWG_A 3U7V_A.
Probab=37.80  E-value=2.9e+02  Score=28.07  Aligned_cols=135  Identities=15%  Similarity=0.025  Sum_probs=50.5

Q ss_pred             HHHHHHHHHHhcCCCcEEEEcCccC-CCcchhhhcccccccCCCcEEEEEeecCCCCCCCccCCCCCcchhhHHHHHHHH
Q 015062           73 YMQLGAEAVHAANPEVLVILSGLNF-DKDLSFVRNQAVNLTFTGKLVFEAHWYGFTDGQAWVDGNPNQVCGRVVDNVMRL  151 (414)
Q Consensus        73 ~~~~~~~aIr~~dP~~LIiVeG~~~-~~dLs~v~~~Pv~l~~~~klVYs~H~Y~p~~~~~W~~~~~~~~~~~~~~~~~~~  151 (414)
                      ++...+++||+++|+++|..-.... ..++......    ..-  =|.+.+.|.........     .....+.-..+  
T Consensus       214 ~~~~~~~~ir~~~p~~~vt~n~~~~~~~~~d~~~~a----~~~--D~~~~d~Y~~~~~~~~~-----~~~~~~a~~~d--  280 (374)
T PF02449_consen  214 FFRWQADIIREYDPDHPVTTNFMGSWFNGIDYFKWA----KYL--DVVSWDSYPDGSFDFYD-----DDPYSLAFNHD--  280 (374)
T ss_dssp             HHHHHHHHHHHHSTT-EEE-EE-TT---SS-HHHHG----GGS--SSEEEEE-HHHHHTTTT-------TTHHHHHHH--
T ss_pred             HHHHHHHHHHHhCCCceEEeCccccccCcCCHHHHH----hhC--CcceeccccCcccCCCC-----CCHHHHHHHHH--
Confidence            4566789999999999998643332 2222222210    001  26778888651000000     00111111111  


Q ss_pred             HHHHHhcCCCEEEeccCcC--CCCC-C-ccchHHHHHHHHHHHHCCC-cEEEeccCccccccccccCCCc--eeecccCC
Q 015062          152 SGFLLEQGWPLFVSEFGAD--LRGN-N-VNDNRYLNCFFGVAAELDW-DWALWTLVGSYYLREGVIGLNE--YYGLFDWN  224 (414)
Q Consensus       152 ~gfl~~~g~Pv~lGEFG~~--~~~~-~-~~~~~~~~~~l~~l~e~~i-~Wa~Wa~~Gsyy~r~g~~~~~e--t~Gll~~d  224 (414)
                      ....++.+.|.+|.|.-..  .-.. + ......++..+=..-.+|. +-.+|.+..+       ..+.|  -+||+++|
T Consensus       281 l~R~~~~~kpf~v~E~~~g~~~~~~~~~~~~pg~~~~~~~~~~A~Ga~~i~~~~wr~~-------~~g~E~~~~g~~~~d  353 (374)
T PF02449_consen  281 LMRSLAKGKPFWVMEQQPGPVNWRPYNRPPRPGELRLWSWQAIAHGADGILFWQWRQS-------RFGAEQFHGGLVDHD  353 (374)
T ss_dssp             HHHHHTTT--EEEEEE--S--SSSSS-----TTHHHHHHHHHHHTT-S-EEEC-SB---------SSSTTTTS--SB-TT
T ss_pred             HHHhhcCCCceEeecCCCCCCCCccCCCCCCCCHHHHHHHHHHHHhCCeeEeeeccCC-------CCCchhhhcccCCcc
Confidence            1111247899999999332  1110 0 0011122222212223665 3568877532       22222  58999999


Q ss_pred             CCC
Q 015062          225 WCD  227 (414)
Q Consensus       225 W~t  227 (414)
                      ..+
T Consensus       354 g~~  356 (374)
T PF02449_consen  354 GRE  356 (374)
T ss_dssp             S--
T ss_pred             CCC
Confidence            843


No 54 
>TIGR01233 lacG 6-phospho-beta-galactosidase. This enzyme is part of the tagatose-6-phosphate pathway of galactose-6-phosphate degradation.
Probab=37.77  E-value=87  Score=33.35  Aligned_cols=63  Identities=10%  Similarity=-0.057  Sum_probs=40.9

Q ss_pred             CCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCC-----------C--C-h-------hhHHHHHHHHHHHHH
Q 015062           24 FGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPK-----------Q--N-V-------KDWYRYMQLGAEAVH   82 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~-----------~--n-~-------~dW~~~~~~~~~aIr   82 (414)
                      |-++.. .+.|.+.=+.++++|++...   .=.+|||....           .  . .       ..-..+.-+|++++|
T Consensus       128 W~n~~~-v~~F~~YA~~~f~~fgdVk~---WiT~NEP~~~~~~gy~~G~~~Pg~~~~~~~~~~a~hn~l~AHa~A~~~~~  203 (467)
T TIGR01233       128 FLNREN-IEHFIDYAAFCFEEFPEVNY---WTTFNEIGPIGDGQYLVGKFPPGIKYDLAKVFQSHHNMMVSHARAVKLYK  203 (467)
T ss_pred             CCCHHH-HHHHHHHHHHHHHHhCCCCE---EEEecchhhhhhccchhcccCCCccchhHHHHHHHHHHHHHHHHHHHHHH
Confidence            444434 78999999999999986433   45799996420           0  0 0       112234467888999


Q ss_pred             hcCCCcEE
Q 015062           83 AANPEVLV   90 (414)
Q Consensus        83 ~~dP~~LI   90 (414)
                      +.+|+..|
T Consensus       204 ~~~~~~~I  211 (467)
T TIGR01233       204 DKGYKGEI  211 (467)
T ss_pred             HhCCCCeE
Confidence            98887543


No 55 
>PRK10673 acyl-CoA esterase; Provisional
Probab=36.55  E-value=1.3e+02  Score=27.74  Aligned_cols=63  Identities=16%  Similarity=0.192  Sum_probs=40.9

Q ss_pred             HHHHHHHHhCCCceEEEEeccCCCCCCCC--ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcch
Q 015062           37 GLTKMATIFNGVRNVVGMSLRNELRGPKQ--NVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLS  102 (414)
Q Consensus        37 ~W~~iA~ryk~~pnViG~dL~NEP~~~~~--n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs  102 (414)
                      .|..++.++...-.|+.+|++.  +|...  ...++...++.+.+.|.+.+.+.+++| |-++|+.+.
T Consensus        31 ~~~~~~~~l~~~~~vi~~D~~G--~G~s~~~~~~~~~~~~~d~~~~l~~l~~~~~~lv-GhS~Gg~va   95 (255)
T PRK10673         31 NLGVLARDLVNDHDIIQVDMRN--HGLSPRDPVMNYPAMAQDLLDTLDALQIEKATFI-GHSMGGKAV   95 (255)
T ss_pred             HHHHHHHHHhhCCeEEEECCCC--CCCCCCCCCCCHHHHHHHHHHHHHHcCCCceEEE-EECHHHHHH
Confidence            4677777776667899999986  22111  112456667777777877777765555 777776443


No 56 
>PRK13511 6-phospho-beta-galactosidase; Provisional
Probab=36.38  E-value=1e+02  Score=32.86  Aligned_cols=61  Identities=8%  Similarity=-0.035  Sum_probs=39.1

Q ss_pred             CCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCC-----------C-C--h-------hhHHHHHHHHHHHHH
Q 015062           24 FGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPK-----------Q-N--V-------KDWYRYMQLGAEAVH   82 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~-----------~-n--~-------~dW~~~~~~~~~aIr   82 (414)
                      |-++.. .+.|.+.=+.+++||++...   .=.+|||....           + .  .       ..-..+..+|++++|
T Consensus       129 W~n~~~-v~~F~~YA~~~~~~fgdVk~---W~T~NEP~~~~~~gy~~G~~~Pg~~~~~~~~~~~~hn~llAHa~A~~~~~  204 (469)
T PRK13511        129 WLNREN-IDHFVRYAEFCFEEFPEVKY---WTTFNEIGPIGDGQYLVGKFPPGIKYDLAKVFQSHHNMMVAHARAVKLFK  204 (469)
T ss_pred             CCCHHH-HHHHHHHHHHHHHHhCCCCE---EEEccchhhhhhcchhhcccCCCCCccHHHHHHHHHHHHHHHHHHHHHHH
Confidence            333433 68899999999999999333   35799996321           0 1  1       112234467788899


Q ss_pred             hcCCCc
Q 015062           83 AANPEV   88 (414)
Q Consensus        83 ~~dP~~   88 (414)
                      +..|+.
T Consensus       205 ~~~~~g  210 (469)
T PRK13511        205 DKGYKG  210 (469)
T ss_pred             HhCCCC
Confidence            987764


No 57 
>PF00167 FGF:  Fibroblast growth factor;  InterPro: IPR002348 The interleukin-1 (IL1) and heparin-binding growth factor (HBGF) families share low sequence similarity (about 25% []) but have very similar structures. Coupled with the Kunitz-type soybean trypsin inhibitors (STI), they form a structural superfamily. Despite their structural correspondence, however, they show no sequence similarity to the STI family. The crystal structures of interleukin-1 beta and HBGF1 have been solved, showing both families to have the same 12-stranded beta-sheet structure []; the beta-sheets are arranged in 3 similar lobes around a central axis, 6 strands forming an anti-parallel beta-barrel [, ]. The beta-sheets are generally well preserved and the crystal structures superimpose in these areas. The intervening loops are less well conserved - the loop between beta-strands 6 and 7 is slightly longer in interleukin-1 beta.; GO: 0008083 growth factor activity; PDB: 1AFC_F 1BAR_A 2P39_A 1EV2_D 2BFH_A 4FGF_A 1BAS_A 1BFG_A 1FQ9_B 1CVS_A ....
Probab=36.00  E-value=76  Score=26.97  Aligned_cols=57  Identities=14%  Similarity=0.057  Sum_probs=38.8

Q ss_pred             cceeEeeccCCcccEEeeecCCCCCceEEEecCccEEeee-cCCCceeEEEecCCCceeee
Q 015062          300 AYFCLQAKHVGKPAKLGIICTDCGSTWEIISDSKMHLSSK-ADNGTTVCLDVDSSNTIVTN  359 (414)
Q Consensus       300 ~~~cl~a~~~g~~~~~~~~c~~~~~~W~~~s~s~~~~~~~-~~~~~~lcld~~~~~~ivt~  359 (414)
                      +++.|+...+|.-.-. .+-.++.+.|++.+.+.-.|..+ ...+.+||+|.  .|.+.+.
T Consensus         9 ~~~~L~i~~~g~V~gt-~~~~~~~s~~~i~~~~~g~V~i~~~~s~~YLcmn~--~G~ly~~   66 (122)
T PF00167_consen    9 TGYFLQINPNGTVDGT-GDDNSPYSVFEIHSVGFGVVRIRGVKSCRYLCMNK--CGRLYGS   66 (122)
T ss_dssp             TSEEEEEETTSBEEEE-SSTTSTTGEEEEEEEETTEEEEEETTTTEEEEEBT--TSBEEEE
T ss_pred             CCeEEEECCCCeEeCC-CCcCcceeEEEEEeccceEEEEEEecceEEEEECC--CCeEccc
Confidence            3778888888753222 33357789999988776566666 45578999985  4666553


No 58 
>PF00232 Glyco_hydro_1:  Glycosyl hydrolase family 1;  InterPro: IPR001360 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 1 GH1 from CAZY comprises enzymes with a number of known activities; beta-glucosidase (3.2.1.21 from EC); beta-galactosidase (3.2.1.23 from EC); 6-phospho-beta-galactosidase (3.2.1.85 from EC); 6-phospho-beta-glucosidase (3.2.1.86 from EC); lactase-phlorizin hydrolase (3.2.1.62 from EC), (3.2.1.108 from EC); beta-mannosidase (3.2.1.25 from EC); myrosinase (3.2.1.147 from EC). ; GO: 0004553 hydrolase activity, hydrolyzing O-glycosyl compounds, 0005975 carbohydrate metabolic process; PDB: 1QVB_A 3AHY_D 2E9L_A 2ZOX_A 2JFE_X 2E9M_A 3FIZ_A 3FIY_A 3CMJ_A 3FJ0_A ....
Probab=35.56  E-value=42  Score=35.39  Aligned_cols=66  Identities=9%  Similarity=-0.019  Sum_probs=45.7

Q ss_pred             CCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCC-----------CC--Ch-------hhHHHHHHHHHHHHHh
Q 015062           24 FGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGP-----------KQ--NV-------KDWYRYMQLGAEAVHA   83 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~-----------~~--n~-------~dW~~~~~~~~~aIr~   83 (414)
                      |-++.+ .+.|.+.=+.++++|++.-..  .=.+|||...           .+  +.       ..-..+.-++.+++|+
T Consensus       134 w~~~~~-~~~F~~Ya~~~~~~~gd~V~~--w~T~NEp~~~~~~~y~~g~~~p~~~~~~~~~~~~h~~l~AHa~A~~~~~~  210 (455)
T PF00232_consen  134 WLNRET-VDWFARYAEFVFERFGDRVKY--WITFNEPNVFALLGYLYGGFPPGRDSLKAFYQAAHNLLLAHAKAVKAIKE  210 (455)
T ss_dssp             GGSTHH-HHHHHHHHHHHHHHHTTTBSE--EEEEETHHHHHHHHHTSSSSTTCSSTHHHHHHHHHHHHHHHHHHHHHHHH
T ss_pred             ccCHHH-HHHHHHHHHHHHHHhCCCcce--EEeccccceeeccccccccccccccccchhhHHHhhHHHHHHHHHHHHhh
Confidence            555544 799999999999999996433  3478999542           00  11       2233456778999999


Q ss_pred             cCCCcEEEE
Q 015062           84 ANPEVLVIL   92 (414)
Q Consensus        84 ~dP~~LIiV   92 (414)
                      ..|+..|-+
T Consensus       211 ~~~~~~IGi  219 (455)
T PF00232_consen  211 KYPDGKIGI  219 (455)
T ss_dssp             HTCTSEEEE
T ss_pred             cccceEEec
Confidence            999877643


No 59 
>PRK00865 glutamate racemase; Provisional
Probab=35.42  E-value=1.6e+02  Score=28.52  Aligned_cols=60  Identities=12%  Similarity=0.002  Sum_probs=50.6

Q ss_pred             HHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           35 IKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        35 ~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      +..++.|.+++.+..-++..|..|=|+|.. ..++-..++.++++.+.+.+.+.+||..=.
T Consensus        18 Ltvl~~i~~~lp~~~~iY~~D~~~~PYG~k-s~~~i~~~~~~~~~~L~~~g~d~iVIaCNT   77 (261)
T PRK00865         18 LTVLREIRRLLPDEHIIYVGDTARFPYGEK-SEEEIRERTLEIVEFLLEYGVKMLVIACNT   77 (261)
T ss_pred             HHHHHHHHHHCCCCCEEEEecCCCCCCCCC-CHHHHHHHHHHHHHHHHhCCCCEEEEeCch
Confidence            456889999999998899999999999974 467788999999999999999987776543


No 60 
>PF06229 FRG1:  FRG1-like family;  InterPro: IPR010414 This entry represents Frg1 (FSHD region gene 1), a protein that is considered to be a candidate for facioscapulohumeral muscular dystrophy (FSHD). FSHD is a dominant neuromuscular disorder caused by deletions in a number of tandem repeat units (called D4Z4) located on chromosome 4q35. D4Z4 contains a transcriptional silencer whose deletion causes the over-expression in skeletal muscle of 4q35 genes, including Frg1 [, ]. Frg1 is localised to nucleoli and appears to be a component of the human spliceosome, but its exact function is unknown [].; PDB: 2YUG_A.
Probab=33.90  E-value=99  Score=29.00  Aligned_cols=36  Identities=14%  Similarity=0.243  Sum_probs=21.7

Q ss_pred             CCCCceEEEec-CccEEeeecCCCceeEEEecCCCceee
Q 015062          321 DCGSTWEIISD-SKMHLSSKADNGTTVCLDVDSSNTIVT  358 (414)
Q Consensus       321 ~~~~~W~~~s~-s~~~~~~~~~~~~~lcld~~~~~~ivt  358 (414)
                      ++.|.|..+-- |.-+++++..+|.||+.|.  +|.+++
T Consensus        25 ~p~qV~va~~v~~~~~iafKs~~GkYLs~Dk--~G~v~a   61 (191)
T PF06229_consen   25 DPRQVWVATRVPGDEKIAFKSGHGKYLSCDK--DGIVSA   61 (191)
T ss_dssp             -TTT-EEEEE--SSS-EEEEETTS-BEEE-S--SSBEEE
T ss_pred             ChhHeEEEEEecCCCceEeeccCccEEEEcC--CCcEEE
Confidence            56789977433 4556899999999999885  455444


No 61 
>cd08165 MPP_MPPE1 human MPPE1 and related proteins, metallophosphatase domain. MPPE1 is a functionally uncharacterized metallophosphatase domain-containing protein. The MPPE1 gene is located on chromosome 18 and is a candidate susceptibility gene for Bipolar disorder.  MPPE1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to 
Probab=32.82  E-value=1.1e+02  Score=27.23  Aligned_cols=85  Identities=14%  Similarity=0.135  Sum_probs=44.9

Q ss_pred             CEEEecCCCCCCcccCCCCCCCCCCCCCCCHHH-HHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDGNGFFGDQYFNPDL-WIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAE   79 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dgn~~w~d~~~~~d~-~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~   79 (414)
                      |+|=|.|....        +.+.+-+. ++.+. ..+..+++.++++-.-=|+.=||+++....  ....|..++++..+
T Consensus         1 ~~isD~HL~~~--------~~~~~l~~-~~~~~~~~~~~~~~i~~~~pd~vv~~GDl~~~~~~~--~~~~~~~~~~~~~~   69 (156)
T cd08165           1 MFLADTHLLGS--------ILGHWLDK-LRREWQMERSFQTSLWLLQPDVVFVLGDLFDEGKWS--TDEEWEDYVERFKK   69 (156)
T ss_pred             CccccchhcCC--------cccHHHHH-HhhhHHHHHHHHHHHHhcCCCEEEECCCCCCCCccC--CHHHHHHHHHHHHH
Confidence            78899997432        12222111 12222 222455666666544445666999986542  23456666555544


Q ss_pred             HHHhcCCCcEEEEcCcc
Q 015062           80 AVHAANPEVLVILSGLN   96 (414)
Q Consensus        80 aIr~~dP~~LIiVeG~~   96 (414)
                      ..++...-.+++|.|+-
T Consensus        70 ~~~~~~~~~i~~v~GNH   86 (156)
T cd08165          70 MFGHPPDLPLHVVVGNH   86 (156)
T ss_pred             HhccCCCCeEEEEcCCC
Confidence            33332234577888765


No 62 
>PF06268 Fascin:  Fascin domain;  InterPro: IPR022768  This family consists of several eukaryotic fascin or singed proteins. The fascins are a structurally unique and evolutionarily conserved group of actin cross-linking proteins. Fascins function in the organisation of two major forms of actin-based structures: dynamic, cortical cell protrusions and cytoplasmic microfilament bundles. The cortical structures, which include filopodia, spikes, lamellipodial ribs, oocyte microvilli and the dendrites of dendritic cells, have roles in cell-matrix adhesion, cell interactions and cell migration, whereas the cytoplasmic actin bundles appear to participate in cell architecture []. Dictyostelium hisactophilin, another actin-binding protein, is a submembranous pH sensor that signals slight changes of the H+ concentration to actin by inducing actin polymerisation and binding to microfilaments only at pH values below seven []. Members of this family are histidine rich, typically contain the repeated motif of HHXH []. ; GO: 0030674 protein binding, bridging, 0051015 actin filament binding; PDB: 1DFC_B 3P53_B 3LLP_A 1HCE_A 1HCD_A.
Probab=32.71  E-value=1.7e+02  Score=24.31  Aligned_cols=69  Identities=14%  Similarity=0.128  Sum_probs=44.0

Q ss_pred             CCcccc--CCc-eeeee-ccceeEeeccCCcccEEeeecC-CCCCceEEEecCccEEeeecCCCceeEEEecCCCceee
Q 015062          285 EAWSYT--PHK-TISLK-GAYFCLQAKHVGKPAKLGIICT-DCGSTWEIISDSKMHLSSKADNGTTVCLDVDSSNTIVT  358 (414)
Q Consensus       285 ~~W~~~--~~~-~l~~~-~~~~cl~a~~~g~~~~~~~~c~-~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~~~~ivt  358 (414)
                      +-|+..  ..+ .+.|+ ..+++|.+.++|. +.. ..-+ ++...|++.-.++. +..+..+|.+|+  ++.+|.+.+
T Consensus        25 e~f~le~~~~~~~v~lrs~~GkYls~~~~G~-v~~-~~~~~~~~~~F~i~~~~~~-~~~~~~nGkYl~--~~~~g~l~a   98 (111)
T PF06268_consen   25 ETFQLEFDDGSYKVALRSHNGKYLSVDSDGS-VVA-DSETPGPDEFFEIEWHGGK-VALRASNGKYLS--AGPNGQLKA   98 (111)
T ss_dssp             GSEEEEEETTEEEEEEECTTSEEEEEETTSE-EEE-EESSSSGGGCBEEEEETTE-EEEECTTSCEEE--EETTTEEEE
T ss_pred             EEEEEEEECCCCEEEEEcCCCCEEEEcCCCe-EEe-cCCCCCCCcEEEEEECCCE-EEEECCCCCEEe--eCCCCeEEE
Confidence            566665  222 32344 5789999999986 222 2223 56788888776553 445578899999  556777655


No 63 
>PF10035 DUF2179:  Uncharacterized protein conserved in bacteria (DUF2179);  InterPro: IPR019264  This entry, found mostly in hypothetical bacterial proteins, has no known function. ; PDB: 3HLU_B.
Probab=31.40  E-value=49  Score=24.04  Aligned_cols=23  Identities=9%  Similarity=0.242  Sum_probs=15.2

Q ss_pred             HHHHHHHHHHhcCCCcEEEEcCc
Q 015062           73 YMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        73 ~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      .+.++.+.|+++||+..|.+.-+
T Consensus        28 e~~~l~~~I~~~Dp~AFi~v~~v   50 (55)
T PF10035_consen   28 ELPKLKKIIKEIDPKAFISVSDV   50 (55)
T ss_dssp             HHHHHHHHHHCC-TT-EEEE---
T ss_pred             HHHHHHHHHHHhCCCEEEEEEcc
Confidence            35667789999999999998643


No 64 
>cd07366 3MGA_Dioxygenase Subunit B of the Class III Extradiol ring-cleavage dioxygenase, 3-O-Methylgallate Dioxygenase, which catalyzes the oxidization and subsequent ring-opening of 3-O-Methylgallate. 3-O-Methylgallate Dioxygenase catalyzes the oxidization and subsequent ring-opening of 3-O-Methylgallate (3MGA) between carbons 2 and 3. 3-O-Methylgallate Dioxygenase is a key enzyme in the syringate degradation pathway, in which the syringate is first converted to 3-O-Methylgallate by O-demethylase. This enzyme is a member of the class III extradiol dioxygenase family, a group of enzymes which uses a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. LigAB-like enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. This model represents the catalytic subunit, B.
Probab=29.70  E-value=64  Score=32.78  Aligned_cols=28  Identities=21%  Similarity=0.127  Sum_probs=24.8

Q ss_pred             hhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           68 KDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        68 ~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      ......++++++.|++.+||.+|||+.-
T Consensus        69 ~~~~~a~~~~~~~i~~~~PDvlVIispD   96 (328)
T cd07366          69 ARCQAALDRLADFIRAARIDVAVIVGDD   96 (328)
T ss_pred             HHHHHHHHHHHHHHHHhCCCEEEEEcCc
Confidence            3567899999999999999999999874


No 65 
>PRK13364 protocatechuate 4,5-dioxygenase subunit beta; Provisional
Probab=29.17  E-value=63  Score=32.01  Aligned_cols=30  Identities=17%  Similarity=0.183  Sum_probs=25.9

Q ss_pred             hhHHHHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           68 KDWYRYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        68 ~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      ......++++.+.|++.+||.+|+++....
T Consensus        31 ~~v~~a~~~~~~~v~~~~PDvvVvis~dH~   60 (278)
T PRK13364         31 KPFFDGFPPVREWLEKVKPDVAVVFYNDHG   60 (278)
T ss_pred             HHHHHHHHHHHHHHHHhCCCEEEEECCchH
Confidence            467789999999999999999999985543


No 66 
>cd00058 FGF Acidic and basic fibroblast growth factor family; FGFs are mitogens, which stimulate growth or differentiation of cells of mesodermal or neuroectodermal origin. The family plays essential roles in patterning and differentiation during vertebrate embryogenesis, and has neurotrophic activities. FGFs have a high affinity for heparan sulfate proteoglycans and require heparan sulfate to activate one of four cell surface FGF receptors. Upon binding to FGF, the receptors dimerize and their intracellular tyrosine kinase domains become active. FGFs have internal pseudo-threefold symmetry (beta-trefoil topology).
Probab=28.89  E-value=3.8e+02  Score=23.05  Aligned_cols=55  Identities=16%  Similarity=0.059  Sum_probs=35.2

Q ss_pred             ceeEeeccCCcccEEeeecCCCCCceEEEecCccEEeee-cCCCceeEEEecCCCceee
Q 015062          301 YFCLQAKHVGKPAKLGIICTDCGSTWEIISDSKMHLSSK-ADNGTTVCLDVDSSNTIVT  358 (414)
Q Consensus       301 ~~cl~a~~~g~~~~~~~~c~~~~~~W~~~s~s~~~~~~~-~~~~~~lcld~~~~~~ivt  358 (414)
                      +.-|+.-.+|+ |.-..+-+++.+.|++.|.+...|+.+ ...+.+||.|.  .|.+-+
T Consensus         8 ~~~L~I~~dG~-V~Gt~~~~~~~s~l~~~s~~~g~v~i~~v~s~~YLCmn~--~G~ly~   63 (123)
T cd00058           8 GFHLQILPDGT-VDGTRDDSSSYTILERIAVAVGVVSIKGVASCRYLCMNK--CGKLYG   63 (123)
T ss_pred             CeEEEEcCCCc-EecccCCCCCCceEEEEECCCCEEEEEEcccceEEEECC--CCCEEE
Confidence            34455555555 222233335789999999887777777 55678999985  444444


No 67 
>PLN02814 beta-glucosidase
Probab=28.86  E-value=1.1e+02  Score=33.00  Aligned_cols=67  Identities=16%  Similarity=0.484  Sum_probs=38.6

Q ss_pred             cCC-CEEEeccCcCCCCC----CccchHHHHHHHHHHHH---CC---CcEEEeccCccccccccccCCCceeecccCCCC
Q 015062          158 QGW-PLFVSEFGADLRGN----NVNDNRYLNCFFGVAAE---LD---WDWALWTLVGSYYLREGVIGLNEYYGLFDWNWC  226 (414)
Q Consensus       158 ~g~-Pv~lGEFG~~~~~~----~~~~~~~~~~~l~~l~e---~~---i~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~~dW~  226 (414)
                      ++. |++|+|.|....+.    +.....|++.-++.+.+   .|   .|.++|++---|--.   .+..--|||+--|..
T Consensus       385 Y~~ppI~ITENG~~~~~~g~i~D~~Ri~Yl~~hl~~l~~Ai~dGv~V~GY~~WSllDnfEW~---~Gy~~RfGLvyVD~~  461 (504)
T PLN02814        385 YNNPPIYILENGMPMKHDSTLQDTPRVEFIQAYIGAVLNAIKNGSDTRGYFVWSMIDLYELL---GGYTTSFGMYYVNFS  461 (504)
T ss_pred             cCCCCEEEECCCCCCCCCCcccCHHHHHHHHHHHHHHHHHHHcCCCEEEEeeccchhhhchh---ccccCccceEEECCC
Confidence            444 89999999853321    22234566655544433   45   478999984211111   113445888877776


Q ss_pred             C
Q 015062          227 D  227 (414)
Q Consensus       227 t  227 (414)
                      +
T Consensus       462 ~  462 (504)
T PLN02814        462 D  462 (504)
T ss_pred             C
Confidence            5


No 68 
>TIGR03101 hydr2_PEP hydrolase, ortholog 2, exosortase system type 1 associated. This group of proteins are members of the alpha/beta hydrolase superfamily. These proteins are generally found in genomes containing the exosortase/PEP-CTERM protein expoert system, specifically the type 1 variant of this system described by the Genome Property GenProp0652. When found in this context they are invariably present in the vicinity of a second, relatively unrelated enzyme (ortholog 1, TIGR03100) of the same superfamily.
Probab=28.46  E-value=2.1e+02  Score=28.00  Aligned_cols=68  Identities=16%  Similarity=0.066  Sum_probs=43.0

Q ss_pred             HHHHHHHHHHHHhCC-CceEEEEeccCCC--CCC--CCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcc
Q 015062           33 LWIKGLTKMATIFNG-VRNVVGMSLRNEL--RGP--KQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDL  101 (414)
Q Consensus        33 ~~~~~W~~iA~ryk~-~pnViG~dL~NEP--~~~--~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dL  101 (414)
                      .+.++|..+|+++.. .-+|+.+|++--=  .+.  .....+|...+..+++.+++.+.+. |++=|.+.|.-+
T Consensus        40 ~~~~~~~~la~~La~~Gy~Vl~~Dl~G~G~S~g~~~~~~~~~~~~Dv~~ai~~L~~~~~~~-v~LvG~SmGG~v  112 (266)
T TIGR03101        40 KSRRMVALQARAFAAGGFGVLQIDLYGCGDSAGDFAAARWDVWKEDVAAAYRWLIEQGHPP-VTLWGLRLGALL  112 (266)
T ss_pred             chhHHHHHHHHHHHHCCCEEEEECCCCCCCCCCccccCCHHHHHHHHHHHHHHHHhcCCCC-EEEEEECHHHHH
Confidence            456789999999964 4578889997521  111  1134566666667777777765444 555567776644


No 69 
>TIGR03356 BGL beta-galactosidase.
Probab=28.34  E-value=1.8e+02  Score=30.57  Aligned_cols=67  Identities=19%  Similarity=0.427  Sum_probs=40.0

Q ss_pred             cCC-CEEEeccCcCCCCC-------CccchHHHHHHHHHHHH---CC---CcEEEeccCccccccccccCCCceeecccC
Q 015062          158 QGW-PLFVSEFGADLRGN-------NVNDNRYLNCFFGVAAE---LD---WDWALWTLVGSYYLREGVIGLNEYYGLFDW  223 (414)
Q Consensus       158 ~g~-Pv~lGEFG~~~~~~-------~~~~~~~~~~~l~~l~e---~~---i~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~~  223 (414)
                      ++. |++|+|.|....+.       +.....|++..++.+.+   .|   +|.++|++---|--.+   +..--|||+--
T Consensus       335 Y~~ppi~ITENG~~~~d~~~~g~~~D~~Ri~yl~~hl~~~~~Ai~dGv~v~GY~~Wsl~Dn~ew~~---gy~~rfGl~~V  411 (427)
T TIGR03356       335 YPGPPIYITENGAAFDDEVTDGEVHDPERIAYLRDHLAALARAIEEGVDVRGYFVWSLLDNFEWAE---GYSKRFGLVHV  411 (427)
T ss_pred             cCCCCEEEeCCCCCcCCCCcCCCcCCHHHHHHHHHHHHHHHHHHHCCCCEEEEEecccccccchhc---ccccccceEEE
Confidence            565 89999999864221       22235576665555543   45   4789999854322111   23456888877


Q ss_pred             CCCC
Q 015062          224 NWCD  227 (414)
Q Consensus       224 dW~t  227 (414)
                      |..+
T Consensus       412 D~~~  415 (427)
T TIGR03356       412 DYET  415 (427)
T ss_pred             CCCC
Confidence            7664


No 70 
>PRK13363 protocatechuate 4,5-dioxygenase subunit beta; Provisional
Probab=28.22  E-value=73  Score=32.50  Aligned_cols=29  Identities=21%  Similarity=0.156  Sum_probs=25.8

Q ss_pred             hhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           68 KDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        68 ~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      ......++++++.|++.+||.+|||+.-.
T Consensus        71 ~~~~~a~~~~~~~i~~~~PDvlViispdh   99 (335)
T PRK13363         71 AACEAAIERMRDAIEAARIDVAVIVGNDQ   99 (335)
T ss_pred             HHHHHHHHHHHHHHHHhCCCEEEEEcCCc
Confidence            46788999999999999999999997654


No 71 
>cd07949 PCA_45_Doxase_B_like_1 The B subunit of unknown Class III extradiol dioxygenases with similarity to Protocatechuate 4,5-dioxygenase. This subfamily is composed of proteins of unknown function with similarity to the B subunit of Protocatechuate 4,5-dioxygenase (LigAB). LigAB belongs to the class III extradiol dioxygenase family, a group of enzymes which use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. Dioxygenases play key roles in the degradation of aromatic compounds. LigAB-like enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. This model represents the catalytic subunit, B.
Probab=27.80  E-value=70  Score=31.59  Aligned_cols=29  Identities=17%  Similarity=0.263  Sum_probs=25.6

Q ss_pred             hhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           68 KDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        68 ~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      ......++++++.|++.+|+.+|+|+...
T Consensus        31 ~~~~~a~~~~~~~v~~~~PD~iVvis~dH   59 (276)
T cd07949          31 KPFFDGFPPVHDWLEKAKPDVAVVFYNDH   59 (276)
T ss_pred             HHHHHHHHHHHHHHHHcCCCEEEEECCcH
Confidence            45678999999999999999999998644


No 72 
>KOG3737 consensus Predicted polypeptide N-acetylgalactosaminyltransferase [Posttranslational modification, protein turnover, chaperones]
Probab=27.65  E-value=45  Score=34.85  Aligned_cols=62  Identities=19%  Similarity=0.430  Sum_probs=46.2

Q ss_pred             ceeeccCCCCceeeccCCCCC---Ccccc-CCceeeeeccceeEeeccCCcccEEeeecC--CCCCceEEE
Q 015062          265 LCVQRKSFLDPLTLGPCTESE---AWSYT-PHKTISLKGAYFCLQAKHVGKPAKLGIICT--DCGSTWEII  329 (414)
Q Consensus       265 ~c~~~~~~~~~l~~~~c~~~~---~W~~~-~~~~l~~~~~~~cl~a~~~g~~~~~~~~c~--~~~~~W~~~  329 (414)
                      +|+...+  ..+.+.-|+.++   .|+|. ..+.+.-.-.++||+.-..+..+.|++ |.  +..|+|.+.
T Consensus       531 ~CltAdg--~~i~~~hC~lgtv~g~WqY~~~tk~~~H~~~~kC~~~se~~~qv~l~~-Cd~~~~~Qkw~~k  598 (603)
T KOG3737|consen  531 QCLTADG--SKIMITHCNLGTVKGEWQYFKNTKRFTHIPSGKCLDRSEVLHQVFLSN-CDSSKTTQKWEMK  598 (603)
T ss_pred             eeeecCC--ceEEEEEeecccccCceehhhcchheeeccccccccccchhheeeecc-cCCCchhheeehh
Confidence            3777633  337889999996   89997 444666556889999999999999954 55  456999763


No 73 
>cd02070 corrinoid_protein_B12-BD B12 binding domain of corrinoid proteins. A family of small methanogenic corrinoid proteins that bind methyl-Co(III) 5-hydroxybenzimidazolylcobamide as a cofactor. They play a role on the methanogenesis from trimethylamine, dimethylamine or monomethylamine, which is initiated by a series of corrinoid-dependent methyltransferases.
Probab=27.58  E-value=1.4e+02  Score=27.77  Aligned_cols=45  Identities=20%  Similarity=0.212  Sum_probs=34.5

Q ss_pred             CCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCC--CcEEEEcCccCCCc
Q 015062           47 GVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANP--EVLVILSGLNFDKD  100 (414)
Q Consensus        47 ~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP--~~LIiVeG~~~~~d  100 (414)
                      .+|.+|+++..+.++-         ..+.+.++++|+..|  +..|+|+|.-...+
T Consensus       132 ~~~d~v~lS~~~~~~~---------~~~~~~i~~lr~~~~~~~~~i~vGG~~~~~~  178 (201)
T cd02070         132 HKPDILGLSALMTTTM---------GGMKEVIEALKEAGLRDKVKVMVGGAPVNQE  178 (201)
T ss_pred             cCCCEEEEeccccccH---------HHHHHHHHHHHHCCCCcCCeEEEECCcCCHH
Confidence            4677888887766653         457788899999988  89999999876543


No 74 
>KOG2230 consensus Predicted beta-mannosidase [Carbohydrate transport and metabolism]
Probab=27.40  E-value=1.3e+02  Score=33.16  Aligned_cols=85  Identities=19%  Similarity=0.162  Sum_probs=51.1

Q ss_pred             HHHHHHhCCCceEEEEeccCCCCCC-CC------------ChhhHHHHHHH-HHHHHHhcCCCcEEEEcCccCCCcc---
Q 015062           39 TKMATIFNGVRNVVGMSLRNELRGP-KQ------------NVKDWYRYMQL-GAEAVHAANPEVLVILSGLNFDKDL---  101 (414)
Q Consensus        39 ~~iA~ryk~~pnViG~dL~NEP~~~-~~------------n~~dW~~~~~~-~~~aIr~~dP~~LIiVeG~~~~~dL---  101 (414)
                      ++=|.|.+.+|.|+.|.--||=..+ .+            ...|...+..+ +.+.....+|....|++...-|..-   
T Consensus       424 ~yn~~Rls~HpSviIfsgNNENEaAl~~nWy~~sf~~~~~~~kdyvlly~~~i~el~l~~~~srPfi~SSPsNG~ete~e  503 (867)
T KOG2230|consen  424 RYNAMRLSHHPSVIIFSGNNENEAALVQNWYGTSFERDRFESKDYVLLYANVIHELKLVSHSSRPFIVSSPSNGKETEPE  503 (867)
T ss_pred             HHHHHhhccCCeEEEEeCCCccHHHHHhhhhcccccccchhhhhhhHHHHHHHHHHHhhcCCCCCceecCCCCCcccCcc
Confidence            4567899999999999999997553 11            12344444444 4555566677777888776644321   


Q ss_pred             hhhhcccccccCCCcEEEEEeecCCCC
Q 015062          102 SFVRNQAVNLTFTGKLVFEAHWYGFTD  128 (414)
Q Consensus       102 s~v~~~Pv~l~~~~klVYs~H~Y~p~~  128 (414)
                      ..+..+|-+     +--=.+|+|....
T Consensus       504 ~~VS~NP~d-----n~~GDVHfYdy~~  525 (867)
T KOG2230|consen  504 NYVSSNPQD-----NQNGDVHFYDYTK  525 (867)
T ss_pred             ccccCCCcc-----ccCCceEeeehhh
Confidence            233344432     2223579997543


No 75 
>PF06838 Met_gamma_lyase:  Methionine gamma-lyase ;  InterPro: IPR009651 This family represents the aluminium resistance protein, which confers resistance to aluminium in bacteria [].; PDB: 3JZL_A 3I16_C 3GWP_A 3FD0_B 3HT4_F.
Probab=27.29  E-value=1.2e+02  Score=31.66  Aligned_cols=54  Identities=13%  Similarity=0.130  Sum_probs=33.0

Q ss_pred             HHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcC
Q 015062           38 LTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSG   94 (414)
Q Consensus        38 W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG   94 (414)
                      |+.|++..+.+.-++.+   =--++...-..-=..-++++++.||+++|+.+|||.-
T Consensus       144 ~~~i~~~~~~~tk~v~I---QRSrGYs~R~sl~i~~I~~~i~~vk~~~p~~iifVDN  197 (403)
T PF06838_consen  144 WEAIKKALKPNTKMVLI---QRSRGYSWRPSLTIEEIKEIIKFVKEINPDVIIFVDN  197 (403)
T ss_dssp             HHHHHHHHHTTEEEEEE---E-S-TTSSS----HHHHHHHHHHHHHH-TTSEEEEE-
T ss_pred             HHHHHHhhccCceEEEE---ecCCCCCCCCCCCHHHHHHHHHHHHhhCCCeEEEEeC
Confidence            67788888876666632   2333431111112356788999999999999999964


No 76 
>TIGR02026 BchE magnesium-protoporphyrin IX monomethyl ester anaerobic oxidative cyclase. This model respresents the cobalamin-dependent oxidative cyclase responsible for forming the distinctive E-ring of the chlorin ring system under anaerobic conditions. This step is essential in the biosynthesis of both bacteriochlorophyll and chlorophyll under anaerobic conditions (a separate enzyme, AcsF, acts under aerobic conditions). This model identifies two clades of sequences, one from photosynthetic, non-cyanobacterial bacteria and another including Synechocystis and several non-photosynthetic bacteria. The function of the Synechocystis gene is supported by gene clustering with other photosynthetic genes, so the purpose of the gene in the non-photosynthetic bacteria is uncertain. Note that homologs of this gene are not found in plants which rely solely on the aerobic cyclase.
Probab=26.61  E-value=1.2e+02  Score=32.38  Aligned_cols=26  Identities=12%  Similarity=0.183  Sum_probs=22.6

Q ss_pred             HHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           72 RYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        72 ~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      ..+.++++.||+.+|+..|+++|..-
T Consensus        77 ~~a~~~~~~~k~~~P~~~iV~GG~h~  102 (497)
T TIGR02026        77 YIACETLKFARERLPNAIIVLGGIHP  102 (497)
T ss_pred             HHHHHHHHHHHHHCCCCEEEEcCCCc
Confidence            45678889999999999999999864


No 77 
>PRK09593 arb 6-phospho-beta-glucosidase; Reviewed
Probab=26.51  E-value=2.1e+02  Score=30.58  Aligned_cols=63  Identities=13%  Similarity=0.128  Sum_probs=39.6

Q ss_pred             CCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCC-----C--------C-Ch--------hhHHHHHHHHHHHH
Q 015062           24 FGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGP-----K--------Q-NV--------KDWYRYMQLGAEAV   81 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~-----~--------~-n~--------~dW~~~~~~~~~aI   81 (414)
                      |-++.. .+.|.+.=+.+++||++.=..  .=.+|||...     .        + +.        ..-..+.-+|++++
T Consensus       150 W~n~~~-v~~F~~YA~~~~~~fgdrVk~--WiT~NEP~~~~~~~~~~~g~~~~~g~~~~~~~~~a~h~~llAHa~A~~~~  226 (478)
T PRK09593        150 WRNRKM-VGFYERLCRTLFTRYKGLVKY--WLTFNEINMILHAPFMGAGLYFEEGENKEQVKYQAAHHELVASAIATKIA  226 (478)
T ss_pred             CCChHH-HHHHHHHHHHHHHHhcCcCCE--EEeecchhhhhcccccccCcccCCCCchhhhHHHHHHHHHHHHHHHHHHH
Confidence            444434 688999999999999985222  2367888521     0        0 10        11223446788899


Q ss_pred             HhcCCCcE
Q 015062           82 HAANPEVL   89 (414)
Q Consensus        82 r~~dP~~L   89 (414)
                      |+..|+.-
T Consensus       227 ~~~~~~g~  234 (478)
T PRK09593        227 HEVDPENK  234 (478)
T ss_pred             HHhCCCCe
Confidence            99888743


No 78 
>TIGR00067 glut_race glutamate racemase. The most closely related proteins differing in function are aspartate racemases.
Probab=26.28  E-value=2.9e+02  Score=26.72  Aligned_cols=61  Identities=11%  Similarity=0.034  Sum_probs=50.7

Q ss_pred             HHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHH-hcCCCcEEEEcCcc
Q 015062           35 IKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVH-AANPEVLVILSGLN   96 (414)
Q Consensus        35 ~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr-~~dP~~LIiVeG~~   96 (414)
                      +..++.|.+++.+..-|+-.|-.|=|+|.+ ..+.-..++.++++... +.+.+.+||..-+-
T Consensus        11 ltv~~~l~~~~p~~~~iy~~D~~~~PYG~k-s~~~i~~~~~~~~~~L~~~~g~d~ivIaCNTA   72 (251)
T TIGR00067        11 LSVLKEIRKQLPKEHYIYVGDTKRFPYGEK-SPEFILEYVLELLTFLKERHNIKLLVVACNTA   72 (251)
T ss_pred             HHHHHHHHHHCCCCCEEEEecCCCCCCCCC-CHHHHHHHHHHHHHHHHHhCCCCEEEEeCchH
Confidence            346788999998887788899999999985 45678889999999999 99999888876544


No 79 
>PLN02998 beta-glucosidase
Probab=26.25  E-value=1.5e+02  Score=31.96  Aligned_cols=77  Identities=18%  Similarity=0.369  Sum_probs=42.8

Q ss_pred             HHHHHHHHHh-cCC-CEEEeccCcCCCC-C---CccchHHHHHHHHHHHH---CC---CcEEEeccCccccccccccCCC
Q 015062          148 VMRLSGFLLE-QGW-PLFVSEFGADLRG-N---NVNDNRYLNCFFGVAAE---LD---WDWALWTLVGSYYLREGVIGLN  215 (414)
Q Consensus       148 ~~~~~gfl~~-~g~-Pv~lGEFG~~~~~-~---~~~~~~~~~~~l~~l~e---~~---i~Wa~Wa~~Gsyy~r~g~~~~~  215 (414)
                      ++....++.+ ++. |++|+|-|....+ .   +..+..|++.-++.+.+   .|   +|.++|++---|--.   .+..
T Consensus       379 l~~~L~~~~~rY~~ppI~ITENG~~~~~~g~v~D~~Ri~Yl~~hl~~~~kAi~dGv~V~GY~~WSl~DnfEW~---~Gy~  455 (497)
T PLN02998        379 LQQILLYVKETYGNPPVYILENGQMTPHSSSLVDTTRVKYLSSYIKAVLHSLRKGSDVKGYFQWSLMDVFELF---GGYE  455 (497)
T ss_pred             HHHHHHHHHHHcCCCCEEEeCCCCccCCCCcccCHHHHHHHHHHHHHHHHHHHcCCCEEEEeeccchhhhchh---cccc
Confidence            3333334433 555 7999999986432 1   22234566555544443   44   478999984211111   1234


Q ss_pred             ceeecccCCCCC
Q 015062          216 EYYGLFDWNWCD  227 (414)
Q Consensus       216 et~Gll~~dW~t  227 (414)
                      .-|||+--|..+
T Consensus       456 ~RfGLv~VD~~~  467 (497)
T PLN02998        456 RSFGLLYVDFKD  467 (497)
T ss_pred             CccceEEECCCC
Confidence            458998888765


No 80 
>PRK09852 cryptic 6-phospho-beta-glucosidase; Provisional
Probab=26.01  E-value=1.6e+02  Score=31.41  Aligned_cols=78  Identities=17%  Similarity=0.259  Sum_probs=43.4

Q ss_pred             HHHHHHHHHh-cCCCEEEeccCcCCCCC--------CccchHHHHHHHHHHHH---CC---CcEEEeccCcccccccccc
Q 015062          148 VMRLSGFLLE-QGWPLFVSEFGADLRGN--------NVNDNRYLNCFFGVAAE---LD---WDWALWTLVGSYYLREGVI  212 (414)
Q Consensus       148 ~~~~~gfl~~-~g~Pv~lGEFG~~~~~~--------~~~~~~~~~~~l~~l~e---~~---i~Wa~Wa~~Gsyy~r~g~~  212 (414)
                      ++....++.+ ++.|++|+|-|....+.        +.....|++.-+..+.+   .|   .|.++|++---|--..|  
T Consensus       353 l~~~l~~~~~~Y~~Pi~ItENG~~~~d~~~~~g~i~D~~Ri~Yl~~hl~~~~~Ai~dGv~V~GY~~WSl~Dn~Ew~~G--  430 (474)
T PRK09852        353 LRITMNMMYDRYQKPLFLVENGLGAKDEIAANGEINDDYRISYLREHIRAMGEAIADGIPLMGYTTWGCIDLVSASTG--  430 (474)
T ss_pred             HHHHHHHHHHhcCCCEEEeCCCCCCCCCcCCCCccCCHHHHHHHHHHHHHHHHHHHCCCCEEEEEeecccccccccCC--
Confidence            3333334433 77899999999864321        11234565555444433   45   47899998532211111  


Q ss_pred             CCCceeecccCCCCC
Q 015062          213 GLNEYYGLFDWNWCD  227 (414)
Q Consensus       213 ~~~et~Gll~~dW~t  227 (414)
                      ....-|||+--|..+
T Consensus       431 ~y~~RfGLv~VD~~~  445 (474)
T PRK09852        431 EMSKRYGFVYVDRDD  445 (474)
T ss_pred             CccceeeeEEECCCC
Confidence            023468998888765


No 81 
>KOG1959 consensus Glycosyl hydrolase, family 38 - alpha-mannosidase [Carbohydrate transport and metabolism]
Probab=25.66  E-value=6.2e+02  Score=29.36  Aligned_cols=87  Identities=23%  Similarity=0.353  Sum_probs=54.4

Q ss_pred             EEecCCCCC-Ccc----cCCC---CCCCCCCC-CCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCC---CChhhH
Q 015062            3 ILDNHISKP-GWC----CSNS---DGNGFFGD-QYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPK---QNVKDW   70 (414)
Q Consensus         3 ILD~H~~~p-~wc----c~~~---dgn~~w~d-~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~---~n~~dW   70 (414)
                      ||++|-..| |+|    |...   |+...++. -..-.++|++.=+..|+.|+.+--++       |.|..   .++..|
T Consensus       229 ~l~n~Y~~P~gfc~dv~c~d~Pi~D~~~~~d~NVkerVd~Fv~~a~~~a~~~RtnHim~-------~MG~DFqY~~A~v~  301 (996)
T KOG1959|consen  229 ALYNHYSPPPGFCFDVLCGDDPIIDGPRSYDYNVKERVDDFVAYAKNQAAYYRTNHIMW-------PMGDDFQYENANVW  301 (996)
T ss_pred             ccccCCCCCCCceeccccCCCCCCCCCCCCCccHHHHHHHHHHHHHHhHhheecceEEE-------eccCCceehhhhHH
Confidence            577787665 777    3221   22212221 11124788888888899998764433       55542   367889


Q ss_pred             HHHHHHHHHHHHhc---CCCcEEEEcCcc
Q 015062           71 YRYMQLGAEAVHAA---NPEVLVILSGLN   96 (414)
Q Consensus        71 ~~~~~~~~~aIr~~---dP~~LIiVeG~~   96 (414)
                      ++-|.++++-|.+-   ..+.-|+.+.+.
T Consensus       302 fknmDkLI~yVN~~qa~gs~vnv~YSTps  330 (996)
T KOG1959|consen  302 FKNMDKLIKYVNERQADGSKVNVFYSTPS  330 (996)
T ss_pred             HhhHHHHHHHhhhhhcCCceEEEEEcChH
Confidence            99999999998733   346677776654


No 82 
>COG5111 RPC34 DNA-directed RNA polymerase III, subunit C34 [Transcription]
Probab=25.20  E-value=1e+02  Score=29.93  Aligned_cols=75  Identities=15%  Similarity=0.103  Sum_probs=42.0

Q ss_pred             CEEEecCCCCCCcccCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCC---CceEEEEeccCCCCCCCCChhhHHHHHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDGNGFFGDQYFNPDLWIKGLTKMATIFNG---VRNVVGMSLRNELRGPKQNVKDWYRYMQLG   77 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dgn~~w~d~~~~~d~~~~~W~~iA~ryk~---~pnViG~dL~NEP~~~~~n~~dW~~~~~~~   77 (414)
                      |++.|+.-+.      ...|..||.|...|. +|++-+.+|..||-.   -|+-   .--|+|.--++..-.=|.-.+++
T Consensus       145 YmLYdlvPS~------eiTGGpWFtD~elDv-Efi~~ll~ii~rf~~~n~fp~k---n~~~gpnv~~~P~y~~ypT~~~I  214 (301)
T COG5111         145 YMLYDLVPSE------EITGGPWFTDNELDV-EFIARLLEIIERFLEKNLFPRK---NFEEGPNVFYAPKYEDYPTLEDI  214 (301)
T ss_pred             EEEecccccc------cccCCCccccCcccH-HHHHHHHHHHHHHHHhccCCcc---chhcCCccccCCccCCCccHHHH
Confidence            5666766443      346889999999986 566767788888832   3331   11244422111000112345566


Q ss_pred             HHHHHhcC
Q 015062           78 AEAVHAAN   85 (414)
Q Consensus        78 ~~aIr~~d   85 (414)
                      .+-||+++
T Consensus       215 ~n~vr~~n  222 (301)
T COG5111         215 MNYVRNVN  222 (301)
T ss_pred             HHHHHhce
Confidence            67777765


No 83 
>PF00975 Thioesterase:  Thioesterase domain;  InterPro: IPR001031 Thioesterase domains often occur integrated in or associated with peptide synthetases which are involved in the non-ribosomal synthesis of peptide antibiotics []. Thioesterases are required for the addition of the last amino acid to the peptide antibiotic, thereby forming a cyclic antibiotic. Next to the operons encoding these enzymes, in almost all cases, are genes that encode proteins that have similarity to the type II fatty acid thioesterases of vertebrates.; GO: 0016788 hydrolase activity, acting on ester bonds, 0009058 biosynthetic process; PDB: 2RON_A 2K2Q_B 3LCR_B 2HFJ_B 1MNQ_A 1MN6_B 1MNA_B 2HFK_B 2H7Y_B 2H7X_A ....
Probab=25.03  E-value=67  Score=29.43  Aligned_cols=68  Identities=21%  Similarity=0.188  Sum_probs=52.2

Q ss_pred             HHHHHHHhCCC-ceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcchhhhc
Q 015062           38 LTKMATIFNGV-RNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDLSFVRN  106 (414)
Q Consensus        38 W~~iA~ryk~~-pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dLs~v~~  106 (414)
                      ...+|+..++. -.|+|++.-...... ....++...+.+.+++|++..|+.-+++-|-++|+-|..-..
T Consensus        16 y~~la~~l~~~~~~v~~i~~~~~~~~~-~~~~si~~la~~y~~~I~~~~~~gp~~L~G~S~Gg~lA~E~A   84 (229)
T PF00975_consen   16 YRPLARALPDDVIGVYGIEYPGRGDDE-PPPDSIEELASRYAEAIRARQPEGPYVLAGWSFGGILAFEMA   84 (229)
T ss_dssp             GHHHHHHHTTTEEEEEEECSTTSCTTS-HEESSHHHHHHHHHHHHHHHTSSSSEEEEEETHHHHHHHHHH
T ss_pred             HHHHHHhCCCCeEEEEEEecCCCCCCC-CCCCCHHHHHHHHHHHhhhhCCCCCeeehccCccHHHHHHHH
Confidence            47889999997 889999876664111 112468889999999999999998888889998886655433


No 84 
>PLN02899 alpha-galactosidase
Probab=24.69  E-value=53  Score=36.21  Aligned_cols=63  Identities=22%  Similarity=0.433  Sum_probs=41.6

Q ss_pred             cceeEeeccCCcc----cEEe--eecC-CCCCceEEEecCccEEeeecCCCceeEEEecC-CCceee---eeeeEeCCC
Q 015062          300 AYFCLQAKHVGKP----AKLG--IICT-DCGSTWEIISDSKMHLSSKADNGTTVCLDVDS-SNTIVT---NTCKCLSRD  367 (414)
Q Consensus       300 ~~~cl~a~~~g~~----~~~~--~~c~-~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~-~~~ivt---~~c~c~~~~  367 (414)
                      ..+||+|-...+.    .+.+  -.|. .++|-||+..+++|+     +.-++||.-|.. ...+++   +..+-...+
T Consensus       486 ~~~c~~~~~~~~~~~~~~~~~~fs~c~~~~~q~w~l~~~g~l~-----~~~sglca~v~~~~~~~~~~~~r~w~a~g~~  559 (633)
T PLN02899        486 GELCLDASPKQKRTSKDFRSGSFSPCRWDANQMWELNNNGTLI-----SSYSGLCATVNSVVAEVATGGVRSWIATGRK  559 (633)
T ss_pred             cChhhccCCCCCcCHhHhhccccCCCCCChhhceeeCCCCCEe-----cCccccceEeeccccccccCceeEEEEcCCC
Confidence            4467777765332    2222  3588 889999999999975     235899999984 334433   666655443


No 85 
>cd07384 MPP_Cdc1_like Saccharomyces cerevisiae CDC1 and related proteins, metallophosphatase domain. Cdc1 (also known as XlCdc1 in Xenopus laevis) is an endoplasmic reticulum-localized transmembrane lipid phosphatase with a metallophosphatase domain facing the ER lumen.  In budding yeast, the gene encoding CDC1 is essential while nonlethal mutations cause defects in Golgi inheritance and actin polarization.  Cdc1 mutant cells accumulate an unidentified phospholipid, suggesting that Cdc1 is a lipid phosphatase.  Cdc1 mutant cells also have highly elevated intracellular calcium levels suggesting a possible role for Cdc1 in calcium regulation.  The 5' flanking region of Cdc1 is a regulatory region with conserved binding site motifs for AP1, AP2, Sp1, NF-1 and CREB.  DNA polymerase delta consists of at least four subunits - Pol3, Cdc1, Cdc27, and Cdm1.  This group also contains Saccharomyces cerevisiae TED1 (Trafficking of Emp24p/Erv25p-dependent cargo disrupted 1), which acts together wit
Probab=24.49  E-value=2.4e+02  Score=25.40  Aligned_cols=90  Identities=8%  Similarity=0.061  Sum_probs=52.7

Q ss_pred             CEEEecCCCCCCcccCCCCCCCC-C--CCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHH
Q 015062            1 MVILDNHISKPGWCCSNSDGNGF-F--GDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLG   77 (414)
Q Consensus         1 ~VILD~H~~~p~wcc~~~dgn~~-w--~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~   77 (414)
                      ++|-|.|.-++.    .....++ +  -.+.++.....+.|..+.++++=.--|+.=||+.+....  ....|..+.++.
T Consensus         1 llvaDpql~~~~----~~~~~~~~~~~~~p~~~d~~~~~~~~~~i~~~~pd~vi~lGDl~d~~~~~--~~~~~~~~~~~~   74 (171)
T cd07384           1 LLVADPQILDET----SYPPRPKIALRLTRFYTDAYMRRAFKTALQRLKPDVVLFLGDLFDGGRIA--DSEEWEEYVKRF   74 (171)
T ss_pred             CcccCccccCCC----CCCCCchhhhHHHHHhHHHHHHHHHHHHHHhcCCCEEEEeccccCCcEeC--CHHHHHHHHHHH
Confidence            357788887752    1122232 1  123444455666777777777655556666999886653  234576666655


Q ss_pred             HHHHHhcC----CCcEEEEcCcc
Q 015062           78 AEAVHAAN----PEVLVILSGLN   96 (414)
Q Consensus        78 ~~aIr~~d----P~~LIiVeG~~   96 (414)
                      .+..+...    .--+++|.|+-
T Consensus        75 ~~~~~~~~~~~~~~~~~~v~GNH   97 (171)
T cd07384          75 KKIFFLPSNGLEDIPVYYVPGNH   97 (171)
T ss_pred             HHHhcccccccCCceEEEECCcc
Confidence            55444333    34578888876


No 86 
>cd08163 MPP_Cdc1 Saccharomyces cerevisiae CDC1 and related proteins, metallophosphatase domain. Cdc1 (also known as XlCdc1 in Xenopus laevis) is an endoplasmic reticulum-localized transmembrane lipid phosphatase with a metallophosphatase domain facing the ER lumen.  In budding yeast, the gene encoding CDC1 is essential while nonlethal mutations cause defects in Golgi inheritance and actin polarization.  Cdc1 mutant cells accumulate an unidentified phospholipid, suggesting that Cdc1 is a lipid phosphatase.  Cdc1 mutant cells also have highly elevated intracellular calcium levels suggesting a possible role for Cdc1 in calcium regulation.  The 5' flanking region of Cdc1 is a regulatory region with conserved binding site motifs for AP1, AP2, Sp1, NF-1 and CREB.  DNA polymerase delta consists of at least four subunits - Pol3, Cdc1, Cdc27, and Cdm1.  Cdc1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site 
Probab=24.48  E-value=2.6e+02  Score=27.15  Aligned_cols=61  Identities=10%  Similarity=0.009  Sum_probs=36.5

Q ss_pred             HHHHHHHHHHHHhCCCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCC-CcEEEEcCc
Q 015062           33 LWIKGLTKMATIFNGVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANP-EVLVILSGL   95 (414)
Q Consensus        33 ~~~~~W~~iA~ryk~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP-~~LIiVeG~   95 (414)
                      ...+.|+.+.++.+=.--|+.=||+++-+.  .+...|...+++..+..++... .-++.|-|+
T Consensus        32 ylr~~~~~~~~~l~PD~vv~lGDL~d~G~~--~~~~~~~~~~~rf~~i~~~~~~~~pv~~VpGN   93 (257)
T cd08163          32 YLRRNWRYMQKQLKPDSTIFLGDLFDGGRD--WADEYWKKEYNRFMRIFDPSPGRKMVESLPGN   93 (257)
T ss_pred             HHHHHHHHHHHhcCCCEEEEecccccCCee--CcHHHHHHHHHHHHHHhcCCCccceEEEeCCC
Confidence            345678888877764444555699998432  2446788777776666554321 234455554


No 87 
>PLN02748 tRNA dimethylallyltransferase
Probab=24.44  E-value=1.6e+02  Score=31.46  Aligned_cols=31  Identities=26%  Similarity=0.321  Sum_probs=27.0

Q ss_pred             ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           66 NVKDWYRYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        66 n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      +..+|...+.++++.|++-+ ...|+|+|+++
T Consensus        92 sv~~F~~~A~~~I~~I~~rg-k~PIlVGGTgl  122 (468)
T PLN02748         92 TAKDFRDHAVPLIEEILSRN-GLPVIVGGTNY  122 (468)
T ss_pred             cHHHHHHHHHHHHHHHHhcC-CCeEEEcChHH
Confidence            56899999999999998876 68999999985


No 88 
>cd01828 sialate_O-acetylesterase_like2 sialate_O-acetylesterase_like subfamily of the SGNH-hydrolases, a diverse family of lipases and esterases. The tertiary fold of the enzyme is substantially different from that of the alpha/beta hydrolase family and unique among all known hydrolases; its active site closely resembles the Ser-His-Asp(Glu) triad found in other serine hydrolases.
Probab=24.28  E-value=3.9e+02  Score=23.12  Aligned_cols=49  Identities=10%  Similarity=0.111  Sum_probs=31.7

Q ss_pred             CCCceEEEEec-cCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           46 NGVRNVVGMSL-RNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        46 k~~pnViG~dL-~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      ...|.++.+.+ .|..... .+...+.+.++++++++|+.+|+..|++-++
T Consensus        46 ~~~pd~vvl~~G~ND~~~~-~~~~~~~~~l~~li~~~~~~~~~~~vi~~~~   95 (169)
T cd01828          46 ALQPKAIFIMIGINDLAQG-TSDEDIVANYRTILEKLRKHFPNIKIVVQSI   95 (169)
T ss_pred             ccCCCEEEEEeeccCCCCC-CCHHHHHHHHHHHHHHHHHHCCCCeEEEEec
Confidence            44566444433 5665432 2457788888888888888887777777543


No 89 
>PLN02849 beta-glucosidase
Probab=24.05  E-value=2.4e+02  Score=30.45  Aligned_cols=67  Identities=22%  Similarity=0.561  Sum_probs=39.5

Q ss_pred             cCC-CEEEeccCcCCCCC------CccchHHHHHHHHHHHH---CC---CcEEEeccCccccccccccCCCceeecccCC
Q 015062          158 QGW-PLFVSEFGADLRGN------NVNDNRYLNCFFGVAAE---LD---WDWALWTLVGSYYLREGVIGLNEYYGLFDWN  224 (414)
Q Consensus       158 ~g~-Pv~lGEFG~~~~~~------~~~~~~~~~~~l~~l~e---~~---i~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~~d  224 (414)
                      ++. ||+|+|-|....+.      +.....|++.-+..+.+   .|   .|.++|++---|--.+   +..--|||+--|
T Consensus       383 Y~~pPi~ITENG~~~~d~~~~~v~D~~Ri~Yl~~hL~~l~~Ai~dGv~V~GY~~WSl~DnfEW~~---Gy~~RfGLi~VD  459 (503)
T PLN02849        383 YGNPPVYILENGTPMKQDLQLQQKDTPRIEYLHAYIGAVLKAVRNGSDTRGYFVWSFMDLYELLK---GYEFSFGLYSVN  459 (503)
T ss_pred             cCCCCEEEeCCCCCccCCCCCcccCHHHHHHHHHHHHHHHHHHHcCCCEEEEeeccchhhhchhc---cccCccceEEEC
Confidence            555 79999999864321      12234566555554443   45   4789999843221111   234568998887


Q ss_pred             CCC
Q 015062          225 WCD  227 (414)
Q Consensus       225 W~t  227 (414)
                      ..+
T Consensus       460 ~~~  462 (503)
T PLN02849        460 FSD  462 (503)
T ss_pred             CCC
Confidence            765


No 90 
>cd01833 XynB_like SGNH_hydrolase subfamily, similar to Ruminococcus flavefaciens XynB. Most likely a secreted hydrolase with xylanase activity. SGNH hydrolases are a diverse family of lipases and esterases. The tertiary fold of the enzyme is substantially different from that of the alpha/beta hydrolase family and unique among all known hydrolases; its active site closely resembles the Ser-His-Asp(Glu) triad found in other serine hydrolases.
Probab=23.94  E-value=3.6e+02  Score=23.00  Aligned_cols=68  Identities=21%  Similarity=0.168  Sum_probs=42.5

Q ss_pred             CCCCCCCCCHHHHHHHHHHHHHHhCCCceEEEEe-ccCCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCc
Q 015062           22 GFFGDQYFNPDLWIKGLTKMATIFNGVRNVVGMS-LRNELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGL   95 (414)
Q Consensus        22 ~~w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~d-L~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~   95 (414)
                      ++-|..   ...+.+.+......  ..|.++.+- =.|+.... .....+...+++.++.||+..|+..|++-+.
T Consensus        19 g~~G~~---~~~~~~~~~~~~~~--~~pd~vvi~~G~ND~~~~-~~~~~~~~~~~~~i~~i~~~~p~~~ii~~~~   87 (157)
T cd01833          19 GHSGYL---IDQIAAAAADWVLA--AKPDVVLLHLGTNDLVLN-RDPDTAPDRLRALIDQMRAANPDVKIIVATL   87 (157)
T ss_pred             CCCCcc---HHHHHHHhhhcccc--CCCCEEEEeccCcccccC-CCHHHHHHHHHHHHHHHHHhCCCeEEEEEeC
Confidence            444433   44555555433332  356644443 35665432 2457888999999999999999988887543


No 91 
>PF15016 DUF4520:  Domain of unknown function (DUF4520)
Probab=23.88  E-value=2.6e+02  Score=22.79  Aligned_cols=57  Identities=18%  Similarity=0.085  Sum_probs=39.8

Q ss_pred             ccEEeeecCCCCCceEEEecCccEEeeecCCCceeEEEecCCCceeeeeeeEeCCCCCC
Q 015062          312 PAKLGIICTDCGSTWEIISDSKMHLSSKADNGTTVCLDVDSSNTIVTNTCKCLSRDKTC  370 (414)
Q Consensus       312 ~~~~~~~c~~~~~~W~~~s~s~~~~~~~~~~~~~lcld~~~~~~ivt~~c~c~~~~~~c  370 (414)
                      |+.+....-..-.+..-.||++.|+-+.+  ++.|-|.-+-+..+-..-|+|+.-|..+
T Consensus         4 ~vv~~e~~i~~~GrF~AysDgrVr~~F~D--rt~L~l~~~~~~~~~~~~c~l~~pDG~~   60 (85)
T PF15016_consen    4 PVVLEESSIPGVGRFTAYSDGRVRVHFDD--RTILTLIWNFSSREELGWCKLTFPDGQQ   60 (85)
T ss_pred             ceeEEEEecCCceEEEEEcCCeEEEEEcC--CCEEEEEeCCCCcccCCEEEEEccCCCE
Confidence            34443333344577888999999988875  6777777765666656789998777655


No 92 
>smart00442 FGF Acidic and basic fibroblast growth factor family. Mitogens that stimulate growth or differentiation of cells of mesodermal or neuroectodermal origin. The family play essential roles in patterning and differentiation during vertebrate embryogenesis, and have neurotrophic activities.
Probab=23.76  E-value=1.4e+02  Score=25.80  Aligned_cols=62  Identities=16%  Similarity=0.061  Sum_probs=38.2

Q ss_pred             eeEeeccCCcccEEeeecCCCCCceEEEecCccEEeee-cCCCceeEEEecC---CCceeeeeeeEe
Q 015062          302 FCLQAKHVGKPAKLGIICTDCGSTWEIISDSKMHLSSK-ADNGTTVCLDVDS---SNTIVTNTCKCL  364 (414)
Q Consensus       302 ~cl~a~~~g~~~~~~~~c~~~~~~W~~~s~s~~~~~~~-~~~~~~lcld~~~---~~~ivt~~c~c~  364 (414)
                      .-|+.-.+|.. .-..+-+++.+.|++.|.+...|..+ ...+.+||+|...   .....+..|...
T Consensus        13 ~~L~I~~~G~V-~Gt~~~~~~~~ile~~s~~~g~V~ik~~~s~~YLCmn~~G~ly~s~~~~~dC~F~   78 (126)
T smart00442       13 QHLQILPDGTV-DGTRDESSSFTILEIIAVAVGVVAIKGVASCRYLCMNKCGKLYGSKNFTEDCVFR   78 (126)
T ss_pred             eEEEEcCCceE-ecccCCCCcceEEEEEeccCCEEEEEEcccceEEEECCCCCEEEcccCCCCcEEE
Confidence            44666656542 22233346789999999876666666 5667899998863   123344556654


No 93 
>cd07950 Gallate_Doxase_N The N-terminal domain of the Class III extradiol dioxygenase, Gallate Dioxygenase, which catalyzes the oxidization and subsequent ring-opening of gallate. Gallate Dioxygenase catalyzes the oxidization and subsequent ring-opening of gallate, an intermediate in the degradation of the aromatic compound, syringate. The reaction product of gallate dioxygenase is 4-oxalomesaconate. The amino acid sequence of the N-terminal and C-terminal regions of gallate dioxygenase exhibits homology with the sequence of PCA 4,5-dioxygenase B (catalytic) and A subunits, respectively. The enzyme is estimated to be a homodimer according to the Escherichia coli enzyme. LigAB-like enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. In this subfamily, the subunits A and B are fused to make a single polypeptide chain. The dimer interface for this subfamily may resemble the tetramer interface of classical LigAB en
Probab=23.67  E-value=92  Score=30.75  Aligned_cols=29  Identities=10%  Similarity=0.127  Sum_probs=25.2

Q ss_pred             hhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           68 KDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        68 ~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      ......++++++.|++.+||.+|+++...
T Consensus        31 ~~~~~a~~~~~~~i~~~~PD~iVvi~~dH   59 (277)
T cd07950          31 APIFDGYEPVKQWLAEQKPDVLFMVYNDH   59 (277)
T ss_pred             HHHHHHHHHHHHHHHHhCCCEEEEEcCcH
Confidence            46778999999999999999999998543


No 94 
>cd07372 2A5CPDO_B The beta subunit of the Class III extradiol dioxygenase, 2-amino-5-chlorophenol 1,6-dioxygenase, which catalyzes the oxidization and subsequent ring-opening of 2-amino-5-chlorophenol. 2-amino-5-chlorophenol 1,6-dioxygenase (2A5CPDO), catalyzes the oxidization and subsequent ring-opening of 2-amino-5-chlorophenol, which is an intermediate during p-chloronitrobenzene degradation. This enzyme is a member of the class III extradiol dioxygenase family, a group of enzymes which use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. The active 2A5CPDO enzyme is probably a heterotetramer, composed of two alpha and two beta subunits. The alpha and beta subunits share significant sequence similarity and may have evolved by gene duplication. This model describes the beta subunit, which contains a putative metal binding site with two conserved histidines; these residues are equivalent to two out of three Fe(II) bindin
Probab=23.59  E-value=97  Score=30.93  Aligned_cols=30  Identities=20%  Similarity=0.206  Sum_probs=25.9

Q ss_pred             hhhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           67 VKDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        67 ~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      +......++++++.|++..|+.+|+++.-.
T Consensus        32 ~~~~~~a~~~~~~~i~~~~Pd~IVViSpHw   61 (294)
T cd07372          32 WEQLRWAYERARESIEALKPDVLLVHSPHW   61 (294)
T ss_pred             HHHHHHHHHHHHHHHHHcCCCEEEEECCCc
Confidence            345678999999999999999999998764


No 95 
>cd07359 PCA_45_Doxase_B_like Subunit B of the Class III Extradiol dioxygenase, Protocatechuate 4,5-dioxygenase, and simlar enzymes. This subfamily of class III extradiol dioxygenases consists of a number of proteins with known enzymatic activities: Protocatechuate (PCA) 4,5-dioxygenase (LigAB), 2,3-dihydroxyphenylpropionate 1,2-dioxygenase (MhpB), 3-O-Methylgallate Dioxygenase, 2-aminophenol 1,6-dioxygenase, as well as proteins without any known enzymatic activity. These proteins play essential roles in the degradation of aromatic compounds by catalyzing the incorporation of both atoms of molecular oxygen into their preferred substrates. As members of the Class III extradiol dioxygenase family, the enzymes use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. LigAB-like class III enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. This model repres
Probab=22.27  E-value=1.1e+02  Score=29.60  Aligned_cols=30  Identities=17%  Similarity=0.249  Sum_probs=25.6

Q ss_pred             hhhHHHHHHHHHHHHHhcCCCcEEEEcCcc
Q 015062           67 VKDWYRYMQLGAEAVHAANPEVLVILSGLN   96 (414)
Q Consensus        67 ~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~   96 (414)
                      .....+.++++++.|++..|+.+|+++.-.
T Consensus        26 ~~~~~~~l~~~~~~l~~~~Pd~ivvis~~h   55 (271)
T cd07359          26 RAAVFAAFARIRDRLEAARPDVVVVVGNDH   55 (271)
T ss_pred             HHHHHHHHHHHHHHHHHhCCCEEEEEeCcH
Confidence            355678899999999999999999998844


No 96 
>PRK13370 mhpB 3-(2,3-dihydroxyphenyl)propionate dioxygenase; Provisional
Probab=21.69  E-value=96  Score=31.28  Aligned_cols=39  Identities=15%  Similarity=0.228  Sum_probs=30.1

Q ss_pred             CCCCCCCCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC
Q 015062           58 NELRGPKQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFD   98 (414)
Q Consensus        58 NEP~~~~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~   98 (414)
                      +||...  .+......++++++.|++.+|+.+||++.....
T Consensus        17 ~~~~~~--~~~~v~~a~~~l~~~l~~~~PD~iVIigpdH~~   55 (313)
T PRK13370         17 VDPAQE--VLAEVNAVIAAAREFVAAFDPELVVLFAPDHYN   55 (313)
T ss_pred             CCCChH--HHHHHHHHHHHHHHHHHHhCCCEEEEEcCCccc
Confidence            666543  245677889999999999999999999775443


No 97 
>PRK14729 miaA tRNA delta(2)-isopentenylpyrophosphate transferase; Provisional
Probab=21.22  E-value=2.3e+02  Score=28.42  Aligned_cols=31  Identities=13%  Similarity=0.280  Sum_probs=25.5

Q ss_pred             ChhhHHHHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           66 NVKDWYRYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        66 n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      +..+|.+.+.++++.|++-+ +..|+|+|+++
T Consensus        73 sv~~f~~~a~~~i~~i~~~g-k~PilvGGTgl  103 (300)
T PRK14729         73 NLGIFYKEALKIIKELRQQK-KIPIFVGGSAF  103 (300)
T ss_pred             eHHHHHHHHHHHHHHHHHCC-CCEEEEeCchH
Confidence            56789999998888888775 56899999874


No 98 
>cd02065 B12-binding_like B12 binding domain (B12-BD). Most of the members bind different cobalamid derivates, like B12 (adenosylcobamide) or methylcobalamin or methyl-Co(III) 5-hydroxybenzimidazolylcobamide. This domain is found in several enzymes, such as glutamate mutase, methionine synthase and methylmalonyl-CoA mutase. Cobalamin undergoes a conformational change on binding the protein; the dimethylbenzimidazole group, which is coordinated to the cobalt in the free cofactor, moves away from the corrin and is replaced by a histidine contributed by the protein. The sequence Asp-X-His-X-X-Gly, which contains this histidine ligand, is conserved in many cobalamin-binding proteins. Not all members of this family contain the conserved binding motif.
Probab=21.14  E-value=2.2e+02  Score=23.38  Aligned_cols=42  Identities=14%  Similarity=0.036  Sum_probs=28.9

Q ss_pred             CCceEEEEeccCCCCCCCCChhhHHHHHHHHHHHHHhcCC-CcEEEEcCccCC
Q 015062           47 GVRNVVGMSLRNELRGPKQNVKDWYRYMQLGAEAVHAANP-EVLVILSGLNFD   98 (414)
Q Consensus        47 ~~pnViG~dL~NEP~~~~~n~~dW~~~~~~~~~aIr~~dP-~~LIiVeG~~~~   98 (414)
                      ..|.++++..+...+.          ..-+.+..+++..| +..|+++|....
T Consensus        49 ~~pdiV~iS~~~~~~~----------~~~~~~~~~~~~~p~~~~ivvGG~~~t   91 (125)
T cd02065          49 EDADVVGLSALSTTHM----------EAMKLVIEALKELGIDIPVVVGGAHPT   91 (125)
T ss_pred             cCCCEEEEecchHhHH----------HHHHHHHHHHHhcCCCCeEEEeCCcCC
Confidence            6788999988775542          22233445666667 999999997654


No 99 
>TIGR02427 protocat_pcaD 3-oxoadipate enol-lactonase. Members of this family are 3-oxoadipate enol-lactonase. Note that the substrate is known as 3-oxoadipate enol-lactone, 2-oxo-2,3-dihydrofuran-5-acetate, 4,5-Dihydro-5-oxofuran-2-acetate, and 5-oxo-4,5-dihydrofuran-2-acetate. The enzyme the catalyzes the fourth step in the protocatechuate degradation to beta-ketoadipate and then to succinyl-CoA and acetyl-CoA. 4-hydroxybenzoate, 3-hydroxybenzoate, and vanillate all can be converted in one step to protocatechuate. This enzyme also acts in catechol degradation. In genomes that catabolize both catechol and protocatechuate, two forms of this enzyme may be found. All members of the seed alignment for this model were chosen from within protocatechuate degradation operons of at least three genes of the pathway, from genomes with the complete pathway through beta-ketoadipate.
Probab=21.14  E-value=3.5e+02  Score=23.82  Aligned_cols=64  Identities=9%  Similarity=-0.063  Sum_probs=38.4

Q ss_pred             HHHHHHHHhCCCceEEEEeccCCCCCC-CCChhhHHHHHHHHHHHHHhcCCCcEEEEcCccCCCcc
Q 015062           37 GLTKMATIFNGVRNVVGMSLRNELRGP-KQNVKDWYRYMQLGAEAVHAANPEVLVILSGLNFDKDL  101 (414)
Q Consensus        37 ~W~~iA~ryk~~pnViG~dL~NEP~~~-~~n~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~~dL  101 (414)
                      .|..+++.++..-+|+.+|+..-=... .....++...++.+.+.|.+.+.+.++++ |.++|+-+
T Consensus        28 ~~~~~~~~l~~~~~v~~~d~~G~G~s~~~~~~~~~~~~~~~~~~~i~~~~~~~v~li-G~S~Gg~~   92 (251)
T TIGR02427        28 MWDPVLPALTPDFRVLRYDKRGHGLSDAPEGPYSIEDLADDVLALLDHLGIERAVFC-GLSLGGLI   92 (251)
T ss_pred             hHHHHHHHhhcccEEEEecCCCCCCCCCCCCCCCHHHHHHHHHHHHHHhCCCceEEE-EeCchHHH
Confidence            467777777777789999996421100 00112455555666666777777665544 77777643


No 100
>PRK13365 protocatechuate 4,5-dioxygenase subunit beta; Provisional
Probab=20.80  E-value=1.1e+02  Score=30.22  Aligned_cols=31  Identities=16%  Similarity=0.088  Sum_probs=26.3

Q ss_pred             hhhHHHHHHHHHHHHHhcCCCcEEEEcCccC
Q 015062           67 VKDWYRYMQLGAEAVHAANPEVLVILSGLNF   97 (414)
Q Consensus        67 ~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~   97 (414)
                      +......++++++.|++.+||.+|++.....
T Consensus        30 ~~~~~~a~~~i~~~v~~~~PDviVvi~sdH~   60 (279)
T PRK13365         30 WKPLFDGYEPVAAWLAEQKADVLVFFYNDHC   60 (279)
T ss_pred             HHHHHHHHHHHHHHHHHhCCCEEEEEcCchH
Confidence            3567789999999999999999999966543


No 101
>cd07368 PhnC_Bs_like PhnC is a Class III Extradiol ring-cleavage dioxygenase involved in the polycyclic aromatic hydrocarbon (PAH) catabolic pathway. This subfamily is composed of Burkholderia sp. PhnC and similar poteins. PhnC is one of nine protein products encoded by the phn locus. These proteins are involved in the polycyclic aromatic hydrocarbon (PAH) catabolic pathway. PhnC is a member of the class III extradiol dioxygenase family, a group os enzymes which use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. LigAB-like enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. This model represents the catalytic subunit, B.
Probab=20.39  E-value=1.1e+02  Score=30.06  Aligned_cols=32  Identities=13%  Similarity=0.175  Sum_probs=26.7

Q ss_pred             hhhHHHHHHHHHHHHHhcCCCcEEEEcCccCC
Q 015062           67 VKDWYRYMQLGAEAVHAANPEVLVILSGLNFD   98 (414)
Q Consensus        67 ~~dW~~~~~~~~~aIr~~dP~~LIiVeG~~~~   98 (414)
                      .......++++.+.|++.+||.+|+++...+-
T Consensus        28 ~~~~~~a~~~~~~~v~~~~pD~ivvi~~dH~~   59 (277)
T cd07368          28 REICWHAYAICAERLAALQVTSVVVIGDDHYT   59 (277)
T ss_pred             HHHHHHHHHHHHHHHHHcCCCEEEEEcCchHh
Confidence            34566899999999999999999999865543


No 102
>PRK09589 celA 6-phospho-beta-glucosidase; Reviewed
Probab=20.17  E-value=1.7e+02  Score=31.16  Aligned_cols=69  Identities=17%  Similarity=0.234  Sum_probs=39.3

Q ss_pred             cCCCEEEeccCcCCCCC--------CccchHHHHHHHHHHH----HCC---CcEEEeccCccccccccccCCCceeeccc
Q 015062          158 QGWPLFVSEFGADLRGN--------NVNDNRYLNCFFGVAA----ELD---WDWALWTLVGSYYLREGVIGLNEYYGLFD  222 (414)
Q Consensus       158 ~g~Pv~lGEFG~~~~~~--------~~~~~~~~~~~l~~l~----e~~---i~Wa~Wa~~Gsyy~r~g~~~~~et~Gll~  222 (414)
                      ++.|++|+|-|....+.        +.....|++.-+..+.    +.|   .|.++|++---|--.+|  ....-|||+-
T Consensus       366 Y~~Pi~ItENG~~~~d~~~~~g~i~D~~Ri~Yl~~hl~~~~~Ai~~dGv~V~GY~~WSl~Dn~Ew~~G--~y~~RfGlv~  443 (476)
T PRK09589        366 YQLPLFIVENGFGAIDQREADGTVNDHYRIDYLAAHIREMKKAVVEDGVDLMGYTPWGCIDLVSAGTG--EMKKRYGFIY  443 (476)
T ss_pred             cCCCEEEEeCCcccCCCCCcCCcccCHHHHHHHHHHHHHHHHHHHhcCCCeEEEeeccccccccccCC--ccccceeeEE
Confidence            67899999999864221        1123445554444333    445   47899998432211111  0235689988


Q ss_pred             CCCCCC
Q 015062          223 WNWCDI  228 (414)
Q Consensus       223 ~dW~t~  228 (414)
                      -|..+.
T Consensus       444 VD~~~~  449 (476)
T PRK09589        444 VDKDNE  449 (476)
T ss_pred             EcCCCC
Confidence            887653


No 103
>PRK15014 6-phospho-beta-glucosidase BglA; Provisional
Probab=20.16  E-value=2.3e+02  Score=30.25  Aligned_cols=35  Identities=9%  Similarity=0.109  Sum_probs=26.3

Q ss_pred             CCCCCCCHHHHHHHHHHHHHHhCCCceEEEEeccCCCC
Q 015062           24 FGDQYFNPDLWIKGLTKMATIFNGVRNVVGMSLRNELR   61 (414)
Q Consensus        24 w~d~~~~~d~~~~~W~~iA~ryk~~pnViG~dL~NEP~   61 (414)
                      |-++.+ .+.|.+..+.+++||++.-..  .=.+|||.
T Consensus       146 W~n~~~-~~~F~~Ya~~~f~~fgdrVk~--WiT~NEp~  180 (477)
T PRK15014        146 WTNRKV-VDFFVRFAEVVFERYKHKVKY--WMTFNEIN  180 (477)
T ss_pred             CCChHH-HHHHHHHHHHHHHHhcCcCCE--EEEecCcc
Confidence            555544 799999999999999996332  23789985


Done!