Query         021159
Match_columns 316
No_of_seqs    126 out of 1251
Neff          7.7 
Searched_HMMs 46136
Date          Fri Mar 29 08:03:30 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/021159.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/021159hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PF13621 Cupin_8:  Cupin-like d 100.0 1.4E-46   3E-51  339.9  14.0  238   31-311     1-247 (251)
  2 KOG2508 Predicted phospholipas 100.0 2.9E-46 6.2E-51  340.4  15.5  297    3-315     7-313 (437)
  3 KOG2132 Uncharacterized conser 100.0 2.5E-35 5.4E-40  267.1   4.9  226   19-304   126-354 (355)
  4 KOG2130 Phosphatidylserine-spe 100.0 1.9E-33 4.2E-38  252.8  12.8  230   21-308    53-295 (407)
  5 KOG2131 Uncharacterized conser  99.8 5.1E-20 1.1E-24  169.3   5.9  230   19-309    27-301 (427)
  6 COG2850 Uncharacterized conser  99.6 7.9E-15 1.7E-19  136.2   8.4  187   28-298    14-202 (383)
  7 PF08007 Cupin_4:  Cupin superf  99.5 9.8E-14 2.1E-18  130.8   7.5   91  168-306   113-206 (319)
  8 KOG3706 Uncharacterized conser  98.9 4.9E-10 1.1E-14  107.0   3.3   89  162-296   311-402 (629)
  9 PF02373 JmjC:  JmjC domain, hy  98.9 2.5E-10 5.5E-15   90.9  -0.0  110  172-309     1-114 (114)
 10 KOG1633 F-box protein JEMMA an  98.0 1.1E-05 2.4E-10   83.4   7.0  202   33-304     9-224 (776)
 11 KOG2132 Uncharacterized conser  97.8 4.4E-06 9.4E-11   77.2   0.5   95  174-297   179-275 (355)
 12 smart00558 JmjC A domain famil  96.2  0.0034 7.4E-08   43.6   2.3   29  170-198    27-57  (57)
 13 COG2140 Thermophilic glucose-6  95.3   0.059 1.3E-06   47.5   6.9   26  275-300   125-151 (209)
 14 PF00190 Cupin_1:  Cupin;  Inte  94.3   0.042 9.1E-07   45.6   3.3   33  177-209    42-74  (144)
 15 TIGR03037 anthran_nbaC 3-hydro  94.1    0.23   5E-06   42.0   7.2   35  170-204    29-63  (159)
 16 PRK13264 3-hydroxyanthranilate  94.0     0.2 4.3E-06   43.2   6.8   72  170-307    35-107 (177)
 17 TIGR03404 bicupin_oxalic bicup  91.5    0.75 1.6E-05   44.4   7.8   24  275-299   288-312 (367)
 18 PF06560 GPI:  Glucose-6-phosph  89.8    0.22 4.7E-06   43.2   2.2   29  274-302   108-137 (182)
 19 PF07883 Cupin_2:  Cupin domain  89.5    0.74 1.6E-05   32.5   4.5   23  277-299    38-61  (71)
 20 PF02041 Auxin_BP:  Auxin bindi  89.3     1.2 2.5E-05   37.3   5.9   69  171-299    44-115 (167)
 21 COG4101 Predicted mannose-6-ph  88.8    0.32 6.9E-06   39.0   2.3   24  276-299    88-112 (142)
 22 TIGR02272 gentisate_1_2 gentis  88.7    0.86 1.9E-05   43.4   5.5   27  275-302   119-146 (335)
 23 COG1917 Uncharacterized conser  88.2     2.2 4.9E-05   34.4   7.1   35  170-204    44-79  (131)
 24 PRK04190 glucose-6-phosphate i  87.5    0.61 1.3E-05   40.8   3.4   25  275-299   119-144 (191)
 25 smart00835 Cupin_1 Cupin. This  87.2       3 6.5E-05   34.4   7.4   25  274-298    73-98  (146)
 26 TIGR03404 bicupin_oxalic bicup  87.2     2.9 6.2E-05   40.4   8.2   34  171-205    70-103 (367)
 27 COG0662 {ManC} Mannose-6-phosp  86.2    0.74 1.6E-05   37.3   3.1   25  276-301    75-100 (127)
 28 PLN02288 mannose-6-phosphate i  84.2    0.61 1.3E-05   45.4   2.0   31  277-307   252-283 (394)
 29 KOG1356 Putative transcription  83.1    0.45 9.7E-06   49.7   0.6   44   32-81    531-574 (889)
 30 PF05899 Cupin_3:  Protein of u  82.9    0.76 1.6E-05   33.6   1.6   18  274-291    42-60  (74)
 31 KOG1356 Putative transcription  82.7     0.7 1.5E-05   48.3   1.8   31  272-303   795-826 (889)
 32 TIGR01221 rmlC dTDP-4-dehydror  82.0     4.2 9.1E-05   35.1   6.1   37  169-205    44-83  (176)
 33 PRK15131 mannose-6-phosphate i  80.3     1.1 2.4E-05   43.5   2.2   32  276-307   237-269 (389)
 34 PF06052 3-HAO:  3-hydroxyanthr  79.9     7.9 0.00017   32.4   6.7   70  170-305    34-104 (151)
 35 COG3450 Predicted enzyme of th  75.6     2.1 4.5E-05   34.4   2.1   19  274-292    80-99  (116)
 36 PF00908 dTDP_sugar_isom:  dTDP  75.2     8.8 0.00019   33.1   6.0   76  169-302    43-125 (176)
 37 PRK13290 ectC L-ectoine syntha  74.6     2.8 6.2E-05   34.0   2.7   27  275-302    74-101 (125)
 38 KOG2508 Predicted phospholipas  74.3     3.4 7.4E-05   39.4   3.5   40  259-300   343-385 (437)
 39 COG1482 ManA Phosphomannose is  71.0     2.7 5.8E-05   39.6   2.0   31  276-306   158-189 (312)
 40 KOG2107 Uncharacterized conser  69.7     4.6  0.0001   34.3   2.9   32  273-305   113-145 (179)
 41 PF06249 EutQ:  Ethanolamine ut  68.9     3.8 8.2E-05   34.5   2.3   17  275-291   112-129 (152)
 42 COG1898 RfbC dTDP-4-dehydrorha  68.3      19 0.00041   31.0   6.5   35  170-204    46-82  (173)
 43 PRK15457 ethanolamine utilizat  66.8     4.6 9.9E-05   36.3   2.5   22  273-294   190-212 (233)
 44 PF01238 PMI_typeI:  Phosphoman  66.4     2.3   5E-05   41.1   0.6   31  277-307   251-282 (373)
 45 PF05523 FdtA:  WxcM-like, C-te  63.7     5.3 0.00012   32.6   2.2   33  172-204    34-69  (131)
 46 PLN00212 glutelin; Provisional  62.2      24 0.00053   35.4   6.9   21  274-294   391-412 (493)
 47 PF03079 ARD:  ARD/ARD' family;  61.8     6.9 0.00015   33.1   2.6   26  274-300   113-139 (157)
 48 TIGR03027 pepcterm_export puta  60.6     5.3 0.00011   33.8   1.7   17  276-292   148-165 (165)
 49 TIGR00218 manA mannose-6-phosp  59.4     4.3 9.4E-05   37.9   1.0   20  276-295   151-171 (302)
 50 PF01050 MannoseP_isomer:  Mann  59.2     9.3  0.0002   32.1   2.9   36  275-311   101-139 (151)
 51 COG4766 EutQ Ethanolamine util  58.9     6.5 0.00014   33.0   1.8   16  276-291   136-152 (176)
 52 PF07385 DUF1498:  Protein of u  53.0      28  0.0006   31.2   4.9   84  169-294    87-173 (225)
 53 COG5285 Protein involved in bi  49.5      36 0.00078   31.8   5.2   38  259-300   180-218 (299)
 54 PRK09943 DNA-binding transcrip  46.5      18 0.00039   31.0   2.7   24  275-299   145-169 (185)
 55 TIGR03028 EpsE polysaccharide   46.4      11 0.00023   34.0   1.4   14  279-292   225-239 (239)
 56 PF12852 Cupin_6:  Cupin         42.6      23  0.0005   30.2   2.8   23  276-299    55-78  (186)
 57 smart00751 BSD domain in trans  40.3      18 0.00039   24.2   1.4   36    2-41     10-46  (51)
 58 COG4297 Uncharacterized protei  39.8      26 0.00055   29.0   2.4   22  273-294    82-104 (163)
 59 PF02311 AraC_binding:  AraC-li  39.3      29 0.00063   26.8   2.8   25  275-299    40-65  (136)
 60 KOG3413 Mitochondrial matrix p  38.3      48   0.001   27.7   3.8   34  164-206    95-128 (156)
 61 PF15138 Syncollin:  Syncollin   38.2      19 0.00041   28.2   1.4   30  269-299    28-59  (112)
 62 TIGR03214 ura-cupin putative a  37.1      34 0.00075   31.2   3.2   26  274-300   216-242 (260)
 63 PF04970 LRAT:  Lecithin retino  37.0      17 0.00036   29.1   1.0   24  278-301     5-30  (125)
 64 PF08007 Cupin_4:  Cupin superf  36.6      24 0.00052   33.3   2.1   39   31-72      1-39  (319)
 65 COG3822 ABC-type sugar transpo  35.9 1.2E+02  0.0026   26.6   6.0   22  273-294   150-172 (225)
 66 TIGR03214 ura-cupin putative a  34.5      40 0.00086   30.8   3.2   23  276-299    98-121 (260)
 67 COG3435 Gentisate 1,2-dioxygen  33.9      72  0.0016   30.0   4.6   18  277-294   132-150 (351)
 68 COG5553 Predicted metal-depend  31.3      81  0.0018   26.9   4.2   24  177-200    81-104 (191)
 69 PRK11171 hypothetical protein;  31.1      44 0.00096   30.6   2.9   27  273-300   220-247 (266)
 70 KOG0958 DNA damage-responsive   30.9      21 0.00046   36.8   0.8  116  169-309   173-292 (690)
 71 TIGR01479 GMP_PMI mannose-1-ph  30.8      45 0.00098   33.2   3.1   24  275-299   414-438 (468)
 72 PLN00212 glutelin; Provisional  30.6 1.9E+02  0.0042   29.1   7.5   39  170-209    82-120 (493)
 73 PF03909 BSD:  BSD domain  ;  I  27.6      34 0.00074   23.8   1.2   35    2-40     15-50  (62)
 74 PRK11171 hypothetical protein;  27.6      62  0.0013   29.7   3.2   23  276-299   101-124 (266)
 75 KOG1633 F-box protein JEMMA an  27.2      33 0.00072   36.4   1.5   40  273-312   545-585 (776)
 76 COG1791 Uncharacterized conser  26.2      67  0.0014   27.6   2.8   31  273-303   115-146 (181)
 77 PRK11702 hypothetical protein;  26.1      25 0.00055   27.8   0.3   42    5-49     11-59  (108)
 78 KOG3995 3-hydroxyanthranilate   25.6 1.7E+02  0.0038   26.0   5.4   36  169-204    33-68  (279)
 79 PF13759 2OG-FeII_Oxy_5:  Putat  25.5      49  0.0011   25.2   1.8   27  273-299    63-90  (101)
 80 KOG0426 Ubiquitin-protein liga  24.8      54  0.0012   26.8   1.9   39    3-49      5-43  (165)
 81 PRK15460 cpsB mannose-1-phosph  24.2      73  0.0016   31.9   3.2   25  275-300   423-448 (478)
 82 PF04962 KduI:  KduI/IolB famil  24.2      64  0.0014   29.6   2.6   25  276-300   210-234 (261)
 83 PRK10296 DNA-binding transcrip  24.2      64  0.0014   29.2   2.7   20  276-295    61-81  (278)
 84 PF05721 PhyH:  Phytanoyl-CoA d  23.7      63  0.0014   27.0   2.4   28  273-300   177-205 (211)
 85 cd02786 MopB_CT_3 The MopB_CT_  23.3      40 0.00087   26.1   1.0   14  280-294    70-84  (116)
 86 TIGR02272 gentisate_1_2 gentis  23.2 2.7E+02  0.0058   26.6   6.7   26  276-302   288-314 (335)
 87 KOG2757 Mannose-6-phosphate is  23.1      52  0.0011   31.7   1.8   29  277-305   249-278 (411)
 88 PRK13502 transcriptional activ  22.3      61  0.0013   29.4   2.1   21  275-295    55-76  (282)
 89 cd02791 MopB_CT_Nitrate-R-NapA  21.1      99  0.0021   24.0   2.9   19  276-294    66-88  (122)
 90 PF08255 Leader_Trp:  Trp-opero  20.7      41 0.00089   16.5   0.3   10  285-294     3-13  (14)
 91 PF01476 LysM:  LysM domain;  I  20.6      44 0.00094   20.9   0.6   10  280-289    35-44  (44)
 92 TIGR03028 EpsE polysaccharide   20.3      61  0.0013   29.1   1.6   16  275-290   146-162 (239)
 93 PF06251 Caps_synth_GfcC:  Caps  20.3      63  0.0014   28.8   1.7   12  278-289   191-202 (229)

No 1  
>PF13621 Cupin_8:  Cupin-like domain; PDB: 3AL6_C 3AL5_C 2XUM_A 2Y0I_A 1MZE_A 3KCY_A 1MZF_A 1YCI_A 2ILM_A 1H2L_A ....
Probab=100.00  E-value=1.4e-46  Score=339.86  Aligned_cols=238  Identities=28%  Similarity=0.559  Sum_probs=174.5

Q ss_pred             HHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCC----hhhHHHhcCCCCcEEEEeccCCCCCcccccCCCCCCcccccc
Q 021159           31 PLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPH----PSYLSKTLSSSPPVSVHLSPNGRADSLVTLTHPRSGEISQCF  106 (316)
Q Consensus        31 ~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~----~eyL~~~~G~~~~V~V~~~~~~~~d~~~~~~~~~~g~~~~~F  106 (316)
                      |++|+++|+.+++||||+|++.  +|+|+++|+.    ++||++.+|+. .|.|...+.+..+......       ...+
T Consensus         1 p~eF~~~~~~~~~PvVi~g~~~--~w~a~~~W~~~~~~~~~l~~~~g~~-~v~~~~~~~~~~~~~~~~~-------~~~~   70 (251)
T PF13621_consen    1 PEEFFERYVKPNKPVVIRGAAA--DWPAFQKWTDDEYLLDYLKEKYGDV-PVPVRDSPNGISDSFGYND-------DRKF   70 (251)
T ss_dssp             -HHHHHHTCCTT--EEEESSST--TCCHHHH-S-----HHHHHHHHTSS-EEEEEEEST--SSBTS-B--------GCCC
T ss_pred             CHHHHHHHhCCCCCEEEeCCcc--CCchhhhccchhHHHHHHHHHcCCe-EEEEEecCCcccccccccc-------cccc
Confidence            6899999999999999999999  9999999995    69999999999 9999866543332221100       1122


Q ss_pred             cccceeeecHHHHHHHHhccCC--CCccccccccccccchhhhhhhcccccchhhhHHhhCCCCCeeEEEeeCCCCCCCc
Q 021159          107 ASAHVERLPFDEALQLVSNSKN--GDVVAYLQQQNDCFRDEYSVLGSDCDEHIAWATEALGCYPEAVNLWIGNQLSETSF  184 (316)
Q Consensus       107 ~~~~~~~mt~~efl~~~~~~~~--~~~~~Yl~~~~~~l~~~~p~L~~D~~~~~p~~~~~~~~~~~~~~lwiG~~gs~t~~  184 (316)
                      .......|+|++|++.+.....  ....+|+..  ..+..++|.|.+|.  .+|+....++......+||||++|+.|++
T Consensus        71 ~~~~~~~~~~~~f~~~~~~~~~~~~~~~~y~~~--~~~~~~~~~l~~~~--~~~~~~~~~~~~~~~~~l~ig~~gs~t~l  146 (251)
T PF13621_consen   71 VNFERERMPFRDFLDRLRANRDQRDKPYYYLQN--WNLFEDFPELREDN--DLPFPPELFGKEPQSSNLWIGPPGSFTPL  146 (251)
T ss_dssp             TCEEEEEEEHHHHHHHHHHSCHSTSSSEEEEEE--ETHHHHSHHHHCCS---CHHHHCHSCCHCCEEEEEEE-TTEEEEE
T ss_pred             cCCeeEECcHHHHHHHHHhcccccCCceEEEec--CchHHHhhhhhhcc--ccccchhhcccCccccEEEEeCCCceeee
Confidence            2346789999999999998652  235677764  34667889999984  57776667765566889999999999999


Q ss_pred             cccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccccCCCCCccccccccc
Q 021159          185 HKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPYPSPETRESEMA  264 (316)
Q Consensus       185 H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~~~~~~~~pd~~  264 (316)
                      |+|..+|++|||.|+|+|+||||.+...||+.+..+                      .+..++.+|+      .++|.+
T Consensus       147 H~D~~~n~~~~i~G~K~~~L~pP~~~~~l~~~~~~~----------------------~~~~~~~~d~------~~~d~~  198 (251)
T PF13621_consen  147 HYDPSHNLLAQIRGRKRWILFPPDDSPNLYPRPDSH----------------------GGTVFSWVDP------DNPDLE  198 (251)
T ss_dssp             EE-SSEEEEEEEESEEEEEEE-GGGGGGCTBETTTS----------------------T-TCBBSS-T------TS--TT
T ss_pred             eECchhhhhhccCCCEEEEEECCccccccccceecc----------------------cccceeeeec------cChhhh
Confidence            999999999999999999999999999999775311                      1233567888      789999


Q ss_pred             cCCCccCCCccEEEEEcCCCEEeeC-cCcceeeec--CCcchhhhcccCc
Q 021159          265 KFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRN--SEVNVVELMQAKH  311 (316)
Q Consensus       265 ~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~--~~~~v~~~~~~~~  311 (316)
                      +||++++ +++++|+|+|||+|||| ||||+|.+.  .++||++|.+|+.
T Consensus       199 ~~p~~~~-~~~~~~~l~pGD~LfiP~gWwH~V~~~~~~~~sisvn~w~~~  247 (251)
T PF13621_consen  199 RFPKFRK-APPYEVVLEPGDVLFIPPGWWHQVENLSDDDLSISVNYWFRT  247 (251)
T ss_dssp             T-CGGGG---EEEEEEETT-EEEE-TT-EEEEEESTTSSCEEEEEEEEES
T ss_pred             hhhhhcc-CceeEEEECCCeEEEECCCCeEEEEEcCCCCeEEEEEEEecc
Confidence            9999998 89999999999999999 999994444  3569999998875


No 2  
>KOG2508 consensus Predicted phospholipase [Lipid transport and metabolism]
Probab=100.00  E-value=2.9e-46  Score=340.41  Aligned_cols=297  Identities=39%  Similarity=0.652  Sum_probs=255.0

Q ss_pred             HHHHHHHHhhhhcCCCCCceeeeCCCCCHHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhcCCCCcEEEEe
Q 021159            3 EVKKLWDEVRELSLGSNSTIERLESPPTPLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTLSSSPPVSVHL   82 (316)
Q Consensus         3 ~~~~~~~~~~~~~~~~~~~I~ri~~~~s~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~G~~~~V~V~~   82 (316)
                      |++.||+|+|||.++.  .|.++|..+|+.+|+++|+++|+|||||..+.  +|||.++|+..+||.+++|+. .|.|.+
T Consensus         7 e~~~llre~relcvp~--~v~~lD~~Ptpl~Fyr~fvs~n~PvIIrkAL~--hWpal~lWs~p~Yl~~algd~-vvsvai   81 (437)
T KOG2508|consen    7 EYKGLLREVRELCVPV--LVNLLDLTPTPLDFYRKFVSTNTPVIIRKALP--HWPALKLWSQPDYLLSALGDI-VVSVAI   81 (437)
T ss_pred             HHHhhhHHHhhccccc--ccccccCCCchHHHHHhhhcCCCcEEEecccc--cCchhhccCchHHHHHhccCe-EEEEEe
Confidence            5788999999998877  89999988999999999999999999999999  999999999988999999999 999999


Q ss_pred             ccCCCCC-cccccCCCCCCcccccccccceeeecHHHHHHHHhccCCCCccccccccccccchhhhhhhccccc-chhhh
Q 021159           83 SPNGRAD-SLVTLTHPRSGEISQCFASAHVERLPFDEALQLVSNSKNGDVVAYLQQQNDCFRDEYSVLGSDCDE-HIAWA  160 (316)
Q Consensus        83 ~~~~~~d-~~~~~~~~~~g~~~~~F~~~~~~~mt~~efl~~~~~~~~~~~~~Yl~~~~~~l~~~~p~L~~D~~~-~~p~~  160 (316)
                      +++|.+| +...      |  ...|..+...+|+++|.+..+.....++...|+++++++++.++|.|..|+.. +++|+
T Consensus        82 tPngyadgav~~------g--~e~f~~pae~KlklsevL~vl~~~~~~~~Vly~qkQ~snl~~elp~la~Dl~~~d~~wa  153 (437)
T KOG2508|consen   82 TPNGYADGAVMS------G--NEMFIKPAEQKLKLSEVLYVLTQYDESNEVLYGQKQNSNLVKELPPLATDLLLTDFSWA  153 (437)
T ss_pred             CCCCcccccccc------C--cceeechhhhhccchhhheehhcccCCCceeehhhhccccccccccccccccccccccc
Confidence            9999988 4321      1  24565666679999999999998877788999999999999999999999876 78999


Q ss_pred             HHhhCCCCCeeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeee--c
Q 021159          161 TEALGCYPEAVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLE--L  238 (316)
Q Consensus       161 ~~~~~~~~~~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~--~  238 (316)
                      +.+||+.|...|||||...++|.+|.|+++|++|+|+|.|+|+|+||.+.++|+..-+|++.|+.+  .+++.+.++  -
T Consensus       154 ~eafgk~PdavNlWiG~~~avTSlHkDhyENlYaViSGeKhFvlipP~d~~~lp~eiyp~g~ysy~--~e~g~fk~e~~d  231 (437)
T KOG2508|consen  154 PEAFGKVPDAVNLWIGKSEAVTSLHKDHYENLYAVISGEKHFVLIPPDDANQLPLEIYPNGLYSYE--GEDGPFKSEGLD  231 (437)
T ss_pred             HHHhCCChhheeeeecccccccccccccccceEEEEeccceEEEeCcccccccceeecCCcceeee--cCCCceeecccc
Confidence            999999999999999999999999999999999999999999999999999999999999998875  234445554  2


Q ss_pred             cCCccc-ccccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecC----CcchhhhcccCcc
Q 021159          239 EEPVRY-VPWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNS----EVNVVELMQAKHV  312 (316)
Q Consensus       239 ~~~~~~-~~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~----~~~v~~~~~~~~~  312 (316)
                      +++..- ..|+.+|++++++....+..++|.+.....+..+.+.+|+++|.| .|+|+ +...    +-.|.+|.+-+--
T Consensus       232 Ee~~~~a~~~~svd~~~s~~~~a~~~~k~~l~~~~~k~~~~rv~a~~i~~lp~~w~h~-~sq~~gd~~~~Iavn~~~d~~  310 (437)
T KOG2508|consen  232 EEDAAIAKTWFSVDPIGSPKELAVPQEKIPLLEAEYKPEMDRVLAGQILYLPEDWFHH-VSQVGGDPESDIAVNEWYDIE  310 (437)
T ss_pred             hhhhhhcceeeeecccCCHHHhccchhhCccccccccceeeeeeccccccChhhhhhh-ccccCCCccceeEEeeecccc
Confidence            223222 349999999888777778899999987789999999999999999 99999 6665    4556666555544


Q ss_pred             ccc
Q 021159          313 VSS  315 (316)
Q Consensus       313 ~~~  315 (316)
                      ++|
T Consensus       311 ~ds  313 (437)
T KOG2508|consen  311 ADS  313 (437)
T ss_pred             ccc
Confidence            443


No 3  
>KOG2132 consensus Uncharacterized conserved protein, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=100.00  E-value=2.5e-35  Score=267.07  Aligned_cols=226  Identities=21%  Similarity=0.370  Sum_probs=183.0

Q ss_pred             CCceeeeCCCCCHHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhcCCCCcEEEEeccCCCCCcccccCCCC
Q 021159           19 NSTIERLESPPTPLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTLSSSPPVSVHLSPNGRADSLVTLTHPR   98 (316)
Q Consensus        19 ~~~I~ri~~~~s~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~G~~~~V~V~~~~~~~~d~~~~~~~~~   98 (316)
                      ++.++..+ .++.++|..+++.++.|++++|...  +|||.++|.. +||....|.+ +|.|++... +.+.        
T Consensus       126 ~~~~~~~~-~~~l~~~l~d~~~~~~p~~~l~~~~--hwpa~~kw~l-~~l~~va~~r-TvpvEvg~~-y~~~--------  191 (355)
T KOG2132|consen  126 EIDVPGED-RLSLQEFLNDTVGRGTPVILLGFNW--HWPAIQKWSL-GYLQQVAGNR-TVPVEVGST-YADE--------  191 (355)
T ss_pred             hhhhcccc-chHHHHHHHHhhcCCCceEEecccc--cchHhhhcch-hHHHhcccce-eeeeecccc-cchh--------
Confidence            44556666 4899999999999999999999999  9999999965 9999999999 999987532 1111        


Q ss_pred             CCcccccccccceeeecHHHHHHHHhccCCCCccccccccccccchhhhhhhcccccchhhhHHhhCCC--CCeeEEEee
Q 021159           99 SGEISQCFASAHVERLPFDEALQLVSNSKNGDVVAYLQQQNDCFRDEYSVLGSDCDEHIAWATEALGCY--PEAVNLWIG  176 (316)
Q Consensus        99 ~g~~~~~F~~~~~~~mt~~efl~~~~~~~~~~~~~Yl~~~~~~l~~~~p~L~~D~~~~~p~~~~~~~~~--~~~~~lwiG  176 (316)
                               .....-|++.+|+.+.....+. +..|+++..  +..+.|+|..|+  .+|....+.+..  ....+.|+|
T Consensus       192 ---------~w~q~l~t~~~g~~R~~~~~p~-~~~YlAqh~--lfdqi~elk~Di--~iPDyc~~~~f~~~~v~~~~w~G  257 (355)
T KOG2132|consen  192 ---------DWSQNLMTQIKGIKRCILFEPR-ECLYLAQHH--LFDQIPELKFDI--SIPDYCSFPNFENEVVDINAWIG  257 (355)
T ss_pred             ---------HHHhhhHHHhhhhhhhhcCCcc-ccchhhhhh--hhccchhhhhcc--CCCceeecCCCCccccceeEEec
Confidence                     1123578888898887765543 466777654  556778899998  466211122322  368899999


Q ss_pred             CCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccccCCCCCc
Q 021159          177 NQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPYPSP  256 (316)
Q Consensus       177 ~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~~~~  256 (316)
                      ++|++||+|.|+.+|+++||.|+|+|+|++|..+.++||...+                        ....|+||.    
T Consensus       258 paGtV~pih~dp~hNi~~qv~G~k~i~l~~p~~s~~lyP~d~~------------------------~~~tsqvdv----  309 (355)
T KOG2132|consen  258 PAGTVLPIHMDPWHNILSQVFGRKRIRLYPPEDSGALYPTDTY------------------------LLETSQVDV----  309 (355)
T ss_pred             cCCceeccccccccceeeeeecceEEEEecCcccCCCCCccch------------------------hhccccccc----
Confidence            9999999999999999999999999999999999999976421                        122578998    


Q ss_pred             cccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchh
Q 021159          257 ETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVV  304 (316)
Q Consensus       257 ~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~  304 (316)
                        ++||+++||+|++ ++.++|+|+|||+|||| -|||. |++++.+++
T Consensus       310 --enPdlk~fp~~~k-~~~l~~lL~pGe~L~iP~kwwhy-vrs~d~s~s  354 (355)
T KOG2132|consen  310 --ENPDLKAFPKFAK-ARFLDCLLEPGEALFIPPKWWHY-VRSLDKSFS  354 (355)
T ss_pred             --CCCChhhhhHHHH-HHHHHHhcCCchhccccHHHhhh-hhhcccccc
Confidence              9999999999998 99999999999999999 99999 999888765


No 4  
>KOG2130 consensus Phosphatidylserine-specific receptor PtdSerR, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=100.00  E-value=1.9e-33  Score=252.76  Aligned_cols=230  Identities=20%  Similarity=0.362  Sum_probs=175.7

Q ss_pred             ceeeeC-CCCCHHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhcCCCCcEEEEeccCCCCCcccccCCCCC
Q 021159           21 TIERLE-SPPTPLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTLSSSPPVSVHLSPNGRADSLVTLTHPRS   99 (316)
Q Consensus        21 ~I~ri~-~~~s~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~G~~~~V~V~~~~~~~~d~~~~~~~~~~   99 (316)
                      .+.|++ ..+|.++|.++|-++.+||||+|++.  .|+|..+||. ++|.++||+. ++.+....               
T Consensus        53 n~~r~~~~~isveeF~~~ferp~kPVll~g~~D--gW~A~ekWT~-drLskkyrnq-~Fkcged~---------------  113 (407)
T KOG2130|consen   53 NGNRERRRNISVEEFIERFERPYKPVLLSGLTD--GWPASEKWTL-DRLSKKYRNQ-KFKCGEDN---------------  113 (407)
T ss_pred             cchhhhhcCCCHHHHHHHhcccCCceEeecccc--CCchhhhhhH-HHHHHHhcCc-cccccccC---------------
Confidence            445555 35999999999999999999999999  9999999997 9999999998 77653211               


Q ss_pred             CcccccccccceeeecHHHHHHHHhccCCCCccccccccccccchhhh--hhhcccccchh--hhHHhh---C--CCCCe
Q 021159          100 GEISQCFASAHVERLPFDEALQLVSNSKNGDVVAYLQQQNDCFRDEYS--VLGSDCDEHIA--WATEAL---G--CYPEA  170 (316)
Q Consensus       100 g~~~~~F~~~~~~~mt~~efl~~~~~~~~~~~~~Yl~~~~~~l~~~~p--~L~~D~~~~~p--~~~~~~---~--~~~~~  170 (316)
                              ++....|.|..|++++.+... ...+|+.+.  .+.+..|  .|.+|+  .+|  |.++.|   |  +.|..
T Consensus       114 --------~gnsv~MKmkyY~~Ym~~~Rd-dsPLYiFDs--sFgE~~~~rkLl~dY--~VPk~F~dDlF~y~g~e~RPpy  180 (407)
T KOG2130|consen  114 --------NGNSVKMKMKYYIEYMKSTRD-DSPLYIFDS--SFGEHAPRRKLLEDY--SVPKYFRDDLFQYLGEERRPPY  180 (407)
T ss_pred             --------CCcceeeeHHHHHHHHhcccc-CCCeEEecc--hhhcccchhhhhhhc--CcchhhhHHHHHhcCcccCCCc
Confidence                    113579999999999987643 468999853  3555555  789998  577  555555   3  25678


Q ss_pred             eEEEeeCCCCCCCccccCCCc--EEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCccccccc
Q 021159          171 VNLWIGNQLSETSFHKDHYEN--LYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWC  248 (316)
Q Consensus       171 ~~lwiG~~gs~t~~H~D~~~n--~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s  248 (316)
                      .+|.||+++++|.+|.||...  +.++|+|+|||.||||...+.+-.- .+.         +++      .++.....|+
T Consensus       181 RWfvmGParSGtsiHIDPlgTSAWNtll~GhKrW~LfPp~~p~~lvkv-~~~---------e~g------~~~de~itwf  244 (407)
T KOG2130|consen  181 RWFVMGPARSGTSIHIDPLGTSAWNTLLQGHKRWVLFPPGTPPELVKV-TVD---------EGG------KQPDEIITWF  244 (407)
T ss_pred             eeEEecCCCCCceeEECCcchHHHHHHhhccceeEEcCCCCCCCceee-ccc---------ccC------CCCcceechh
Confidence            999999999999999998654  6899999999999999998765421 110         222      1233344565


Q ss_pred             ccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhhhcc
Q 021159          249 SVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVELMQ  308 (316)
Q Consensus       249 ~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~~  308 (316)
                      +.= |        +..++|......++++|++.|||++||| ||||- |-|++.+|+|.-+
T Consensus       245 ~~~-y--------~rt~~Pswp~E~kPIEc~q~pGEt~fVP~GWWHv-VlNle~TIAiTqN  295 (407)
T KOG2130|consen  245 STI-Y--------PRTQLPSWPDEYKPIECLQKPGETMFVPSGWWHV-VLNLEPTIAITQN  295 (407)
T ss_pred             hhc-c--------ccccCCCCccccCCceeeecCCceEEecCCeEEE-EeccCceeeeeec
Confidence            431 1        1467777776688999999999999999 99999 8899999976543


No 5  
>KOG2131 consensus Uncharacterized conserved protein, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=99.80  E-value=5.1e-20  Score=169.29  Aligned_cols=230  Identities=19%  Similarity=0.235  Sum_probs=138.8

Q ss_pred             CCceeeeCC-CCCHHHHHHHhhcCCCCEEEEcCCCCCCCccc----cCCCC------h-----hhHHHhcCCCCcEEEEe
Q 021159           19 NSTIERLES-PPTPLQFLRDYVSQNKPCIIKNVSLHHQWPAF----SLWPH------P-----SYLSKTLSSSPPVSVHL   82 (316)
Q Consensus        19 ~~~I~ri~~-~~s~~~F~~~y~~~~~PvVi~g~~~~~~WpA~----~~Wt~------~-----eyL~~~~G~~~~V~V~~   82 (316)
                      ...|+|+.+ .++.+.|.+.|...+.||+|.++..  +|++.    ..|.+      +     .|.+.+..+. .+.|..
T Consensus        27 r~~v~r~~g~~~d~~~~a~~~~~k~~~v~is~v~~--d~~~~~~~~~s~~dl~~~~~l~n~~~~f~k~~v~~~-~~~v~~  103 (427)
T KOG2131|consen   27 RPCVLRLIGPTADYGDFAERDTHKRPGVLISYVLE--DWPCVSRDNESGADLNNNPDLKNFARSFAKRIVQNG-DKNVFL  103 (427)
T ss_pred             hhhhhhhcccccCcccchhhhcccCCCcccccccc--CcccccCCCcchhhhccCcchhHHHHHHhHHHHhcC-Cccccc
Confidence            345677763 5789999999999999999999999  99998    45521      1     2444444443 444444


Q ss_pred             ccCCCCCcccccCCCCCCcccccccccceeeecHHHHHHHHhccCCC-Cccccccccc-----ccc-chhhhhh-hccc-
Q 021159           83 SPNGRADSLVTLTHPRSGEISQCFASAHVERLPFDEALQLVSNSKNG-DVVAYLQQQN-----DCF-RDEYSVL-GSDC-  153 (316)
Q Consensus        83 ~~~~~~d~~~~~~~~~~g~~~~~F~~~~~~~mt~~efl~~~~~~~~~-~~~~Yl~~~~-----~~l-~~~~p~L-~~D~-  153 (316)
                      +...                  .|-+.++..+++.+|+..+.+.... ...+|++...     ..+ ..+-|.| .+|. 
T Consensus       104 ~~~s------------------~f~~~~~Le~ny~d~~v~~a~~~e~e~~~l~lad~~~~e~~~~~~~~q~p~ly~kDwH  165 (427)
T KOG2131|consen  104 CDLS------------------LFPDYEYLERNYGDFVVPVANCNEKERYSLKLADWEFREEQVQLACPQAPSLYGKDWH  165 (427)
T ss_pred             cccc------------------cCccHHHHHhhhhhcchhhccccchhhhhhhhccchhHHHhHhhhcCCCccccccchh
Confidence            3221                  1222244566777777666553211 1112222110     000 0000111 1111 


Q ss_pred             -----cc----chh--hhHHhh------CCCCCeeEEEeeCCCCCCCccccCCC--cEEEEEEeEEEEEEeCCCCCCCCc
Q 021159          154 -----DE----HIA--WATEAL------GCYPEAVNLWIGNQLSETSFHKDHYE--NLYTVVSGQKHFLLLPPTDVHRMY  214 (316)
Q Consensus       154 -----~~----~~p--~~~~~~------~~~~~~~~lwiG~~gs~t~~H~D~~~--n~~~qv~G~Kr~~L~pP~~~~~ly  214 (316)
                           ..    ..|  |+.+-+      +........++|++||.||+|-|.++  .+.+.|.|+|+|.|+||.+...|+
T Consensus       166 L~~~~d~~~~~~~pd~F~~dwlne~~i~~~~ddyrFvy~Gp~gSwtp~HaDVf~s~swS~nicG~KrWl~~pP~qe~~l~  245 (427)
T KOG2131|consen  166 LYRFLDNDFPYWTPDLFAKDWLNEFVIDGESDDYRFVYAGPAGSWTPFHADVFHSPSWSVNICGRKRWLLYPPEQEQTLA  245 (427)
T ss_pred             eeeecCcccccccchhhhhcccchhhccCCCCceeEEEeccCCCCCccchhhhcCCcceeeeecceeEEEeChHHhhhhh
Confidence                 11    112  111111      11235778999999999999999665  568999999999999999988777


Q ss_pred             ccccCCcccccccccCCcceeeeccCCcccccccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcc
Q 021159          215 IRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFR  293 (316)
Q Consensus       215 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH  293 (316)
                      .. +..                        .+++ ++        .+-++.|    . .+.+++.++|||++|+| ||.|
T Consensus       246 dr-~gn------------------------lp~~-~~--------~~~ld~~----~-~~~lei~Qepge~VFvPsGW~h  286 (427)
T KOG2131|consen  246 DR-YGN------------------------LPLP-SW--------ITKLDLF----R-GPLLEIFQEPGETVFVPSGWHH  286 (427)
T ss_pred             hh-ccC------------------------cCCc-cc--------ccccccc----c-cchhhhhccCCceeeccCcccc
Confidence            43 110                        0110 11        1112222    1 66799999999999999 9999


Q ss_pred             eeeecCCcchhhhccc
Q 021159          294 KAVRNSEVNVVELMQA  309 (316)
Q Consensus       294 ~vv~~~~~~v~~~~~~  309 (316)
                      | |-|++.+|+||-++
T Consensus       287 Q-V~NL~dTISINHNW  301 (427)
T KOG2131|consen  287 Q-VLNLGDTISINHNW  301 (427)
T ss_pred             c-cccccceeeecccc
Confidence            9 99999999988665


No 6  
>COG2850 Uncharacterized conserved protein [Function unknown]
Probab=99.56  E-value=7.9e-15  Score=136.19  Aligned_cols=187  Identities=19%  Similarity=0.235  Sum_probs=112.6

Q ss_pred             CCCHHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhcCCCCcEEEEeccCCCCCcccccCCCCCCccccccc
Q 021159           28 PPTPLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTLSSSPPVSVHLSPNGRADSLVTLTHPRSGEISQCFA  107 (316)
Q Consensus        28 ~~s~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~G~~~~V~V~~~~~~~~d~~~~~~~~~~g~~~~~F~  107 (316)
                      .+|+++|+++|+ ..||+||||+..  +.  .+.-+. +-|+..+-.. .|+-+.-.....+              +   
T Consensus        14 glt~~~FL~~YW-qkKPlliR~a~p--~~--~~p~~p-deLa~La~~e-dV~srLV~~~~~~--------------~---   69 (383)
T COG2850          14 GLTPEDFLRDYW-QKKPLLIRNAFP--EF--HSPLSP-DELAGLAQEE-DVTSRLVSHESDG--------------T---   69 (383)
T ss_pred             CCCHHHHHHHHh-hhcchHHhhccc--cc--ccCCCH-HHHHHHhccc-cccchhhhhccCC--------------c---
Confidence            599999999999 669999999887  42  223232 3488777666 6654432111011              1   


Q ss_pred             ccceeeecHHHHHHHHhccCCCCccccccccc-cccchhhhhhhcccccchhhhHHhhCCCCCeeEEEeeCCCCCCCccc
Q 021159          108 SAHVERLPFDEALQLVSNSKNGDVVAYLQQQN-DCFRDEYSVLGSDCDEHIAWATEALGCYPEAVNLWIGNQLSETSFHK  186 (316)
Q Consensus       108 ~~~~~~mt~~efl~~~~~~~~~~~~~Yl~~~~-~~l~~~~p~L~~D~~~~~p~~~~~~~~~~~~~~lwiG~~gs~t~~H~  186 (316)
                       .....-+|.++ +.....    ..+-+-.++ ..+..+...|.+-++ .+|   +   -....+.+.....|.+...|+
T Consensus        70 -w~~~~gPfe~~-d~~~~p----~~wsllvq~vd~w~p~v~~l~~~Fr-flP---~---wr~ddiMIS~a~~GGgvg~H~  136 (383)
T COG2850          70 -WQVSHGPFEEE-DFLGLP----RNWSLLVQAVDHWHPEVAALMEPFR-FLP---D---WRIDDIMISFAAPGGGVGPHF  136 (383)
T ss_pred             -eeEeeCccchh-ccccCC----cCceEEEehhhhcCHHHHHHHHHhc-cCc---c---ccccceEEEEecCCCccCccc
Confidence             02233444433 111110    122222221 112233344555443 233   0   012355666777888999999


Q ss_pred             cCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccccCCCCCccccccccccC
Q 021159          187 DHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPYPSPETRESEMAKF  266 (316)
Q Consensus       187 D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~~~~~~~~pd~~~f  266 (316)
                      |.|++|++|.+|+|||.|-.+.+....++.+.            ..                ..++              
T Consensus       137 D~YDVfliQg~G~RRW~v~~~~~~~~~~~~~d------------~~----------------~~~~--------------  174 (383)
T COG2850         137 DQYDVFLIQGQGRRRWRVGKKCNMSTLCPHPD------------LL----------------ILAP--------------  174 (383)
T ss_pred             cchheeEEeecccceeecCCcccccCcCCCcc------------hh----------------hcCC--------------
Confidence            99999999999999999988877655554221            00                0111              


Q ss_pred             CCccCCCccEEEEEcCCCEEeeC-cCcceeeec
Q 021159          267 PLYFNGPKPFECTVNAGEILYLL-IWFRKAVRN  298 (316)
Q Consensus       267 P~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~  298 (316)
                           .....+.+|+|||+|||| +|||+-|..
T Consensus       175 -----f~~~~d~vlepGDiLYiPp~~~H~gvae  202 (383)
T COG2850         175 -----FEPDIDEVLEPGDILYIPPGFPHYGVAE  202 (383)
T ss_pred             -----CCchhhhhcCCCceeecCCCCCcCCccc
Confidence                 145578899999999999 999998877


No 7  
>PF08007 Cupin_4:  Cupin superfamily protein;  InterPro: IPR022777  This signature represents primarily the cupin fold found in JmjC transcription factors. The fold is also found in lysine-specific demethylase NO66.; PDB: 2XDV_A 1VRB_B 4DIQ_B.
Probab=99.46  E-value=9.8e-14  Score=130.76  Aligned_cols=91  Identities=21%  Similarity=0.339  Sum_probs=56.8

Q ss_pred             CCeeEEEeeCCC-CCCCccccCCCcEEEEEEeEEEEEEeCCCCCCC-CcccccCCcccccccccCCcceeeeccCCcccc
Q 021159          168 PEAVNLWIGNQL-SETSFHKDHYENLYTVVSGQKHFLLLPPTDVHR-MYIRQYPAAHYSYSRVNDVERFTLELEEPVRYV  245 (316)
Q Consensus       168 ~~~~~lwiG~~g-s~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~-ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  245 (316)
                      ....|++++++| .+.+.|+|.+++|++|+.|+|+|.|+.+..... .+.                              
T Consensus       113 ~~~~n~Y~tp~g~~g~~~H~D~~dvfvlQ~~G~K~W~l~~~~~~~~~~~~------------------------------  162 (319)
T PF08007_consen  113 PVGANAYLTPPGSQGFGPHYDDHDVFVLQLEGRKRWRLYPPPDEPAPLYS------------------------------  162 (319)
T ss_dssp             -EEEEEEEETSSBEESECEE-SSEEEEEEEES-EEEEEE-SCCCTTTSSC------------------------------
T ss_pred             ccceEEEecCCCCCCccCEECCcccEEEECCceeEEEECCCCcccccccC------------------------------
Confidence            457899999998 579999999999999999999999999433211 110                              


Q ss_pred             cccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhhh
Q 021159          246 PWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVEL  306 (316)
Q Consensus       246 ~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~  306 (316)
                         ..+           +...   .......+++|+|||+|||| ||||++++. +.|+-+.
T Consensus       163 ---~~~-----------~~~~---~~~~~~~~~~L~pGD~LYlPrG~~H~~~~~-~~S~hlt  206 (319)
T PF08007_consen  163 ---DQP-----------FKQL---EEFEPVEEVVLEPGDVLYLPRGWWHQAVTT-DPSLHLT  206 (319)
T ss_dssp             ---E-------------TTTC---G--STSEEEEE-TT-EEEE-TT-EEEEEES-S-EEEEE
T ss_pred             ---CCC-----------cccc---ccCceeEEEEECCCCEEEECCCccCCCCCC-CCceEEE
Confidence               001           0111   11145689999999999999 999995544 4555433


No 8  
>KOG3706 consensus Uncharacterized conserved protein [Function unknown]
Probab=98.93  E-value=4.9e-10  Score=106.99  Aligned_cols=89  Identities=27%  Similarity=0.379  Sum_probs=66.8

Q ss_pred             HhhCCCCCeeEEEeeCCCC-CCCccccCCCcEEEEEEeEEEEEEeCCCCCCC-CcccccCCcccccccccCCcceeeecc
Q 021159          162 EALGCYPEAVNLWIGNQLS-ETSFHKDHYENLYTVVSGQKHFLLLPPTDVHR-MYIRQYPAAHYSYSRVNDVERFTLELE  239 (316)
Q Consensus       162 ~~~~~~~~~~~lwiG~~gs-~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~-ly~~~~~~~~~~~~~~~~~~~~~~~~~  239 (316)
                      ..||+. ...|+++.++|| +-+.|||--+.|++||.|||+|+||.|..... |+.-.                      
T Consensus       311 eqFgc~-vGaNvYLTPagSqGfaPHyDdIeaFvlQvEGrK~Wrly~P~~~~eel~l~s----------------------  367 (629)
T KOG3706|consen  311 EQFGCL-VGANVYLTPAGSQGFAPHYDDIEAFVLQVEGRKHWRLYHPTVPLEELALVS----------------------  367 (629)
T ss_pred             HHhccc-cccceeecCCCCCCCCCchhhhhhhhheeccceeeEeecCCCcHhhhhhcc----------------------
Confidence            346642 478999999987 58999999999999999999999999988643 44211                      


Q ss_pred             CCcccccccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceee
Q 021159          240 EPVRYVPWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAV  296 (316)
Q Consensus       240 ~~~~~~~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv  296 (316)
                               .-|.      ..-|+        +.+.++.+|+|||+||+| |..||+.
T Consensus       368 ---------S~Nf------~eedl--------gePV~e~vle~GDllYfPRG~IHQA~  402 (629)
T KOG3706|consen  368 ---------SDNF------TEEDL--------GEPVHEFVLEPGDLLYFPRGTIHQAD  402 (629)
T ss_pred             ---------CCCC------ChhHh--------CCchHHhhcCCCcEEEecCcceeecc
Confidence                     0011      11122        256789999999999999 9999954


No 9  
>PF02373 JmjC:  JmjC domain, hydroxylase;  InterPro: IPR013129 Jumonji protein is required for neural tube formation in mice [].There is evidence of domain swapping within the jumonji family of transcription factors []. This domain is often associated with jmjN (see IPR003349 from INTERPRO) and belongs to the Cupin superfamily [].; PDB: 2YU2_A 2YU1_A 3AVR_A 3AVS_A 2OX0_B 2OQ6_B 2WWJ_A 2Q8D_A 3PDQ_A 2YBK_A ....
Probab=98.89  E-value=2.5e-10  Score=90.89  Aligned_cols=110  Identities=20%  Similarity=0.223  Sum_probs=62.3

Q ss_pred             EEEeeCCCCCCCccccCCCcE---EEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCccccccc
Q 021159          172 NLWIGNQLSETSFHKDHYENL---YTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWC  248 (316)
Q Consensus       172 ~lwiG~~gs~t~~H~D~~~n~---~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s  248 (316)
                      ++.||..+|.|++|.|.....   +...-|.|.|.++||.+...+...--  ...       ..      ..+.. ..+.
T Consensus         1 ~~~ig~~~s~t~~H~e~~~~~sv~~~~~g~~k~W~~v~~~~~~~~~~~~~--~~~-------~~------~~~~~-~~~~   64 (114)
T PF02373_consen    1 WLYIGMKGSYTPWHIEDNGLSSVNYHHFGGSKVWYIVPPEDADKFEKFLR--SKE-------SQ------NCPQF-LDHK   64 (114)
T ss_dssp             EEEEE-TTEEEEEEE-GGG-EEEEEEEEESEEEEEEE-GGGHHHHHHHHH--HHH-------HH------HSTTG-GCTG
T ss_pred             CEEEeCCCcCCCcEecCCCCceeeeeccCcceEeEEechhhhhhHHHHHh--hcc-------cc------ccccc-cccc
Confidence            578999999999999955433   35678899999999998765442110  000       00      00000 0111


Q ss_pred             ccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhhhccc
Q 021159          249 SVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVELMQA  309 (316)
Q Consensus       249 ~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~~~  309 (316)
                      . +.      ..|+.    +...+.+.++++++|||++||| ||||+ |-+.+.||.+..+|
T Consensus        65 ~-~~------~~p~~----l~~~gi~~~~~~Q~~Ge~V~i~pg~~H~-v~n~g~~i~~a~Nf  114 (114)
T PF02373_consen   65 N-IF------VSPEQ----LKKAGIPVYRFVQKPGEFVFIPPGAYHQ-VFNLGDNISEAVNF  114 (114)
T ss_dssp             G-EE------EGHHH----HHHTTS--EEEEEETT-EEEE-TT-EEE-EEESSSEEEEEEEE
T ss_pred             c-cc------cceee----eeccCcccccceECCCCEEEECCCceEE-EEeCCceEEEEecC
Confidence            0 00      11221    1112378899999999999999 99999 77888898876654


No 10 
>KOG1633 consensus F-box protein JEMMA and related proteins with JmjC, PHD, F-box and LRR domains [Chromatin structure and dynamics]
Probab=98.00  E-value=1.1e-05  Score=83.44  Aligned_cols=202  Identities=18%  Similarity=0.214  Sum_probs=114.3

Q ss_pred             HHHHHhhcCCCCEEEEcCCCCCCCcccc--CCCChhhHHHhcCCCCcEEEEeccCCCCCcccccCCCCCCcccccccccc
Q 021159           33 QFLRDYVSQNKPCIIKNVSLHHQWPAFS--LWPHPSYLSKTLSSSPPVSVHLSPNGRADSLVTLTHPRSGEISQCFASAH  110 (316)
Q Consensus        33 ~F~~~y~~~~~PvVi~g~~~~~~WpA~~--~Wt~~eyL~~~~G~~~~V~V~~~~~~~~d~~~~~~~~~~g~~~~~F~~~~  110 (316)
                      +|.++-. .+.|++++.-..  .-.++-  ..+. .--+...|..+.+.|.....             +          .
T Consensus         9 ef~~~~~-~~~p~~~~~~~~--lg~~~p~p~f~v-~dv~~~vg~~r~~~v~dv~~-------------q----------~   61 (776)
T KOG1633|consen    9 EFLQDNG-LRVPILFRNKDG--LGMTLPSPDFTV-NDVKELVGSDRMIDVVDVNT-------------Q----------K   61 (776)
T ss_pred             hhhhhcc-cccchhhccCCC--ccccCCCCCcch-hhhHHhhCCCccceeeeeec-------------c----------c
Confidence            4555443 456888864211  112221  3443 33445667665777653211             0          1


Q ss_pred             eeeecHHHHHHHHhccCCCCccccc-ccc---ccccc--hhhhhhhccccc-chhhhHHhhCC-CCCeeEEEeeCCCCCC
Q 021159          111 VERLPFDEALQLVSNSKNGDVVAYL-QQQ---NDCFR--DEYSVLGSDCDE-HIAWATEALGC-YPEAVNLWIGNQLSET  182 (316)
Q Consensus       111 ~~~mt~~efl~~~~~~~~~~~~~Yl-~~~---~~~l~--~~~p~L~~D~~~-~~p~~~~~~~~-~~~~~~lwiG~~gs~t  182 (316)
                      .-.|++.+|++........+  +|= -+.   +..|.  .+-|.+..++.- +--|..+.... ......+.|+-.++.|
T Consensus        62 ~~km~~~~~~~yy~~~~~~R--~yNVisLEfS~Trl~~~V~~P~ivr~ldwV~n~wP~~~~~~~P~vqkyclmsv~~~Yt  139 (776)
T KOG1633|consen   62 DCKMTLKEFVKYYSSPQRKR--LYNVISLEFSDTRLSNLVESPEIVRKLDWVDNQWPDDLKMEYPKVQKYCLMSVKDSYT  139 (776)
T ss_pred             cccccHHHHhhhhcCcchhh--hhheeccccCcchHHhcCCCchhhhhhhchhccCCchhcccccccccceeeecccccc
Confidence            35899999999998765432  331 111   11110  012334333210 00021222222 2245678899999999


Q ss_pred             CccccCCCc--EEEEEEeEEEEEEeCCCCCCC-CcccccCCcccccccccCCcceeeeccCCcccccccccCCCCCcccc
Q 021159          183 SFHKDHYEN--LYTVVSGQKHFLLLPPTDVHR-MYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPYPSPETR  259 (316)
Q Consensus       183 ~~H~D~~~n--~~~qv~G~Kr~~L~pP~~~~~-ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~~~~~~~  259 (316)
                      .+|.|....  ++-.+.|.|+++|++|..... +|....                             +..+        
T Consensus       140 dfhidfggtsvwyhil~G~K~f~lI~pt~~nl~~ye~w~-----------------------------~s~~--------  182 (776)
T KOG1633|consen  140 DFHIDFGGTSVWYHILAGEKTFYLIPPTCENLELYECWE-----------------------------SSTP--------  182 (776)
T ss_pred             ccccCCCCcchhhhhhccccceeeeCCcccchhhhhhhh-----------------------------hccc--------
Confidence            999997654  467799999999999999876 443210                             0111        


Q ss_pred             ccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchh
Q 021159          260 ESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVV  304 (316)
Q Consensus       260 ~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~  304 (316)
                       -|...|+.-.  ..++.|+|++|++|||| ||-|. |.....+++
T Consensus       183 -q~~~ffGd~V--dkC~~~~l~~g~T~~iPsGwIhA-V~Tp~d~l~  224 (776)
T KOG1633|consen  183 -QDEIFFGDCV--DKCYKCILKQGQTLFIPSGWIHA-VLTPTDCLV  224 (776)
T ss_pred             -ccccccCCcc--ceeEEEEeccCceEecccceeEe-eecCcchhe
Confidence             1122333221  67899999999999999 99999 555555543


No 11 
>KOG2132 consensus Uncharacterized conserved protein, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=97.84  E-value=4.4e-06  Score=77.19  Aligned_cols=95  Identities=18%  Similarity=0.254  Sum_probs=65.7

Q ss_pred             EeeCCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccccCCC
Q 021159          174 WIGNQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCSVNPY  253 (316)
Q Consensus       174 wiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~vd~~  253 (316)
                      -++.....|..|+|...|++.|+.|-||.++++|++  ++|-..+  .-|+     +..+              -..|+ 
T Consensus       179 TvpvEvg~~y~~~~w~q~l~t~~~g~~R~~~~~p~~--~~YlAqh--~lfd-----qi~e--------------lk~Di-  234 (355)
T KOG2132|consen  179 TVPVEVGSTYADEDWSQNLMTQIKGIKRCILFEPRE--CLYLAQH--HLFD-----QIPE--------------LKFDI-  234 (355)
T ss_pred             eeeeecccccchhHHHhhhHHHhhhhhhhhcCCccc--cchhhhh--hhhc-----cchh--------------hhhcc-
Confidence            344555568999999999999999999999999993  3442211  0110     1111              12355 


Q ss_pred             CCccccccccccCCCccCC-CccEEEEEcCCCEEeeC-cCcceeee
Q 021159          254 PSPETRESEMAKFPLYFNG-PKPFECTVNAGEILYLL-IWFRKAVR  297 (316)
Q Consensus       254 ~~~~~~~pd~~~fP~~~~~-~~~~~~~L~pGD~LfiP-gWwH~vv~  297 (316)
                           ..||+.++|.|... +....++..+|++++|| .|||.++.
T Consensus       235 -----~iPDyc~~~~f~~~~v~~~~w~GpaGtV~pih~dp~hNi~~  275 (355)
T KOG2132|consen  235 -----SIPDYCSFPNFENEVVDINAWIGPAGTVLPIHMDPWHNILS  275 (355)
T ss_pred             -----CCCceeecCCCCccccceeEEeccCCceeccccccccceee
Confidence                 67899999998763 44455555559999999 99999543


No 12 
>smart00558 JmjC A domain family that is part of the cupin metalloenzyme superfamily. Probable enzymes, but of unknown functions, that regulate chromatin reorganisation processes (Clissold and Ponting, in press).
Probab=96.22  E-value=0.0034  Score=43.57  Aligned_cols=29  Identities=31%  Similarity=0.461  Sum_probs=25.1

Q ss_pred             eeEEEeeCCCCCCCccccCCC--cEEEEEEe
Q 021159          170 AVNLWIGNQLSETSFHKDHYE--NLYTVVSG  198 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~--n~~~qv~G  198 (316)
                      ..++|||+.+|.|++|+|.++  |++.++.|
T Consensus        27 ~~~~~~G~~~s~t~~H~d~~~~~n~~~~~~~   57 (57)
T smart00558       27 VPYLYMGMAGSVTPWHIDDYDLVNYLHQGAG   57 (57)
T ss_pred             cceEEEeCCCCccceeEcCCCeEEEEEecCC
Confidence            489999999999999999999  77776654


No 13 
>COG2140 Thermophilic glucose-6-phosphate isomerase and related metalloenzymes [Carbohydrate transport and metabolism / General function prediction only]
Probab=95.32  E-value=0.059  Score=47.45  Aligned_cols=26  Identities=15%  Similarity=0.307  Sum_probs=21.6

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ..++.++|||++||| +|-|.+++..+
T Consensus       125 ~~v~~~~~Gd~iyVPp~~gH~t~N~Gd  151 (209)
T COG2140         125 ARVIAVRAGDVIYVPPGYGHYTINTGD  151 (209)
T ss_pred             EEEEEecCCcEEEeCCCcceEeecCCC
Confidence            467889999999999 99999555544


No 14 
>PF00190 Cupin_1:  Cupin;  InterPro: IPR006045 This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel). This family contains 11S and 7S plant seed storage proteins, and germins. Plant seed storage proteins provide the major nitrogen source for the developing plant. ; GO: 0045735 nutrient reservoir activity; PDB: 2E9Q_A 2EVX_A 1OD5_A 1UCX_A 1UD1_C 1FXZ_C 3KGL_C 3KSC_D 1UIJ_F 1IPK_B ....
Probab=94.30  E-value=0.042  Score=45.57  Aligned_cols=33  Identities=12%  Similarity=0.167  Sum_probs=25.3

Q ss_pred             CCCCCCCccccCCCcEEEEEEeEEEEEEeCCCC
Q 021159          177 NQLSETSFHKDHYENLYTVVSGQKHFLLLPPTD  209 (316)
Q Consensus       177 ~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~  209 (316)
                      .+|+....|+...+-++.+++|+=++.++.|..
T Consensus        42 ~pg~~~~Ph~h~a~~i~~V~~G~~~~~~v~~~~   74 (144)
T PF00190_consen   42 EPGGLRAPHYHNADEIVYVIEGRGRVGVVGPGG   74 (144)
T ss_dssp             ETTEEEEEEEESSEEEEEEEESEEEEEEEETTC
T ss_pred             hcCCccceeEeeeeEEeeeeccceEEEEEecCC
Confidence            456888889884555788999999888876654


No 15 
>TIGR03037 anthran_nbaC 3-hydroxyanthranilate 3,4-dioxygenase. Members of this protein family, from both bacteria and eukaryotes, are the enzyme 3-hydroxyanthranilate 3,4-dioxygenase. This enzyme acts on the tryptophan metabolite 3-hydroxyanthranilate and produces 2-amino-3-carboxymuconate semialdehyde, which can rearrange spontaneously to quinolinic acid and feed into nicotinamide biosynthesis, or undergo further enzymatic degradation.
Probab=94.05  E-value=0.23  Score=42.03  Aligned_cols=35  Identities=20%  Similarity=0.327  Sum_probs=27.8

Q ss_pred             eeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEE
Q 021159          170 AVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLL  204 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L  204 (316)
                      ..-+-+|.++..+.+|.+..+-++.|+.|.=.+.+
T Consensus        29 ~~v~~vgGpn~R~d~H~~~tdE~FyqleG~~~l~v   63 (159)
T TIGR03037        29 FMVTVVGGPNARTDFHDDPGEEFFYQLKGEMYLKV   63 (159)
T ss_pred             EEEEEeCCCCCCcccccCCCceEEEEEcceEEEEE
Confidence            34455788889999999989999999999854433


No 16 
>PRK13264 3-hydroxyanthranilate 3,4-dioxygenase; Provisional
Probab=94.02  E-value=0.2  Score=43.16  Aligned_cols=72  Identities=17%  Similarity=0.226  Sum_probs=53.4

Q ss_pred             eeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccc
Q 021159          170 AVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCS  249 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~  249 (316)
                      ..-+.+|.+|..+.+|+|+.+-++-|+.|.=++.+..                                           
T Consensus        35 ~~VmvvgGpn~r~d~H~~~tdE~FyqleG~~~l~v~d-------------------------------------------   71 (177)
T PRK13264         35 FIVMVVGGPNARTDFHYDPGEEFFYQLEGDMYLKVQE-------------------------------------------   71 (177)
T ss_pred             EEEEEEccCCcccccccCCCceEEEEECCeEEEEEEc-------------------------------------------
Confidence            3445578888999999999999999999985544411                                           


Q ss_pred             cCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhhhc
Q 021159          250 VNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVELM  307 (316)
Q Consensus       250 vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~  307 (316)
                        -                    .+..+++|++||+++|| +=-|.-++ .+.++.+.+
T Consensus        72 --~--------------------g~~~~v~L~eGd~fllP~gvpHsP~r-~~~tv~Lvi  107 (177)
T PRK13264         72 --D--------------------GKRRDVPIREGEMFLLPPHVPHSPQR-EAGSIGLVI  107 (177)
T ss_pred             --C--------------------CceeeEEECCCCEEEeCCCCCcCCcc-CCCeEEEEE
Confidence              0                    12357899999999999 99999555 555654444


No 17 
>TIGR03404 bicupin_oxalic bicupin, oxalate decarboxylase family. Members of this protein family are defined as bicupins as they have two copies of the cupin domain (pfam00190). Two different known activities for members of this family are oxalate decarboxylase (EC 4.1.1.2) and oxalate oxidase (EC 1.2.3.4), although the latter activity has more often been found in distantly related monocupin (germin) proteins.
Probab=91.48  E-value=0.75  Score=44.38  Aligned_cols=24  Identities=21%  Similarity=0.170  Sum_probs=19.7

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      ..+..|+|||++||| |..|+ +.|.
T Consensus       288 ~~~~~l~~GD~~~iP~g~~H~-i~N~  312 (367)
T TIGR03404       288 ARTFDYQAGDVGYVPRNMGHY-VENT  312 (367)
T ss_pred             EEEEEECCCCEEEECCCCeEE-EEEC
Confidence            355679999999999 99999 5544


No 18 
>PF06560 GPI:  Glucose-6-phosphate isomerase (GPI);  InterPro: IPR010551 This entry consists of several bacterial and archaeal glucose-6-phosphate isomerase (GPI) proteins (5.3.1.9 from EC), which are involved in glycolysis and in gluconeogenesis and catalyse the conversion of D-glucose 6-phosphate to D-fructose 6-phosphate. The deduced amino acid sequence of the first archaeal PGI isolated from Pyrococcus furiosus revealed that it is not related to its eukaryotic and many of its bacterial counterparts. In contrast, this archaeal PGI shares similarity with the cupin superfamily that consists of a variety of proteins that are generally involved in sugar metabolism in both prokaryotes and eukaryotes [].; GO: 0004347 glucose-6-phosphate isomerase activity, 0006094 gluconeogenesis, 0006096 glycolysis, 0005737 cytoplasm; PDB: 1J3Q_B 1J3R_B 1J3P_A 2GC0_A 1X8E_A 1X82_A 1QY4_B 2GC2_B 1QXJ_A 1QXR_B ....
Probab=89.81  E-value=0.22  Score=43.21  Aligned_cols=29  Identities=7%  Similarity=0.331  Sum_probs=19.9

Q ss_pred             ccEEEEEcCCCEEeeC-cCcceeeecCCcc
Q 021159          274 KPFECTVNAGEILYLL-IWFRKAVRNSEVN  302 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~  302 (316)
                      ..+-+...|||+++|| +|-|.+|+..+..
T Consensus       108 ~~~~v~~~~G~~v~IPp~yaH~tIN~g~~~  137 (182)
T PF06560_consen  108 DVIAVEAKPGDVVYIPPGYAHRTINTGDEP  137 (182)
T ss_dssp             -EEEEEE-TTEEEEE-TT-EEEEEE-SSS-
T ss_pred             eEEEEEeCCCCEEEECCCceEEEEECCCCc
Confidence            4678899999999999 9999988776544


No 19 
>PF07883 Cupin_2:  Cupin domain;  InterPro: IPR013096 This family represents the conserved barrel domain of the cupin superfamily [] (cupa is the Latin term for a small barrel). ; PDB: 2OPK_C 3BU7_B 2PHD_D 3NVC_A 3NKT_A 3NJZ_A 3NW4_A 3NST_A 3NL1_A 2H0V_A ....
Probab=89.46  E-value=0.74  Score=32.51  Aligned_cols=23  Identities=9%  Similarity=0.174  Sum_probs=19.2

Q ss_pred             EEEEcCCCEEeeC-cCcceeeecC
Q 021159          277 ECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       277 ~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      ...|+|||+++|| +=+|.+.+..
T Consensus        38 ~~~l~~Gd~~~i~~~~~H~~~n~~   61 (71)
T PF07883_consen   38 RVELKPGDAIYIPPGVPHQVRNPG   61 (71)
T ss_dssp             EEEEETTEEEEEETTSEEEEEEES
T ss_pred             EeEccCCEEEEECCCCeEEEEECC
Confidence            6789999999999 9999944443


No 20 
>PF02041 Auxin_BP:  Auxin binding protein;  InterPro: IPR000526 Auxin binding protein is located in the lumen of the endoplasmic reticulum (ER). The primary structure contains an N-terminal hydrophobic leader sequence of 30-40 amino acids, which could represent a signal for translocation of the protein to the ER [, ]. The mature protein comprises around 165 residues, and contains a number of potential N-glycosylation sites. In vitro transport studies have demonstrated co-translational glycosylation []. Retention within the lumen of the ER correlates with an additional signal located at the C terminus, represented by the sequence Lys-Asp-Glu-Leu, known to be responsible for preventing secretion of proteins from the lumen of the ER in eukaryotic cells [, ].; GO: 0004872 receptor activity, 0005788 endoplasmic reticulum lumen; PDB: 1LR5_D 1LRH_D.
Probab=89.30  E-value=1.2  Score=37.29  Aligned_cols=69  Identities=20%  Similarity=0.369  Sum_probs=38.9

Q ss_pred             eEEEee--CCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCccccccc
Q 021159          171 VNLWIG--NQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWC  248 (316)
Q Consensus       171 ~~lwiG--~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s  248 (316)
                      ..+|+-  .+|+.||.|...++-.++++.|+=...|....                                        
T Consensus        44 vEVwlQTfAPG~~TPiHRHsCEEVFvVLkG~GTl~l~~~~----------------------------------------   83 (167)
T PF02041_consen   44 VEVWLQTFAPGSATPIHRHSCEEVFVVLKGSGTLYLASSH----------------------------------------   83 (167)
T ss_dssp             EEEEEEEE-TT-B--EEEESS-EEEEEEE--EEEEE--SS----------------------------------------
T ss_pred             eeEEeeeecCCCCCCCccccccEEEEEEecceEEEEeccc----------------------------------------
Confidence            455543  46799999999999999999999887774110                                        


Q ss_pred             ccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          249 SVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       249 ~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                                     .+||     -.+.++...|+++++|| +=-||+.++.
T Consensus        84 ---------------~~~p-----G~pqef~~~pnSTf~IPvn~~HQv~NT~  115 (167)
T PF02041_consen   84 ---------------EKYP-----GKPQEFPIFPNSTFHIPVNDAHQVWNTN  115 (167)
T ss_dssp             ---------------SSS-------S-EEEEE-TTEEEEE-TT--EEEE---
T ss_pred             ---------------ccCC-----CCceEEEecCCCeEEeCCCCcceeecCC
Confidence                           1232     45688999999999999 9999954443


No 21 
>COG4101 Predicted mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=88.85  E-value=0.32  Score=38.95  Aligned_cols=24  Identities=17%  Similarity=0.178  Sum_probs=19.9

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecC
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      ..++..|||++||| |-.|+-.++.
T Consensus        88 ~ha~~~pGDf~YiPpgVPHqp~N~S  112 (142)
T COG4101          88 EHAEVGPGDFFYIPPGVPHQPANLS  112 (142)
T ss_pred             eeEEecCCCeEEcCCCCCCcccccC
Confidence            57889999999999 9999944443


No 22 
>TIGR02272 gentisate_1_2 gentisate 1,2-dioxygenase. This family consists of gentisate 1,2-dioxygenases. This ring-opening enzyme acts in salicylate degradation that goes via gentisate rather than via catechol. It converts gentisate to maleylpyruvate. Some putative gentisate 1,2-dioxygenases are excluded by a relatively high trusted cutoff score because they are too closely related to known examples of 1-hydroxy-2-naphthoate dioxygenase. Therefore some homologs may be bona fide gentisate 1,2-dioxygenases even if they score below the given cutoffs.
Probab=88.71  E-value=0.86  Score=43.35  Aligned_cols=27  Identities=11%  Similarity=0.084  Sum_probs=21.3

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecCCcc
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNSEVN  302 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~~~~  302 (316)
                      ...+..++||++.+| ++||. -.|.+..
T Consensus       119 g~~~~~~~gD~~~tP~w~wH~-H~n~~d~  146 (335)
T TIGR02272       119 GERTTMHPGDFIITPSWTWHD-HGNPGDE  146 (335)
T ss_pred             CEEEeeeCCCEEEeCCCeeEe-cccCCCC
Confidence            457889999999999 99998 5555433


No 23 
>COG1917 Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=88.24  E-value=2.2  Score=34.38  Aligned_cols=35  Identities=20%  Similarity=0.130  Sum_probs=25.0

Q ss_pred             eeEEEeeCCCCCCCccccC-CCcEEEEEEeEEEEEE
Q 021159          170 AVNLWIGNQLSETSFHKDH-YENLYTVVSGQKHFLL  204 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~-~~n~~~qv~G~Kr~~L  204 (316)
                      ....+-..+|..++.|..+ .+-.+..+.|+=++.+
T Consensus        44 ~~~~v~~~~G~~~~~H~hp~~~~~~~Vl~G~~~~~~   79 (131)
T COG1917          44 SVVLVTFEPGAVIPWHTHPLGEQTIYVLEGEGTVQL   79 (131)
T ss_pred             EEEEEEECCCcccccccCCCcceEEEEEecEEEEEe
Confidence            3456667788999999987 5566777888754443


No 24 
>PRK04190 glucose-6-phosphate isomerase; Provisional
Probab=87.50  E-value=0.61  Score=40.83  Aligned_cols=25  Identities=16%  Similarity=0.445  Sum_probs=21.1

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      .....++|||++||| +|-|.+++..
T Consensus       119 ~~~~~v~pGd~v~IPpg~~H~~iN~G  144 (191)
T PRK04190        119 ARWIEMEPGTVVYVPPYWAHRSVNTG  144 (191)
T ss_pred             EEEEEECCCCEEEECCCCcEEeEECC
Confidence            577899999999999 9999955443


No 25 
>smart00835 Cupin_1 Cupin. This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel). This family contains 11S and 7S plant seed storage proteins, and germins. Plant seed storage proteins provide the major nitrogen source for the developing plant.
Probab=87.25  E-value=3  Score=34.44  Aligned_cols=25  Identities=12%  Similarity=0.228  Sum_probs=20.6

Q ss_pred             ccEEEEEcCCCEEeeC-cCcceeeec
Q 021159          274 KPFECTVNAGEILYLL-IWFRKAVRN  298 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWwH~vv~~  298 (316)
                      ...+..+++||+++|| +.+|...+.
T Consensus        73 ~~~~~~l~~GD~~~ip~g~~H~~~n~   98 (146)
T smart00835       73 KVYDARLREGDVFVVPQGHPHFQVNS   98 (146)
T ss_pred             eEEEEEecCCCEEEECCCCEEEEEcC
Confidence            3478899999999999 999994443


No 26 
>TIGR03404 bicupin_oxalic bicupin, oxalate decarboxylase family. Members of this protein family are defined as bicupins as they have two copies of the cupin domain (pfam00190). Two different known activities for members of this family are oxalate decarboxylase (EC 4.1.1.2) and oxalate oxidase (EC 1.2.3.4), although the latter activity has more often been found in distantly related monocupin (germin) proteins.
Probab=87.17  E-value=2.9  Score=40.41  Aligned_cols=34  Identities=15%  Similarity=0.139  Sum_probs=23.1

Q ss_pred             eEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEe
Q 021159          171 VNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLL  205 (316)
Q Consensus       171 ~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~  205 (316)
                      ..+-+.+. ...++|.....-+..++.|+=++.+.
T Consensus        70 ~~~~l~pG-~~~~~HwH~~~E~~yVl~G~~~v~~~  103 (367)
T TIGR03404        70 VNMRLEPG-AIRELHWHKEAEWAYVLYGSCRITAV  103 (367)
T ss_pred             eEEEEcCC-CCCCcccCCCceEEEEEeeEEEEEEE
Confidence            34455544 45678877666688999998877663


No 27 
>COG0662 {ManC} Mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=86.23  E-value=0.74  Score=37.35  Aligned_cols=25  Identities=32%  Similarity=0.351  Sum_probs=21.6

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecCCc
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNSEV  301 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~~~  301 (316)
                      -++.|++||++||| |=.|. +.|...
T Consensus        75 ~~~~v~~gd~~~iP~g~~H~-~~N~G~  100 (127)
T COG0662          75 EEVEVKAGDSVYIPAGTPHR-VRNTGK  100 (127)
T ss_pred             EEEEecCCCEEEECCCCcEE-EEcCCC
Confidence            57889999999999 99999 767654


No 28 
>PLN02288 mannose-6-phosphate isomerase
Probab=84.17  E-value=0.61  Score=45.41  Aligned_cols=31  Identities=19%  Similarity=0.145  Sum_probs=27.8

Q ss_pred             EEEEcCCCEEeeC-cCcceeeecCCcchhhhc
Q 021159          277 ECTVNAGEILYLL-IWFRKAVRNSEVNVVELM  307 (316)
Q Consensus       277 ~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~  307 (316)
                      .+.|+|||++|+| |=.|..++...+-||++.
T Consensus       252 ~v~L~PGeaifl~ag~~HAYl~G~~vE~MA~S  283 (394)
T PLN02288        252 YVKLNPGEALYLGANEPHAYLSGECIECMATS  283 (394)
T ss_pred             eEecCCCCEEEecCCCCceecCCCeEEeeecC
Confidence            7899999999999 999998888888888664


No 29 
>KOG1356 consensus Putative transcription factor 5qNCA, contains JmjC domain [Transcription]
Probab=83.08  E-value=0.45  Score=49.67  Aligned_cols=44  Identities=23%  Similarity=0.384  Sum_probs=33.7

Q ss_pred             HHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhcCCCCcEEEE
Q 021159           32 LQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTLSSSPPVSVH   81 (316)
Q Consensus        32 ~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~G~~~~V~V~   81 (316)
                      .-| +++++.++|||++|+..  .. ....|-. +.|...+|++ .+.+.
T Consensus       531 ~~F-QEhWkqGqPViVs~V~~--~l-~g~lW~P-~a~~~~~g~q-~~~l~  574 (889)
T KOG1356|consen  531 KHF-QEHWKQGQPVIVSGVHK--KL-NGLLWKP-EALSRAFGDQ-VVDLS  574 (889)
T ss_pred             HHH-HHHHhcCCcEEehHhhh--hc-cccccch-HHHHHHhccc-hhhhh
Confidence            345 55889999999999887  43 3457987 8899889998 66654


No 30 
>PF05899 Cupin_3:  Protein of unknown function (DUF861);  InterPro: IPR008579 The function of the proteins in this entry are unknown. They contain the conserved barrel domain of the 'cupin' superfamily and members are specific to plants and bacteria.; PDB: 1RC6_A 3MYX_A 1O5U_A 2K9Z_A 1LKN_A 3ES4_A 1SFN_B 3BCW_A.
Probab=82.94  E-value=0.76  Score=33.63  Aligned_cols=18  Identities=28%  Similarity=0.514  Sum_probs=14.6

Q ss_pred             ccEEEEEcCCCEEeeC-cC
Q 021159          274 KPFECTVNAGEILYLL-IW  291 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gW  291 (316)
                      ..-..+++|||++|+| ||
T Consensus        42 ~G~~~~~~aGD~~~~p~G~   60 (74)
T PF05899_consen   42 DGETVTFKAGDAFFLPKGW   60 (74)
T ss_dssp             TTEEEEEETTEEEEE-TTE
T ss_pred             CCCEEEEcCCcEEEECCCC
Confidence            3456899999999999 98


No 31 
>KOG1356 consensus Putative transcription factor 5qNCA, contains JmjC domain [Transcription]
Probab=82.72  E-value=0.7  Score=48.27  Aligned_cols=31  Identities=19%  Similarity=0.302  Sum_probs=26.8

Q ss_pred             CCccEEEEEcCCCEEeeC-cCcceeeecCCcch
Q 021159          272 GPKPFECTVNAGEILYLL-IWFRKAVRNSEVNV  303 (316)
Q Consensus       272 ~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v  303 (316)
                      +..++++++..||++||| |-.|| |+|+--.|
T Consensus       795 GVe~WtfvQ~LGdAVfIPAGaPHQ-VrNLkSCi  826 (889)
T KOG1356|consen  795 GVEPWTFVQFLGDAVFIPAGAPHQ-VRNLKSCI  826 (889)
T ss_pred             CCCccchhhcccceEEecCCCcHH-hhhhhhHH
Confidence            488999999999999999 99999 88874333


No 32 
>TIGR01221 rmlC dTDP-4-dehydrorhamnose 3,5-epimerase. This enzyme participates in the biosynthesis of dTDP-L-rhamnose, often as a precursor to LPS O-antigen
Probab=81.96  E-value=4.2  Score=35.09  Aligned_cols=37  Identities=14%  Similarity=0.019  Sum_probs=26.0

Q ss_pred             CeeEEEeeCCCCCCCccccC---CCcEEEEEEeEEEEEEe
Q 021159          169 EAVNLWIGNQLSETSFHKDH---YENLYTVVSGQKHFLLL  205 (316)
Q Consensus       169 ~~~~lwiG~~gs~t~~H~D~---~~n~~~qv~G~Kr~~L~  205 (316)
                      ...|+-++.+|+...+|+..   ..=++..++|+=.-+++
T Consensus        44 ~Q~n~S~S~~gvlRGlH~q~~~~q~Klv~c~~G~i~dV~V   83 (176)
T TIGR01221        44 VQDNHSKSYKGVLRGLHYQRPHPQGKLVRVLRGEVFDVAV   83 (176)
T ss_pred             ceeEEEEecCCEEEEEEECCCCCCceEEEEccCCEEEEEE
Confidence            35677778889999999973   23466777777655543


No 33 
>PRK15131 mannose-6-phosphate isomerase; Provisional
Probab=80.34  E-value=1.1  Score=43.52  Aligned_cols=32  Identities=16%  Similarity=0.193  Sum_probs=25.2

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecCCcchhhhc
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNSEVNVVELM  307 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~  307 (316)
                      -.+.|+|||++||| |=.|...+..-+-||++.
T Consensus       237 N~v~l~pGeaifipAg~~HAyl~G~~iEima~S  269 (389)
T PRK15131        237 NVVKLNPGEAMFLFAETPHAYLQGVALEVMANS  269 (389)
T ss_pred             eEEEeCCCCEEEeCCCCCeEEcCCeEEEEEecC
Confidence            47899999999999 999996665555556543


No 34 
>PF06052 3-HAO:  3-hydroxyanthranilic acid dioxygenase;  InterPro: IPR010329 Members of this protein family, from both bacteria and eukaryotes, are the enzyme 3-hydroxyanthranilate 3,4-dioxygenase (1.13.11.6 from EC). It is part of the kynurenine pathway for the degradation of tryptophan and the biosynthesis of nicotinic acid [].The prokaryotic homologue is involved in the 2-nitrobenzoate degradation pathway []. The enzyme acts on the tryptophan metabolite 3-hydroxyanthranilate and produces 2-amino-3-carboxymuconate semialdehyde, which can rearrange spontaneously to quinolinic acid and feed into nicotinamide biosynthesis, or undergo further enzymatic degradation.; GO: 0000334 3-hydroxyanthranilate 3,4-dioxygenase activity, 0005506 iron ion binding, 0008152 metabolic process, 0055114 oxidation-reduction process; PDB: 1ZVF_A 1YFX_A 1YFW_A 1YFY_A 1YFU_A 2QNK_A 3FE5_A.
Probab=79.86  E-value=7.9  Score=32.38  Aligned_cols=70  Identities=14%  Similarity=0.197  Sum_probs=44.1

Q ss_pred             eeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccccccc
Q 021159          170 AVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVPWCS  249 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~  249 (316)
                      ..-+.+|.+.+.+-.|+|..+-++-|+.|.=...+...                                          
T Consensus        34 f~VmvVGGPN~R~DyHine~eE~FyQ~kG~m~Lkv~e~------------------------------------------   71 (151)
T PF06052_consen   34 FIVMVVGGPNQRTDYHINETEEFFYQLKGDMCLKVVED------------------------------------------   71 (151)
T ss_dssp             EEEEEEESSB--SSEEE-SS-EEEEEEES-EEEEEEET------------------------------------------
T ss_pred             eEEEEEcCCCCCCccccCCcceEEEEEeCcEEEEEEeC------------------------------------------
Confidence            55677899999999999999999999999654333110                                          


Q ss_pred             cCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhh
Q 021159          250 VNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVE  305 (316)
Q Consensus       250 vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~  305 (316)
                                             ...-++.+++||+-++| +-.|.-++. +.||.+
T Consensus        72 -----------------------g~~kdi~I~EGe~fLLP~~vpHsP~R~-~~tiGL  104 (151)
T PF06052_consen   72 -----------------------GKFKDIPIREGEMFLLPANVPHSPQRP-ADTIGL  104 (151)
T ss_dssp             -----------------------TEEEEEEE-TTEEEEE-TT--EEEEE--TT-EEE
T ss_pred             -----------------------CceEEEEeCCCcEEecCCCCCCCCcCC-CCcEEE
Confidence                                   22347899999999999 999997765 556543


No 35 
>COG3450 Predicted enzyme of the cupin superfamily [General function prediction only]
Probab=75.59  E-value=2.1  Score=34.36  Aligned_cols=19  Identities=16%  Similarity=0.051  Sum_probs=16.6

Q ss_pred             ccEEEEEcCCCEEeeC-cCc
Q 021159          274 KPFECTVNAGEILYLL-IWF  292 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWw  292 (316)
                      ..-.+.++|||++|+| ||.
T Consensus        80 ~Ge~v~~~aGD~~~~~~G~~   99 (116)
T COG3450          80 GGEPVEVRAGDSFVFPAGFK   99 (116)
T ss_pred             CCeEEEEcCCCEEEECCCCe
Confidence            3567889999999999 996


No 36 
>PF00908 dTDP_sugar_isom:  dTDP-4-dehydrorhamnose 3,5-epimerase;  InterPro: IPR000888 Deoxythymidine diphosphate (dTDP)-4-keto-6-deoxy-d-hexulose 3, 5-epimerase (RmlC, 5.1.3.13 from EC) is involved in the biosynthesis of dTDP-l-rhamnose, which is an essential component of the bacterial cell wall, converting dTDP-4-keto-6-deoxy-D-glucose to dTDP-4-keto-L-rhamnose. The crystal structure of RmlC from Methanobacterium thermoautotrophicum was determined in the presence and absence of a substrate analogue. RmlC is a homodimer comprising a central jelly roll motif, which extends in two directions into longer beta-sheets. Binding of dTDP is stabilised by ionic interactions to the phosphate group and by a combination of ionic and hydrophobic interactions with the base. The active site, which is located in the centre of the jelly roll, is formed by residues that are conserved in all known RmlC sequence homologues. The active site is lined with a number of charged residues and a number of residues with hydrogen-bonding potentials, which together comprise a potential network for substrate binding and catalysis. The active site is also lined with aromatic residues which provide favorable environments for the base moiety of dTDP and potentially for the sugar moiety of the substrate [].; GO: 0008830 dTDP-4-dehydrorhamnose 3,5-epimerase activity, 0009103 lipopolysaccharide biosynthetic process; PDB: 1EPZ_A 1EP0_A 1NXM_A 1NZC_D 2IXL_C 1NYW_B 2IXC_D 1PM7_B 1UPI_A 3RYK_B ....
Probab=75.16  E-value=8.8  Score=33.09  Aligned_cols=76  Identities=12%  Similarity=0.041  Sum_probs=49.0

Q ss_pred             CeeEEEeeCCCCCCCccccCCC----cEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCccc
Q 021159          169 EAVNLWIGNQLSETSFHKDHYE----NLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRY  244 (316)
Q Consensus       169 ~~~~lwiG~~gs~t~~H~D~~~----n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  244 (316)
                      ...++-.+.+|+.-.+|+....    =++..++|+=--+++                                       
T Consensus        43 ~q~n~S~s~~gvlRGlH~q~~~~~q~Klv~~~~G~i~dV~v---------------------------------------   83 (176)
T PF00908_consen   43 VQDNISVSKKGVLRGLHYQSPPYAQAKLVRCLRGEIFDVAV---------------------------------------   83 (176)
T ss_dssp             EEEEEEEEETTBEEEEEEESTTT-EEEEEEEEESEEEEEEE---------------------------------------
T ss_pred             CceEEEEccccEEEEEEEecCCCCCCcEEEEecCeEEEEEE---------------------------------------
Confidence            3567888888999999998543    356777776543332                                       


Q ss_pred             ccccccCCCCCccccccccccCCCccCCCccEEEEEcCCC--EEeeC-cCcceeeecCCcc
Q 021159          245 VPWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGE--ILYLL-IWFRKAVRNSEVN  302 (316)
Q Consensus       245 ~~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD--~LfiP-gWwH~vv~~~~~~  302 (316)
                            |+          ...-|.|   -+...++|.+++  +|||| |-+|-..+..+.+
T Consensus        84 ------Dl----------R~~SpTf---g~~~~~~Ls~~n~~~l~IP~G~aHGf~~l~d~a  125 (176)
T PF00908_consen   84 ------DL----------RKGSPTF---GKWVSVELSAENPRQLYIPPGVAHGFQTLEDDA  125 (176)
T ss_dssp             ------E-----------BTTSTTT---T-EEEEEEETTT--EEEE-TTEEEEEEESSSEE
T ss_pred             ------EC----------CCCCCCC---CEEEEEEeCccccCEEEeCCcceeeEEeccCce
Confidence                  22          1222343   346788888876  79999 9999955555444


No 37 
>PRK13290 ectC L-ectoine synthase; Reviewed
Probab=74.65  E-value=2.8  Score=33.99  Aligned_cols=27  Identities=15%  Similarity=-0.060  Sum_probs=21.6

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecCCcc
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNSEVN  302 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~~~~  302 (316)
                      ..+..|+|||++|+| +=.|. ..|.+..
T Consensus        74 g~~~~L~aGD~i~~~~~~~H~-~~N~e~~  101 (125)
T PRK13290         74 GEVHPIRPGTMYALDKHDRHY-LRAGEDM  101 (125)
T ss_pred             CEEEEeCCCeEEEECCCCcEE-EEcCCCE
Confidence            356889999999999 99999 5554443


No 38 
>KOG2508 consensus Predicted phospholipase [Lipid transport and metabolism]
Probab=74.29  E-value=3.4  Score=39.39  Aligned_cols=40  Identities=25%  Similarity=0.594  Sum_probs=28.7

Q ss_pred             ccccccc--CCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          259 RESEMAK--FPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       259 ~~pd~~~--fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ++.|.++  +-.++. .-.+.++++|||++|+| -|.|. |++.+
T Consensus       343 e~~d~~~~~l~~lA~-~~~l~v~~~~~~~~~l~~~~~~~-~~~~~  385 (437)
T KOG2508|consen  343 KNVDVDKDELSALAG-TVPLVVDLEPGDMLYLPASWFHE-VTSSS  385 (437)
T ss_pred             cccccchhhcccccc-ceeEEEecccCceeeechhheee-eeccc
Confidence            4444444  433443 66789999999999999 99999 55543


No 39 
>COG1482 ManA Phosphomannose isomerase [Carbohydrate transport and metabolism]
Probab=71.02  E-value=2.7  Score=39.59  Aligned_cols=31  Identities=13%  Similarity=0.131  Sum_probs=23.5

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecCCcchhhh
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNSEVNVVEL  306 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~  306 (316)
                      -.+.|+|||++|+| |-.|......-.-||.|
T Consensus       158 n~v~lkpGe~~fl~Agt~HA~~~G~~lEvmqn  189 (312)
T COG1482         158 NRVKLKPGEAFFLPAGTPHAYLKGLVLEVMQN  189 (312)
T ss_pred             cEEecCCCCEEEecCCCceeeccceEEEEEec
Confidence            47899999999999 99999655543444444


No 40 
>KOG2107 consensus Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=69.72  E-value=4.6  Score=34.29  Aligned_cols=32  Identities=16%  Similarity=0.242  Sum_probs=26.9

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecCCcchhh
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVE  305 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~  305 (316)
                      ...+.+-++.||+|+|| |-+|. -+..+-|.+-
T Consensus       113 d~WIRi~vekGDlivlPaGiyHR-FTtt~~n~vk  145 (179)
T KOG2107|consen  113 DQWIRIFVEKGDLIVLPAGIYHR-FTTTPSNYVK  145 (179)
T ss_pred             CCEEEEEEecCCEEEecCcceee-eecCchHHHH
Confidence            56789999999999999 99999 7777666543


No 41 
>PF06249 EutQ:  Ethanolamine utilisation protein EutQ;  InterPro: IPR010424 The eut operon of Salmonella typhimurium encodes proteins involved in the cobalamin-dependent degradation of ethanolamine. The role of EutQ in this process is unclear [].; PDB: 2PYT_B 3LWC_A.
Probab=68.87  E-value=3.8  Score=34.50  Aligned_cols=17  Identities=12%  Similarity=0.245  Sum_probs=12.6

Q ss_pred             cEEEEEcCCCEEeeC-cC
Q 021159          275 PFECTVNAGEILYLL-IW  291 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gW  291 (316)
                      ..+.+.+|||+|||| |=
T Consensus       112 G~~~~A~~GDvi~iPkGs  129 (152)
T PF06249_consen  112 GQTVTAKPGDVIFIPKGS  129 (152)
T ss_dssp             TEEEEEETT-EEEE-TT-
T ss_pred             CEEEEEcCCcEEEECCCC
Confidence            578899999999999 83


No 42 
>COG1898 RfbC dTDP-4-dehydrorhamnose 3,5-epimerase and related enzymes [Cell envelope biogenesis, outer membrane]
Probab=68.25  E-value=19  Score=30.99  Aligned_cols=35  Identities=23%  Similarity=0.116  Sum_probs=25.4

Q ss_pred             eeEEEeeCCCCCCCccccCCC-c-EEEEEEeEEEEEE
Q 021159          170 AVNLWIGNQLSETSFHKDHYE-N-LYTVVSGQKHFLL  204 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~-n-~~~qv~G~Kr~~L  204 (316)
                      ..|+-++.+|+.-.+||.... + +++.++|+=...+
T Consensus        46 Q~n~S~S~~GvlRGlHyq~~~q~klv~~v~G~v~dv~   82 (173)
T COG1898          46 QDNHSFSYPGVLRGLHYQHKPQGKLVRVVSGKVFDVA   82 (173)
T ss_pred             cceEEEecCCeeEEEEcccCCCCeEEEEecCeEEEEE
Confidence            567778889999999999655 4 4566677655444


No 43 
>PRK15457 ethanolamine utilization protein EutQ; Provisional
Probab=66.83  E-value=4.6  Score=36.30  Aligned_cols=22  Identities=9%  Similarity=0.082  Sum_probs=18.9

Q ss_pred             CccEEEEEcCCCEEeeC-cCcce
Q 021159          273 PKPFECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~  294 (316)
                      ...-+.+++|||+|||| |=.|+
T Consensus       190 IdG~t~~l~pGDvlfIPkGs~~h  212 (233)
T PRK15457        190 HEGETMIAKAGDVMFIPKGSSIE  212 (233)
T ss_pred             ECCEEEEeCCCcEEEECCCCeEE
Confidence            34678899999999999 99966


No 44 
>PF01238 PMI_typeI:  Phosphomannose isomerase type I;  InterPro: IPR001250 Mannose-6-phosphate isomerase or phosphomannose isomerase (5.3.1.8 from EC) (PMI) is the enzyme that catalyses the interconversion of mannose-6-phosphate and fructose-6-phosphate. In eukaryotes PMI is involved in the synthesis of GDP-mannose, a constituent of N- and O-linked glycans and GPI anchors and in prokaryotes it participates in a variety of pathways, including capsular polysaccharide biosynthesis and D-mannose metabolism. PMI's belong to the cupin superfamily whose functions range from isomerase and epimerase activities involved in the modification of cell wall carbohydrates in bacteria and plants, to non-enzymatic storage proteins in plant seeds, and transcription factors linked to congenital baldness in mammals []. Three classes of PMI have been defined []. Type I includes eukaryotic PMI and the enzyme encoded by the manA gene in enterobacteria. PMI has a bound zinc ion, which is essential for activity. A crystal structure of PMI from Candida albicans shows that the enzyme has three distinct domains []. The active site lies in the central domain, contains a single essential zinc atom, and forms a deep, open cavity of suitable dimensions to contain M6P or F6P The central domain is flanked by a helical domain on one side and a jelly-roll like domain on the other.; GO: 0004476 mannose-6-phosphate isomerase activity, 0008270 zinc ion binding, 0005975 carbohydrate metabolic process; PDB: 1PMI_A 1QWR_B 1ZX5_A 3H1Y_A 2WFP_A 3H1M_A 3H1W_A.
Probab=66.35  E-value=2.3  Score=41.11  Aligned_cols=31  Identities=13%  Similarity=0.060  Sum_probs=24.4

Q ss_pred             EEEEcCCCEEeeC-cCcceeeecCCcchhhhc
Q 021159          277 ECTVNAGEILYLL-IWFRKAVRNSEVNVVELM  307 (316)
Q Consensus       277 ~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~  307 (316)
                      .+.|+|||++|+| +=.|..++-..+-+|++.
T Consensus       251 ~v~L~pGeaifl~a~~~HAYl~G~~vE~MA~S  282 (373)
T PF01238_consen  251 YVELQPGEAIFLPAGEPHAYLSGDCVECMANS  282 (373)
T ss_dssp             EEEE-TT-EEEEHTTHHEEEEEEEEEEEEESS
T ss_pred             EEEecCCceEEecCCCccccccccceeccccc
Confidence            5699999999999 999998887777777543


No 45 
>PF05523 FdtA:  WxcM-like, C-terminal ;  InterPro: IPR008894  This entry includes FdtA (Q6T1W8 from SWISSPROT) from Aneurinibacillus thermoaerophilus, which has been characterised as a dTDP-6-deoxy-3,4-keto-hexulose isomerase []. It also includes WxcM (Q93S92 from SWISSPROT) from Xanthomonas campestris pv campestris) []. ; PDB: 2PAK_A 2PAE_A 2PA7_B 2PAM_A.
Probab=63.69  E-value=5.3  Score=32.59  Aligned_cols=33  Identities=18%  Similarity=0.239  Sum_probs=17.8

Q ss_pred             EEEe--eCCCCCCCccccCC-CcEEEEEEeEEEEEE
Q 021159          172 NLWI--GNQLSETSFHKDHY-ENLYTVVSGQKHFLL  204 (316)
Q Consensus       172 ~lwi--G~~gs~t~~H~D~~-~n~~~qv~G~Kr~~L  204 (316)
                      .+|+  .++|....+|.... .-+++.|+|+=++.+
T Consensus        34 vy~i~~~~~~~~RG~H~Hk~~~~~~~~l~Gs~~v~~   69 (131)
T PF05523_consen   34 VYYIYNVPPGVIRGWHAHKKTTQWFIVLSGSFKVVL   69 (131)
T ss_dssp             EEEEES--SS--EEEEEESS--EEEEEEES-EEEEE
T ss_pred             EEEEEcCCCCCcccccccccccEEEEEEeCEEEEEE
Confidence            4444  34555578887743 446788888877663


No 46 
>PLN00212 glutelin; Provisional
Probab=62.25  E-value=24  Score=35.43  Aligned_cols=21  Identities=14%  Similarity=0.271  Sum_probs=18.8

Q ss_pred             ccEEEEEcCCCEEeeC-cCcce
Q 021159          274 KPFECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWwH~  294 (316)
                      +.+..+|++||++.|| +..|.
T Consensus       391 ~vf~~~L~~GdvfVVPqg~~v~  412 (493)
T PLN00212        391 TVFNGVLRPGQLLIIPQHYAVL  412 (493)
T ss_pred             EEEEEEEcCCCEEEECCCCeEE
Confidence            3478899999999999 99996


No 47 
>PF03079 ARD:  ARD/ARD' family;  InterPro: IPR004313 The two acireductone dioxygenase enzymes (ARD and ARD', previously known as E-2 and E-2') from Klebsiella pneumoniae share the same amino acid sequence Q9ZFE7 from SWISSPROT, but bind different metal ions: ARD binds Ni2+, ARD' binds Fe2+ []. ARD and ARD' can be experimentally interconverted by removal of the bound metal ion and reconstitution with the appropriate metal ion. The two enzymes share the same substrate, 1,2-dihydroxy-3-keto-5-(methylthio)pentene, but yield different products. ARD' yields the alpha-keto precursor of methionine (and formate), thus forming part of the ubiquitous methionine salvage pathway that converts 5'-methylthioadenosine (MTA) to methionine. This pathway is responsible for the tight control of the concentration of MTA, which is a powerful inhibitor of polyamine biosynthesis and transmethylation reactions []. ARD yields methylthiopropanoate, carbon monoxide and formate, and thus prevents the conversion of MTA to methionine. The role of the ARD catalysed reaction is unclear: methylthiopropanoate is cytotoxic, and carbon monoxide can activate guanylyl cyclase, leading to increased intracellular cGMP levels [, ].  This family also contains other proteins, whose functions are not well characterised.; GO: 0010309 acireductone dioxygenase [iron(II)-requiring] activity, 0055114 oxidation-reduction process; PDB: 1VR3_A 1ZRR_A 2HJI_A.
Probab=61.78  E-value=6.9  Score=33.11  Aligned_cols=26  Identities=8%  Similarity=0.097  Sum_probs=18.1

Q ss_pred             ccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          274 KPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ....+.+++||.|.|| |-+|. -+..+
T Consensus       113 ~wiri~~e~GDli~vP~g~~Hr-F~~~~  139 (157)
T PF03079_consen  113 VWIRILCEKGDLIVVPAGTYHR-FTLGE  139 (157)
T ss_dssp             EEEEEEEETTCEEEE-TT--EE-EEEST
T ss_pred             EEEEEEEcCCCEEecCCCCcee-EEcCC
Confidence            3456999999999999 99999 54443


No 48 
>TIGR03027 pepcterm_export putative polysaccharide export protein, PEP-CTERM sytem-associated. This protein family belongs to the larger set of polysaccharide biosynthesis/export proteins described by Pfam model pfam02563. Members of this family are variable in either containing of lacking a 78-residue insert, but appear to fall within a single clade, nevertheless, where the regions in which the gene is found encode components of the PEP-CTERM/EpsH proposed exosortase protein sorting system.
Probab=60.64  E-value=5.3  Score=33.81  Aligned_cols=17  Identities=24%  Similarity=0.726  Sum_probs=14.6

Q ss_pred             EEEEEcCCCEEeeC-cCc
Q 021159          276 FECTVNAGEILYLL-IWF  292 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWw  292 (316)
                      ....|+|||.|||| .|+
T Consensus       148 ~n~~L~~gD~I~Vp~~~f  165 (165)
T TIGR03027       148 ANVELKPGDVLIIPESWF  165 (165)
T ss_pred             CCceeCCCCEEEEecccC
Confidence            45779999999999 875


No 49 
>TIGR00218 manA mannose-6-phosphate isomerase, class I. The names phosphomannose isomerase and mannose-6-phosphate isomerase are synonomous. This family contains two rather deeply branched groups. One group contains an experimentally determined phosphomannose isomerase of Streptococcus mutans as well as three uncharacterized paralogous proteins of Bacillus subtilis, all at more than 50 % identity to each other, plus a more distant homolog from Archaeoglobus fulgidus. The other group contains members from E. coli, budding yeast, Borrelia burgdorferi, etc.
Probab=59.41  E-value=4.3  Score=37.95  Aligned_cols=20  Identities=10%  Similarity=0.086  Sum_probs=18.1

Q ss_pred             EEEEEcCCCEEeeC-cCccee
Q 021159          276 FECTVNAGEILYLL-IWFRKA  295 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~v  295 (316)
                      -.+.++|||++||| |-.|..
T Consensus       151 n~v~v~~Gd~i~ipaGt~HA~  171 (302)
T TIGR00218       151 NRIKLKPGDFFYVPSGTPHAY  171 (302)
T ss_pred             cccccCCCCEEEeCCCCcccc
Confidence            47889999999999 999994


No 50 
>PF01050 MannoseP_isomer:  Mannose-6-phosphate isomerase;  InterPro: IPR001538 Mannose-6-phosphate isomerase or phosphomannose isomerase (5.3.1.8 from EC) (PMI) is the enzyme that catalyses the interconversion of mannose-6-phosphate and fructose-6-phosphate. In eukaryotes PMI is involved in the synthesis of GDP-mannose, a constituent of N- and O-linked glycans and GPI anchors and in prokaryotes it participates in a variety of pathways, including capsular polysaccharide biosynthesis and D-mannose metabolism. PMI's belong to the cupin superfamily whose functions range from isomerase and epimerase activities involved in the modification of cell wall carbohydrates in bacteria and plants, to non-enzymatic storage proteins in plant seeds, and transcription factors linked to congenital baldness in mammals []. Three classes of PMI have been defined []. The type II phosphomannose isomerases are bifunctional enzymes 5.3.1.8 from EC. This entry covers the isomerase region of the protein []. The guanosine diphospho-D-mannose pyrophosphorylase region is described in another InterPro entry (see IPR005836 from INTERPRO).; GO: 0016779 nucleotidyltransferase activity, 0005976 polysaccharide metabolic process
Probab=59.24  E-value=9.3  Score=32.08  Aligned_cols=36  Identities=17%  Similarity=0.172  Sum_probs=25.7

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecCCcc--hhhhcccCc
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNSEVN--VVELMQAKH  311 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~~~~--v~~~~~~~~  311 (316)
                      .-+..|.+||.+||| |=.|. +.|.+..  .++..|+-+
T Consensus       101 ~~~~~~~~g~sv~Ip~g~~H~-i~n~g~~~L~~IEVq~G~  139 (151)
T PF01050_consen  101 DEEFTLKEGDSVYIPRGAKHR-IENPGKTPLEIIEVQTGE  139 (151)
T ss_pred             CEEEEEcCCCEEEECCCCEEE-EECCCCcCcEEEEEecCC
Confidence            356779999999999 99999 7775322  455555433


No 51 
>COG4766 EutQ Ethanolamine utilization protein [Amino acid transport and metabolism]
Probab=58.94  E-value=6.5  Score=32.99  Aligned_cols=16  Identities=13%  Similarity=0.252  Sum_probs=13.4

Q ss_pred             EEEEEcCCCEEeeC-cC
Q 021159          276 FECTVNAGEILYLL-IW  291 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gW  291 (316)
                      -+++-+|||++||| |=
T Consensus       136 ~tv~a~aGDvifiPKgs  152 (176)
T COG4766         136 RTVIAGAGDVIFIPKGS  152 (176)
T ss_pred             CeEecCCCcEEEecCCC
Confidence            45677899999999 84


No 52 
>PF07385 DUF1498:  Protein of unknown function (DUF1498);  InterPro: IPR010864 This family consists of several hypothetical bacterial proteins of around 225 residues in length. The function of this family is unknown.; PDB: 3MPB_B 3KMH_A.
Probab=52.95  E-value=28  Score=31.15  Aligned_cols=84  Identities=17%  Similarity=0.088  Sum_probs=42.0

Q ss_pred             CeeEEEeeCCCCCCCccccCC--CcEEEEEEeEEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCccccc
Q 021159          169 EAVNLWIGNQLSETSFHKDHY--ENLYTVVSGQKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYVP  246 (316)
Q Consensus       169 ~~~~lwiG~~gs~t~~H~D~~--~n~~~qv~G~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  246 (316)
                      ..-.+.|...|..||+|+...  +.+..-=-|.=.+.|+.-.....+-.               ...+.|          
T Consensus        87 YAEKim~~~~~Q~tP~H~H~~K~EDIINRGGG~L~i~l~~s~~~~~~~~---------------~~~v~V----------  141 (225)
T PF07385_consen   87 YAEKIMIVREGQVTPMHFHWKKMEDIINRGGGNLVIELYNSDPDGELDA---------------DTDVTV----------  141 (225)
T ss_dssp             EEEEEEEE-BT-EEEEEEESS--EEEEEEEES-EEEEEEEB--TTSSB----------------SS-EEE----------
T ss_pred             chhhheeccCCCcCCcccCcchhhheeecCCceEEEEEEeccCCCcccc---------------CCCeEE----------
Confidence            355778888899999999853  33444334455556654432211110               011122          


Q ss_pred             ccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcce
Q 021159          247 WCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       247 ~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~  294 (316)
                        .+|=         ....+      +..-+++|.||+-|-|| +-||.
T Consensus       142 --~~DG---------~~~t~------~aG~~l~L~PGESiTL~Pg~yH~  173 (225)
T PF07385_consen  142 --PVDG---------IRRTV------PAGTQLRLNPGESITLPPGIYHW  173 (225)
T ss_dssp             --EETT---------EEEEE-------TT-EEEE-TT-EEEE-TTEEEE
T ss_pred             --ecCC---------cEEEe------cCCceEEeCCCCeEeeCCCCeee
Confidence              1121         01222      45678999999999999 99998


No 53 
>COG5285 Protein involved in biosynthesis of mitomycin antibiotics/polyketide fumonisin [Secondary metabolites biosynthesis, transport, and catabolism]
Probab=49.48  E-value=36  Score=31.76  Aligned_cols=38  Identities=11%  Similarity=0.173  Sum_probs=28.6

Q ss_pred             cccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          259 RESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       259 ~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      +.||-+.|++    .-...+.|++||+|+.= .-||.+-.|..
T Consensus       180 ~r~d~~~y~~----~~~~pv~lekGDallF~~~L~HaA~aNrT  218 (299)
T COG5285         180 ERPDHETYLE----RNAVPVELEKGDALLFNGSLWHAAGANRT  218 (299)
T ss_pred             CCCCccchhh----hcceeeeecCCCEEEEcchhhhhhhcCCC
Confidence            5566556643    33789999999999999 99999666654


No 54 
>PRK09943 DNA-binding transcriptional repressor PuuR; Provisional
Probab=46.48  E-value=18  Score=31.04  Aligned_cols=24  Identities=13%  Similarity=-0.003  Sum_probs=20.3

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      .-+..|++||++|+| +=.|. ..+.
T Consensus       145 ~~~~~l~~Gd~~~~~~~~~H~-~~n~  169 (185)
T PRK09943        145 GQDYHLVAGQSYAINTGIPHS-FSNT  169 (185)
T ss_pred             CEEEEecCCCEEEEcCCCCee-eeCC
Confidence            467789999999999 99999 5554


No 55 
>TIGR03028 EpsE polysaccharide export protein EpsE. Sequences in this family of proteins are members of a polysaccharide export protein family (pfam02563) which includes the wza protein from E.coli. This family of proteins are homologous to the EpsE protein of the methanolan biosynthesis operon of Methylobacillus species strain 12S. The distribution of this protein appears to be restricted to a subset of exopolysaccharide operons containing a syntenic grouping of genes including a variant of the EpsH exosortase protein. Exosortase has been proposed to be involved in the targetting and processing of proteins containing the PEP-CTERM domain to the exopolysaccharide layer.
Probab=46.38  E-value=11  Score=34.00  Aligned_cols=14  Identities=21%  Similarity=0.565  Sum_probs=12.7

Q ss_pred             EEcCCCEEeeC-cCc
Q 021159          279 TVNAGEILYLL-IWF  292 (316)
Q Consensus       279 ~L~pGD~LfiP-gWw  292 (316)
                      .|+|||++||| .|+
T Consensus       225 ~l~~gDii~V~~s~~  239 (239)
T TIGR03028       225 LVQPDDVIYVRESLF  239 (239)
T ss_pred             ccCCCCEEEEeCccC
Confidence            49999999999 986


No 56 
>PF12852 Cupin_6:  Cupin
Probab=42.65  E-value=23  Score=30.17  Aligned_cols=23  Identities=17%  Similarity=0.115  Sum_probs=19.4

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecC
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      -.+.|++||++++| +=.|. ..+.
T Consensus        55 ~~~~L~~GDivllp~g~~H~-l~~~   78 (186)
T PF12852_consen   55 EPIRLEAGDIVLLPRGTAHV-LSSD   78 (186)
T ss_pred             CeEEecCCCEEEEcCCCCeE-eCCC
Confidence            45889999999999 99999 5444


No 57 
>smart00751 BSD domain in transcription factors and synapse-associated proteins.
Probab=40.26  E-value=18  Score=24.25  Aligned_cols=36  Identities=17%  Similarity=0.185  Sum_probs=23.0

Q ss_pred             hHHHHHHHHhhhhcCCCCCcee-eeCCCCCHHHHHHHhhcC
Q 021159            2 QEVKKLWDEVRELSLGSNSTIE-RLESPPTPLQFLRDYVSQ   41 (316)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~I~-ri~~~~s~~~F~~~y~~~   41 (316)
                      .++++|+.++.+|    ...-. -+.+.+|.++|+.+|+..
T Consensus        10 ~~i~~il~~~p~l----~~~~~~lVP~~~se~~FW~ryF~~   46 (51)
T smart00751       10 EEIESLLKENPLL----KKLYNELVPKVLSEEEFWARYFYL   46 (51)
T ss_pred             HHHHHHHHHCHHH----HHHHHHHCCCCCCHHHHHHHHHHH
Confidence            3567777777666    12222 233468999999998743


No 58 
>COG4297 Uncharacterized protein containing double-stranded beta helix domain [Function unknown]
Probab=39.83  E-value=26  Score=29.03  Aligned_cols=22  Identities=18%  Similarity=0.075  Sum_probs=19.8

Q ss_pred             CccEEEEEcCCCEEeeC-cCcce
Q 021159          273 PKPFECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~  294 (316)
                      +...+..+..||+|.|| |-=|.
T Consensus        82 ~~G~el~v~~GDvlliPAGvGH~  104 (163)
T COG4297          82 ADGQELEVGEGDVLLIPAGVGHC  104 (163)
T ss_pred             CCCceeeecCCCEEEEecCcccc
Confidence            66788999999999999 98887


No 59 
>PF02311 AraC_binding:  AraC-like ligand binding domain;  InterPro: IPR003313 This entry defines the arabinose-binding and dimerisation domain of the bacterial gene regulatory protein AraC. The crystal structure of the arabinose-binding and dimerization domain of the Escherichia coli gene regulatory protein AraC was determined in the presence and absence of L-arabinose. The arabinose-bound molecule shows that the protein adopts an unusual fold, binding sugar within a beta barrel and completely burying the arabinose with the amino-terminal arm of the protein. Dimer contacts in the presence of arabinose are mediated by an antiparallel coiled-coil. In the uncomplexed protein, the amino-terminal arm is disordered, uncovering the sugar-binding pocket and allowing it to serve as an oligomerization interface [].; GO: 0006355 regulation of transcription, DNA-dependent; PDB: 1XJA_B 2ARA_A 2AAC_B 2ARC_A.
Probab=39.34  E-value=29  Score=26.81  Aligned_cols=25  Identities=12%  Similarity=0.088  Sum_probs=15.9

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      .-+..++|||+++|| +=.|......
T Consensus        40 ~~~~~l~~g~~~li~p~~~H~~~~~~   65 (136)
T PF02311_consen   40 GQEYPLKPGDLFLIPPGQPHSYYPDS   65 (136)
T ss_dssp             TEEEEE-TT-EEEE-TTS-EEEEE-T
T ss_pred             CEEEEEECCEEEEecCCccEEEecCC
Confidence            356889999999999 9999954444


No 60 
>KOG3413 consensus Mitochondrial matrix protein frataxin, involved in Fe/S protein biosynthesis [Inorganic ion transport and metabolism]
Probab=38.27  E-value=48  Score=27.67  Aligned_cols=34  Identities=12%  Similarity=0.300  Sum_probs=24.4

Q ss_pred             hCCCCCeeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEeC
Q 021159          164 LGCYPEAVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLLP  206 (316)
Q Consensus       164 ~~~~~~~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~p  206 (316)
                      +++.+....||++++ ..-|=|||...        +++|+-..
T Consensus        95 iNKQ~PnkQIWlSSP-~SGPkryD~~~--------~~~Wiy~r  128 (156)
T KOG3413|consen   95 INKQPPNKQIWLSSP-VSGPKRYDLCR--------AGEWIYLR  128 (156)
T ss_pred             ecCCCCcceeeeeCC-CCCCccccccc--------cCceEEec
Confidence            355677889999999 56788999532        66676433


No 61 
>PF15138 Syncollin:  Syncollin
Probab=38.24  E-value=19  Score=28.23  Aligned_cols=30  Identities=30%  Similarity=0.340  Sum_probs=23.9

Q ss_pred             ccCCCccEEEEEcCCCE-EeeC-cCcceeeecC
Q 021159          269 YFNGPKPFECTVNAGEI-LYLL-IWFRKAVRNS  299 (316)
Q Consensus       269 ~~~~~~~~~~~L~pGD~-LfiP-gWwH~vv~~~  299 (316)
                      +-++...-+..++|||= =|+| +|=|. ++++
T Consensus        28 yd~cC~G~~l~v~pg~DlPylPs~w~n~-iSSl   59 (112)
T PF15138_consen   28 YDNCCGGAELSVEPGDDLPYLPSGWANK-ISSL   59 (112)
T ss_pred             hhhccCCcEEeecCCCCCCcCCccccCe-eeeE
Confidence            33457888999999965 5999 99999 7776


No 62 
>TIGR03214 ura-cupin putative allantoin catabolism protein. This model represents a protein containing a tandem arrangement of cupin domains (N-terminal part of pfam07883 and C-terminal more distantly related to pfam00190). This protein is found in the vicinity of genes involved in the catabolism of allantoin, a breakdown product of urate and sometimes of urate iteslf. The distribution of pathway components in the genomes in which this family is observed suggests that the function is linked to the allantoate catabolism to glyoxylate pathway (GenProp0686) since it is sometimes found in genomes lacking any elements of the xanthine-to-allantoin pathways (e.g. in Enterococcus faecalis).
Probab=37.15  E-value=34  Score=31.24  Aligned_cols=26  Identities=12%  Similarity=0.079  Sum_probs=21.5

Q ss_pred             ccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          274 KPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       274 ~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ..-...+++||++||| +=-|+ ..+..
T Consensus       216 ~g~~~~V~~GD~i~i~~~~~h~-~~~~G  242 (260)
T TIGR03214       216 DNNWVPVEAGDYIWMGAYCPQA-CYAGG  242 (260)
T ss_pred             CCEEEEecCCCEEEECCCCCEE-EEecC
Confidence            3467889999999999 99999 66653


No 63 
>PF04970 LRAT:  Lecithin retinol acyltransferase;  InterPro: IPR007053 This entry represents a conserved sequence region found in proteins from viruses, bacteria and eukaryotes. It contains a well-conserved NCEHF motif, though its function in these proteins is unknown.; PDB: 2KYT_A 4DOT_A 4FA0_A.
Probab=36.97  E-value=17  Score=29.12  Aligned_cols=24  Identities=4%  Similarity=0.087  Sum_probs=15.2

Q ss_pred             EEEcCCCEEeeC--cCcceeeecCCc
Q 021159          278 CTVNAGEILYLL--IWFRKAVRNSEV  301 (316)
Q Consensus       278 ~~L~pGD~LfiP--gWwH~vv~~~~~  301 (316)
                      -.|+|||.|+++  ..+|+.+--.+-
T Consensus         5 ~~~~~GD~I~~~r~~y~H~gIYvG~~   30 (125)
T PF04970_consen    5 KRLKPGDHIEVPRGLYEHWGIYVGDG   30 (125)
T ss_dssp             -S--TT-EEEEEETTEEEEEEEEETT
T ss_pred             cCCCCCCEEEEecCCccEEEEEecCC
Confidence            458999999999  788887654433


No 64 
>PF08007 Cupin_4:  Cupin superfamily protein;  InterPro: IPR022777  This signature represents primarily the cupin fold found in JmjC transcription factors. The fold is also found in lysine-specific demethylase NO66.; PDB: 2XDV_A 1VRB_B 4DIQ_B.
Probab=36.56  E-value=24  Score=33.26  Aligned_cols=39  Identities=26%  Similarity=0.491  Sum_probs=22.1

Q ss_pred             HHHHHHHhhcCCCCEEEEcCCCCCCCccccCCCChhhHHHhc
Q 021159           31 PLQFLRDYVSQNKPCIIKNVSLHHQWPAFSLWPHPSYLSKTL   72 (316)
Q Consensus        31 ~~~F~~~y~~~~~PvVi~g~~~~~~WpA~~~Wt~~eyL~~~~   72 (316)
                      +++|+++|+ .++|++|++...  .....=.|..++.|....
T Consensus         1 pe~F~~~yw-~kkPl~i~~~~~--~f~~l~s~~~l~~L~~~~   39 (319)
T PF08007_consen    1 PETFLREYW-EKKPLLIRRADP--YFDDLFSWDDLDELLREE   39 (319)
T ss_dssp             HHHHHHHTT-TTS-EEE--SGC--CCCCSCCHHHHCCHHHHS
T ss_pred             ChhHHHHHh-ccCCEEECCCCc--cccCccCHHHHHHHHHhc
Confidence            589999998 558999999766  443322333334444433


No 65 
>COG3822 ABC-type sugar transport system, auxiliary component [General function prediction only]
Probab=35.92  E-value=1.2e+02  Score=26.65  Aligned_cols=22  Identities=14%  Similarity=0.157  Sum_probs=19.4

Q ss_pred             CccEEEEEcCCCEEeeC-cCcce
Q 021159          273 PKPFECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~  294 (316)
                      ...-...|+||+.+-+| |-||.
T Consensus       150 ~ag~~lkL~PGesitL~Pg~~Hs  172 (225)
T COG3822         150 TAGSQLKLSPGESITLPPGLYHS  172 (225)
T ss_pred             ccceeEEECCCCcEecCCCceee
Confidence            34578899999999999 99998


No 66 
>TIGR03214 ura-cupin putative allantoin catabolism protein. This model represents a protein containing a tandem arrangement of cupin domains (N-terminal part of pfam07883 and C-terminal more distantly related to pfam00190). This protein is found in the vicinity of genes involved in the catabolism of allantoin, a breakdown product of urate and sometimes of urate iteslf. The distribution of pathway components in the genomes in which this family is observed suggests that the function is linked to the allantoate catabolism to glyoxylate pathway (GenProp0686) since it is sometimes found in genomes lacking any elements of the xanthine-to-allantoin pathways (e.g. in Enterococcus faecalis).
Probab=34.50  E-value=40  Score=30.84  Aligned_cols=23  Identities=17%  Similarity=0.054  Sum_probs=19.1

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecC
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      -+.+|++||.+|+| +=-|. ..|.
T Consensus        98 ~~~~L~~Gd~~y~pa~~~H~-~~N~  121 (260)
T TIGR03214        98 ETHELREGGYAYLPPGSKWT-LANA  121 (260)
T ss_pred             EEEEECCCCEEEECCCCCEE-EEEC
Confidence            45699999999999 99999 5443


No 67 
>COG3435 Gentisate 1,2-dioxygenase [Secondary metabolites biosynthesis, transport, and catabolism]
Probab=33.88  E-value=72  Score=30.01  Aligned_cols=18  Identities=11%  Similarity=0.257  Sum_probs=15.2

Q ss_pred             EEEEcCCCEEeeC-cCcce
Q 021159          277 ECTVNAGEILYLL-IWFRK  294 (316)
Q Consensus       277 ~~~L~pGD~LfiP-gWwH~  294 (316)
                      ...+++||.|..| +=||.
T Consensus       132 r~~M~~GDfilTP~w~wHd  150 (351)
T COG3435         132 RTPMEAGDFILTPAWTWHD  150 (351)
T ss_pred             eeeccCCCEEEccCceecc
Confidence            4567899999999 88876


No 68 
>COG5553 Predicted metal-dependent enzyme of the double-stranded beta helix superfamily [General function prediction only]
Probab=31.26  E-value=81  Score=26.87  Aligned_cols=24  Identities=13%  Similarity=0.046  Sum_probs=18.2

Q ss_pred             CCCCCCCccccCCCcEEEEEEeEE
Q 021159          177 NQLSETSFHKDHYENLYTVVSGQK  200 (316)
Q Consensus       177 ~~gs~t~~H~D~~~n~~~qv~G~K  200 (316)
                      ++|+.+|.|-.....+..++.|..
T Consensus        81 ~PG~~~p~HnH~~wglVgil~G~E  104 (191)
T COG5553          81 SPGVQYPPHNHLMWGLVGILWGGE  104 (191)
T ss_pred             CCCcccCCcccchheeeeeeeccc
Confidence            345888888877788888888765


No 69 
>PRK11171 hypothetical protein; Provisional
Probab=31.11  E-value=44  Score=30.62  Aligned_cols=27  Identities=11%  Similarity=0.080  Sum_probs=21.8

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ...-+..|++||+|++| .=-|. ..|..
T Consensus       220 ~~~~~~~l~~GD~i~~~~~~~h~-~~N~g  247 (266)
T PRK11171        220 LNNDWVEVEAGDFIWMRAYCPQA-CYAGG  247 (266)
T ss_pred             ECCEEEEeCCCCEEEECCCCCEE-EECCC
Confidence            34567889999999999 99998 66653


No 70 
>KOG0958 consensus DNA damage-responsive repressor GIS1/RPH1, jumonji superfamily [Replication, recombination and repair]
Probab=30.94  E-value=21  Score=36.82  Aligned_cols=116  Identities=16%  Similarity=0.173  Sum_probs=70.5

Q ss_pred             CeeEEEeeCCCCCCCccccCCC--cEEEEEEe-EEEEEEeCCCCCCCCcccccCCcccccccccCCcceeeeccCCcccc
Q 021159          169 EAVNLWIGNQLSETSFHKDHYE--NLYTVVSG-QKHFLLLPPTDVHRMYIRQYPAAHYSYSRVNDVERFTLELEEPVRYV  245 (316)
Q Consensus       169 ~~~~lwiG~~gs~t~~H~D~~~--n~~~qv~G-~Kr~~L~pP~~~~~ly~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  245 (316)
                      ....|+.|.=.|.-++|.+-.+  .+...-.| -|.|+.+||++...++.-  -...|..+..+..           +..
T Consensus       173 Nt~yLyfGmwKttFaWHtEdmDLySINyLHFGaPK~WYaIP~eh~~rfekl--a~~~fp~~~~~C~-----------aFL  239 (690)
T KOG0958|consen  173 NTPYLYFGMWKTTFAWHTEDMDLYSINYLHFGAPKQWYAIPPEHGDRFEKL--ASELFPDSSQGCP-----------AFL  239 (690)
T ss_pred             CccceeeeeeecccccccCCccceeeeeeecCCCcceeecCHHHHHHHHHH--HHhhCCccccCCH-----------HHH
Confidence            3567899998899999998554  44444455 599999999998765522  1111111000000           000


Q ss_pred             cccccCCCCCccccccccccCCCccCCCccEEEEEcCCCEEeeC-cCcceeeecCCcchhhhccc
Q 021159          246 PWCSVNPYPSPETRESEMAKFPLYFNGPKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVELMQA  309 (316)
Q Consensus       246 ~~s~vd~~~~~~~~~pd~~~fP~~~~~~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~~~  309 (316)
                      .... -+      -.|++-+    +++.+...+|+++||.+.-= +=+|. =-|+++|+...+.|
T Consensus       240 RHK~-~L------iSP~~Lk----qnGIpfn~ivqeagEFmITFPygyHa-GFN~GfN~aES~nF  292 (690)
T KOG0958|consen  240 RHKM-TL------ISPSVLK----QNGIPFNRIVQEAGEFMITFPYGYHA-GFNHGFNCAESTNF  292 (690)
T ss_pred             hhcc-cc------cCHHHHH----HcCCCcceeeecCCcEEEecCccccc-ccccchhhhhhhcc
Confidence            0000 01      1233321    12477889999999988754 77888 78999999777665


No 71 
>TIGR01479 GMP_PMI mannose-1-phosphate guanylyltransferase/mannose-6-phosphate isomerase. This enzyme is known to be bifunctional, as both mannose-6-phosphate isomerase (EC 5.3.1.8) (PMI) and mannose-1-phosphate guanylyltransferase (EC 2.7.7.22) in Pseudomonas aeruginosa, Xanthomonas campestris, and Gluconacetobacter xylinus. The literature on the enzyme from E. coli attributes mannose-6-phosphate isomerase activity to an adjacent gene, but the present sequence has not been shown to lack the activity. The PMI domain is C-terminal.
Probab=30.79  E-value=45  Score=33.23  Aligned_cols=24  Identities=13%  Similarity=0.108  Sum_probs=20.2

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      .-+..|+|||++||| +=.|. ..|.
T Consensus       414 g~~~~l~~GDsi~ip~~~~H~-~~N~  438 (468)
T TIGR01479       414 DETLLLTENESTYIPLGVIHR-LENP  438 (468)
T ss_pred             CEEEEecCCCEEEECCCCcEE-EEcC
Confidence            456789999999999 99999 6554


No 72 
>PLN00212 glutelin; Provisional
Probab=30.62  E-value=1.9e+02  Score=29.12  Aligned_cols=39  Identities=15%  Similarity=0.053  Sum_probs=27.4

Q ss_pred             eeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEEeCCCC
Q 021159          170 AVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLLLPPTD  209 (316)
Q Consensus       170 ~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L~pP~~  209 (316)
                      ...+-|.+. +....||-...-++.+++|+=.+-++-|..
T Consensus        82 ~~R~~i~p~-gL~lP~y~na~~liyV~qG~G~~G~v~pGc  120 (493)
T PLN00212         82 VIRRVIEPQ-GLLLPRYSNTPGLVYIIQGRGSMGLTFPGC  120 (493)
T ss_pred             EEEEEecCC-cccCccccCCCeEEEEEeCeEEEEEEeCCC
Confidence            344556665 445555555677889999999999988754


No 73 
>PF03909 BSD:  BSD domain  ;  InterPro: IPR005607 The BSD domain is an about 60-residue long domain named after the BTF2-like transcription factors, Synapse-associated proteins and DOS2-like proteins in which it is found. Additionally, it is also found in several hypothetical proteins. The BSD domain occurs in one or two copies in a variety of species ranging from primal protozoan to human. It can be found associated with other domains such as the BTB domain (see PDOC50097 from PROSITEDOC) or the U-box in multidomain proteins. The function of the BSD domain is yet unknown []. Secondary structure prediction indicates the presence of three predicted alpha helices, which probably form a three-helical bundle in small domains. The third predicted helix contains neighbouring phenylalanine and tryptophan residues - less common amino acids that are invariant in all the BSD domains identified and that are the most striking sequence features of the domain [].  Some proteins known to contain one or two BSD domains are listed below:  Mammalian TFIIH basal transcription factor complex p62 subunit (GTF2H1).  Yeast RNA polymerase II transcription factor B 73 kDa subunit (TFB1), the homologue of BTF2.  Yeast DOS2 protein. It is involved in single-copy DNA replication and ubiquitination.  Drosophila synapse-associated protein SAP47.  Mammalian SYAP1.  Various Arabidopsis thaliana (Mouse-ear cress) hypothetical proteins.; PDB: 1X3A_A 1PFJ_A 2RNR_B 2DII_A.
Probab=27.58  E-value=34  Score=23.85  Aligned_cols=35  Identities=26%  Similarity=0.360  Sum_probs=20.7

Q ss_pred             hHHHHHHHHhhhhcCCCCCcee-eeCCCCCHHHHHHHhhc
Q 021159            2 QEVKKLWDEVRELSLGSNSTIE-RLESPPTPLQFLRDYVS   40 (316)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~I~-ri~~~~s~~~F~~~y~~   40 (316)
                      +++++|+.++.+|    ...-. -|...++.++|+..|+.
T Consensus        15 e~i~~lL~~~p~l----~~~~~~lVP~~~~e~~FW~rYf~   50 (62)
T PF03909_consen   15 EEIKKLLEEDPNL----RKLYNELVPSKMSEEEFWKRYFY   50 (62)
T ss_dssp             HHHHHHHHH-HHH----HHHHHHCCTTTS-HHHHHHHHHC
T ss_pred             HHHHHHHHhCHHH----HHHHHHhCCCCCCHHHHHHHHHH
Confidence            4667777776666    11111 22456899999999864


No 74 
>PRK11171 hypothetical protein; Provisional
Probab=27.55  E-value=62  Score=29.67  Aligned_cols=23  Identities=22%  Similarity=0.141  Sum_probs=19.7

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecC
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      -+.+|++||++|+| +=.|+ ..|.
T Consensus       101 ~~~~L~~GDsi~~p~~~~H~-~~N~  124 (266)
T PRK11171        101 KTHALSEGGYAYLPPGSDWT-LRNA  124 (266)
T ss_pred             EEEEECCCCEEEECCCCCEE-EEEC
Confidence            57899999999999 99999 5553


No 75 
>KOG1633 consensus F-box protein JEMMA and related proteins with JmjC, PHD, F-box and LRR domains [Chromatin structure and dynamics]
Probab=27.19  E-value=33  Score=36.45  Aligned_cols=40  Identities=8%  Similarity=-0.123  Sum_probs=33.0

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecCCcchhhhcccCcc
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNSEVNVVELMQAKHV  312 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~~~~~~~~  312 (316)
                      ..-....+.+|+.+++| +|-|++.+..+...+..+...|+
T Consensus       545 ~~~~~~~~~~g~~~~~P~~~i~~~~~p~~~~~~~~~~~~hl  585 (776)
T KOG1633|consen  545 CDDKRDVLKEGETGLIPAGPIHAVLTPVDSLSFGGNFLTHL  585 (776)
T ss_pred             CCCccccccCCCcccCCCCccccccccccccccccchhhhh
Confidence            55677889999999999 99999888878777766666554


No 76 
>COG1791 Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=26.19  E-value=67  Score=27.61  Aligned_cols=31  Identities=10%  Similarity=0.139  Sum_probs=24.0

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecCCcch
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNSEVNV  303 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~~~~v  303 (316)
                      .+-+.+.+.+||.|-|| |-.|.--...++++
T Consensus       115 ~~~~~i~c~~gDLI~vP~gi~HwFtlt~~~~f  146 (181)
T COG1791         115 GKVYQIRCEKGDLISVPPGIYHWFTLTESPNF  146 (181)
T ss_pred             CcEEEEEEccCCEEecCCCceEEEEccCCCcE
Confidence            35688889999999999 99999444445555


No 77 
>PRK11702 hypothetical protein; Provisional
Probab=26.11  E-value=25  Score=27.77  Aligned_cols=42  Identities=26%  Similarity=0.442  Sum_probs=23.7

Q ss_pred             HHH-HHHhhhhcCCCC------CceeeeCCCCCHHHHHHHhhcCCCCEEEEc
Q 021159            5 KKL-WDEVRELSLGSN------STIERLESPPTPLQFLRDYVSQNKPCIIKN   49 (316)
Q Consensus         5 ~~~-~~~~~~~~~~~~------~~I~ri~~~~s~~~F~~~y~~~~~PvVi~g   49 (316)
                      ||| ++|+|||-+.=.      .+.+.++.  ..++|.++++.+|. +-+-|
T Consensus        11 KKL~v~EFqeLGF~v~~~~~~~~~~e~~D~--~vD~fIde~Ie~ng-L~f~G   59 (108)
T PRK11702         11 KKMHIDEFQELGFSVNWRFPEGTSEEQIDA--TVDAFIDEVIEPNG-LAFDG   59 (108)
T ss_pred             hhhhhHhhHhheeEEEEEECCCCCHHHHHH--HHHHHHHHHHhcCC-ceecC
Confidence            566 899999944321      22222332  45566666777765 44444


No 78 
>KOG3995 consensus 3-hydroxyanthranilate oxygenase HAAO [Amino acid transport and metabolism]
Probab=25.61  E-value=1.7e+02  Score=26.02  Aligned_cols=36  Identities=11%  Similarity=0.337  Sum_probs=29.3

Q ss_pred             CeeEEEeeCCCCCCCccccCCCcEEEEEEeEEEEEE
Q 021159          169 EAVNLWIGNQLSETSFHKDHYENLYTVVSGQKHFLL  204 (316)
Q Consensus       169 ~~~~lwiG~~gs~t~~H~D~~~n~~~qv~G~Kr~~L  204 (316)
                      ....+++|.+.+.+..|..+.+-++.|..|.--..+
T Consensus        33 qlkVm~VGGPN~RkdyHieegeE~FyQ~KGdMvLKV   68 (279)
T KOG3995|consen   33 QLKVMFVGGPNTRKDYHIEEGEEVFYQLKGDMVLKV   68 (279)
T ss_pred             CeEEEEecCCCcccccccCCcchhheeecCceEEee
Confidence            356788999999999999999989988888654443


No 79 
>PF13759 2OG-FeII_Oxy_5:  Putative 2OG-Fe(II) oxygenase; PDB: 3BVC_B 2RG4_A.
Probab=25.54  E-value=49  Score=25.23  Aligned_cols=27  Identities=7%  Similarity=0.180  Sum_probs=16.9

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecC
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNS  299 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~  299 (316)
                      ...+.+..++||+|+.| .-+|.|..+.
T Consensus        63 ~~~~~~~p~~G~lvlFPs~l~H~v~p~~   90 (101)
T PF13759_consen   63 SPYYIVEPEEGDLVLFPSWLWHGVPPNN   90 (101)
T ss_dssp             -SEEEE---TTEEEEEETTSEEEE----
T ss_pred             CceEEeCCCCCEEEEeCCCCEEeccCcC
Confidence            55678899999999999 8899955443


No 80 
>KOG0426 consensus Ubiquitin-protein ligase [Posttranslational modification, protein turnover, chaperones]
Probab=24.84  E-value=54  Score=26.78  Aligned_cols=39  Identities=26%  Similarity=0.508  Sum_probs=27.1

Q ss_pred             HHHHHHHHhhhhcCCCCCceeeeCCCCCHHHHHHHhhcCCCCEEEEc
Q 021159            3 EVKKLWDEVRELSLGSNSTIERLESPPTPLQFLRDYVSQNKPCIIKN   49 (316)
Q Consensus         3 ~~~~~~~~~~~~~~~~~~~I~ri~~~~s~~~F~~~y~~~~~PvVi~g   49 (316)
                      .+++||.||+||...++..|  +.++.+.+.|++      -=|+|.|
T Consensus         5 AlkRLm~EykqLt~~~P~GI--vAgP~~EdnfF~------W~cLI~G   43 (165)
T KOG0426|consen    5 ALKRLMAEYKQLTLNPPEGI--VAGPINEDNFFE------WECLIQG   43 (165)
T ss_pred             HHHHHHHHHHHHccCCCCcc--eeCCCCccceee------eeeeeeC
Confidence            58999999999977766555  345567777754      2466665


No 81 
>PRK15460 cpsB mannose-1-phosphate guanyltransferase; Provisional
Probab=24.21  E-value=73  Score=31.95  Aligned_cols=25  Identities=12%  Similarity=-0.055  Sum_probs=21.1

Q ss_pred             cEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          275 PFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      ..+..|+|||.+||| +=-|. ..|.+
T Consensus       423 g~~~~L~~GDSi~ip~g~~H~-~~N~g  448 (478)
T PRK15460        423 GDIKLLGENESIYIPLGATHC-LENPG  448 (478)
T ss_pred             CEEEEecCCCEEEECCCCcEE-EEcCC
Confidence            456889999999999 99999 77653


No 82 
>PF04962 KduI:  KduI/IolB family;  InterPro: IPR021120 The KduI/IolB family of enzymes includes 5-keto 4-deoxyuronate isomerase (KduI) and 5-deoxy-glucuronate isomerase (IolB).  KduI is involved in pectin degradation by free-living soil bacteria that use pectin as a carbon source, breaking it down to 2-keto-3-deoxygluconate, which can ultimately be converted to pyruvate. KduI catalyses the fourth step in pectin degradation, namely the interconversion of 5-keto-4-deoxyuronate and 2,5-diketo-3-dexoygluconate []. KduI has a TIM-barrel fold [].  IolB is one of several bacterial proteins encoded by the inositol operon (iolABCDEFGHIJ) in Bacillus subtilis that are involved in myo-inositol catabolism. The enzyme is responsible for isomerization of 5-deoxy-D-glucuronic acid by IolB to produce 2-deoxy-5-keto-D-gluconic acid []. IolBs possess a cupin-like structure.; GO: 0016861 intramolecular oxidoreductase activity, interconverting aldoses and ketoses, 0008152 metabolic process; PDB: 1YWK_B 2QJV_B 1X8M_A 1XRU_A.
Probab=24.19  E-value=64  Score=29.62  Aligned_cols=25  Identities=12%  Similarity=0.158  Sum_probs=19.2

Q ss_pred             EEEEEcCCCEEeeCcCcceeeecCC
Q 021159          276 FECTVNAGEILYLLIWFRKAVRNSE  300 (316)
Q Consensus       276 ~~~~L~pGD~LfiPgWwH~vv~~~~  300 (316)
                      -...++-||++.||.|||-+++.-+
T Consensus       210 ~~~~V~~~d~V~iP~gyHp~~aapG  234 (261)
T PF04962_consen  210 EHYVVRNGDAVLIPSGYHPVVAAPG  234 (261)
T ss_dssp             EEEEEETTEEEEESTTB-SEEEEEE
T ss_pred             EEEEEECCCEEEeCCCCCCcCcCCC
Confidence            3668999999999977998666554


No 83 
>PRK10296 DNA-binding transcriptional regulator ChbR; Provisional
Probab=24.18  E-value=64  Score=29.16  Aligned_cols=20  Identities=5%  Similarity=0.183  Sum_probs=17.6

Q ss_pred             EEEEEcCCCEEeeC-cCccee
Q 021159          276 FECTVNAGEILYLL-IWFRKA  295 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~v  295 (316)
                      -...+.|||+++|| |=.|+.
T Consensus        61 ~~~~l~~g~l~~i~p~~~H~~   81 (278)
T PRK10296         61 KRVLLERGDFVFIPLGSHHQS   81 (278)
T ss_pred             EEEEECCCcEEEeCCCCccce
Confidence            45789999999999 999973


No 84 
>PF05721 PhyH:  Phytanoyl-CoA dioxygenase (PhyH);  InterPro: IPR008775 This family is made up of several eukaryotic phytanoyl-CoA dioxygenase (PhyH) proteins as well as a number of bacterial deoxygenases. PhyH is a peroxisomal enzyme catalysing the first step of phytanic acid alpha-oxidation. PhyH deficiency causes Refsum's disease (RD) which is an inherited neurological syndrome biochemically characterised by the accumulation of phytanic acid in plasma and tissues [].; PDB: 3GJA_A 3EMR_A 3OBZ_A 2OPW_A 3NNL_B 3NNF_A 3NNM_B 3NNJ_A 2FCV_B 2FCU_A ....
Probab=23.74  E-value=63  Score=27.02  Aligned_cols=28  Identities=14%  Similarity=0.256  Sum_probs=21.3

Q ss_pred             CccEEEEEcCCCEEeeC-cCcceeeecCC
Q 021159          273 PKPFECTVNAGEILYLL-IWFRKAVRNSE  300 (316)
Q Consensus       273 ~~~~~~~L~pGD~LfiP-gWwH~vv~~~~  300 (316)
                      .....+.++|||+|++- .=||..-.|..
T Consensus       177 ~~~~~~~~~~Gdvl~~~~~~~H~s~~N~s  205 (211)
T PF05721_consen  177 DEWVPVPMKAGDVLFFHSRLIHGSGPNTS  205 (211)
T ss_dssp             SGCEEE-BSTTEEEEEETTSEEEEE-B-S
T ss_pred             CceEEeecCCCeEEEEcCCccccCCCCCC
Confidence            56789999999999999 99999555543


No 85 
>cd02786 MopB_CT_3 The MopB_CT_3 CD includes a group of related uncharacterized bacterial molybdopterin-binding oxidoreductase-like domains with a putative N-terminal iron-sulfur [4Fe-4S] cluster binding site and molybdopterin cofactor binding site. This CD is of the conserved molybdopterin_binding C-terminal (MopB_CT) region present in many, but not all, MopB homologs.
Probab=23.29  E-value=40  Score=26.14  Aligned_cols=14  Identities=21%  Similarity=0.501  Sum_probs=10.6

Q ss_pred             EcCCCEEeeC-cCcce
Q 021159          280 VNAGEILYLL-IWFRK  294 (316)
Q Consensus       280 L~pGD~LfiP-gWwH~  294 (316)
                      +.+ +++|+| ||||.
T Consensus        70 i~~-g~v~~~~g~~~~   84 (116)
T cd02786          70 VPP-GVVVAEGGWWRE   84 (116)
T ss_pred             CCC-CEEEeecccccc
Confidence            344 567999 99995


No 86 
>TIGR02272 gentisate_1_2 gentisate 1,2-dioxygenase. This family consists of gentisate 1,2-dioxygenases. This ring-opening enzyme acts in salicylate degradation that goes via gentisate rather than via catechol. It converts gentisate to maleylpyruvate. Some putative gentisate 1,2-dioxygenases are excluded by a relatively high trusted cutoff score because they are too closely related to known examples of 1-hydroxy-2-naphthoate dioxygenase. Therefore some homologs may be bona fide gentisate 1,2-dioxygenases even if they score below the given cutoffs.
Probab=23.16  E-value=2.7e+02  Score=26.60  Aligned_cols=26  Identities=4%  Similarity=-0.031  Sum_probs=18.3

Q ss_pred             EEEEEcCCCEEeeC-cCcceeeecCCcc
Q 021159          276 FECTVNAGEILYLL-IWFRKAVRNSEVN  302 (316)
Q Consensus       276 ~~~~L~pGD~LfiP-gWwH~vv~~~~~~  302 (316)
                      .++..++||++.|| +-+|+ -.+.+..
T Consensus       288 ~~~~W~~gD~f~vPsW~~~~-h~a~~da  314 (335)
T TIGR02272       288 AVFRFSPKDVFVVPSWHPVR-FEASDDA  314 (335)
T ss_pred             EEEEecCCCEEEECCCCcEe-cccCCCe
Confidence            46789999999999 54565 4444443


No 87 
>KOG2757 consensus Mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=23.08  E-value=52  Score=31.71  Aligned_cols=29  Identities=21%  Similarity=0.194  Sum_probs=24.4

Q ss_pred             EEEEcCCCEEeeC-cCcceeeecCCcchhh
Q 021159          277 ECTVNAGEILYLL-IWFRKAVRNSEVNVVE  305 (316)
Q Consensus       277 ~~~L~pGD~LfiP-gWwH~vv~~~~~~v~~  305 (316)
                      .+.|+||+++|+= .=.|..++...+-+|+
T Consensus       249 ~~~L~PGEA~yL~AnepHAYlsGdcvECMA  278 (411)
T KOG2757|consen  249 YVRLNPGEAIYLEANEPHAYLSGDCVECMA  278 (411)
T ss_pred             heecCCCceeeecCCCcceeecCceeEEec
Confidence            5889999999999 9999977776666663


No 88 
>PRK13502 transcriptional activator RhaR; Provisional
Probab=22.31  E-value=61  Score=29.36  Aligned_cols=21  Identities=10%  Similarity=0.127  Sum_probs=18.2

Q ss_pred             cEEEEEcCCCEEeeC-cCccee
Q 021159          275 PFECTVNAGEILYLL-IWFRKA  295 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-gWwH~v  295 (316)
                      .-+..+.|||+++|| +=.|..
T Consensus        55 ~~~~~l~~g~l~li~~~~~H~~   76 (282)
T PRK13502         55 ERPYRITRGDLFYIRAEDKHSY   76 (282)
T ss_pred             CEEEeecCCcEEEECCCCcccc
Confidence            356889999999999 999983


No 89 
>cd02791 MopB_CT_Nitrate-R-NapA-like Nitrate reductases, NapA (Nitrate-R-NapA), NasA, and NarB catalyze the reduction of nitrate to nitrite. Monomeric Nas is located in the cytoplasm and participates in nitrogen assimilation. Dimeric Nap is located in the periplasm and is coupled to quinol oxidation via a membrane-anchored tetraheme cytochrome. This CD (MopB_CT_Nitrate-R-Nap) is of the conserved molybdopterin_binding C-terminal (MopB_CT) region present in many, but not all, MopB homologs
Probab=21.06  E-value=99  Score=24.02  Aligned_cols=19  Identities=11%  Similarity=0.277  Sum_probs=14.1

Q ss_pred             EEEEEcCC---CEEeeC-cCcce
Q 021159          276 FECTVNAG---EILYLL-IWFRK  294 (316)
Q Consensus       276 ~~~~L~pG---D~LfiP-gWwH~  294 (316)
                      ..+.+.++   ++|++| +||+.
T Consensus        66 ~~v~~~~~i~~g~v~~~~g~~~~   88 (122)
T cd02791          66 LRVRVTDRVRPGEVFVPMHWGDQ   88 (122)
T ss_pred             EEEEECCCcCCCeEEEecccCcc
Confidence            45555555   799999 99976


No 90 
>PF08255 Leader_Trp:  Trp-operon Leader Peptide;  InterPro: IPR013205 The tryptophan operon regulatory region of Citrobacter freundii (leader transcript) encodes a 14-residue peptide containing characteristic tandem tryptophan residues. It is about 10 nucleotides shorter than those of Escherichia coli and Salmonella typhimurium [].
Probab=20.74  E-value=41  Score=16.52  Aligned_cols=10  Identities=30%  Similarity=0.767  Sum_probs=7.4

Q ss_pred             EEeeC-cCcce
Q 021159          285 ILYLL-IWFRK  294 (316)
Q Consensus       285 ~LfiP-gWwH~  294 (316)
                      ++|.= +|||-
T Consensus         3 a~~~L~~WWrt   13 (14)
T PF08255_consen    3 ATFSLHGWWRT   13 (14)
T ss_pred             eEEEEeeEEEc
Confidence            46777 99984


No 91 
>PF01476 LysM:  LysM domain;  InterPro: IPR018392 This domain is about 40 residues long and is found in a variety of enzymes involved in bacterial cell wall degradation []. This domain may have a general peptidoglycan binding function.; GO: 0016998 cell wall macromolecule catabolic process; PDB: 2DJP_A 3ZQD_A 1Y7M_B 4A52_A 2L9Y_A 1E0G_A.
Probab=20.60  E-value=44  Score=20.94  Aligned_cols=10  Identities=20%  Similarity=0.434  Sum_probs=9.2

Q ss_pred             EcCCCEEeeC
Q 021159          280 VNAGEILYLL  289 (316)
Q Consensus       280 L~pGD~LfiP  289 (316)
                      |.||+.|.||
T Consensus        35 l~~G~~l~iP   44 (44)
T PF01476_consen   35 LQPGQKLCIP   44 (44)
T ss_dssp             GGTTEEEEEC
T ss_pred             CCCCCEEEeC
Confidence            8999999998


No 92 
>TIGR03028 EpsE polysaccharide export protein EpsE. Sequences in this family of proteins are members of a polysaccharide export protein family (pfam02563) which includes the wza protein from E.coli. This family of proteins are homologous to the EpsE protein of the methanolan biosynthesis operon of Methylobacillus species strain 12S. The distribution of this protein appears to be restricted to a subset of exopolysaccharide operons containing a syntenic grouping of genes including a variant of the EpsH exosortase protein. Exosortase has been proposed to be involved in the targetting and processing of proteins containing the PEP-CTERM domain to the exopolysaccharide layer.
Probab=20.35  E-value=61  Score=29.11  Aligned_cols=16  Identities=25%  Similarity=0.380  Sum_probs=13.6

Q ss_pred             cEEEEEcCCCEEeeC-c
Q 021159          275 PFECTVNAGEILYLL-I  290 (316)
Q Consensus       275 ~~~~~L~pGD~LfiP-g  290 (316)
                      .....|+|||.|||| .
T Consensus       146 ~~ni~L~~GD~I~V~~~  162 (239)
T TIGR03028       146 NENILVAGGDIIYVDRA  162 (239)
T ss_pred             cCCcEEcCCCEEEEcCC
Confidence            346789999999999 5


No 93 
>PF06251 Caps_synth_GfcC:  Capsule biosynthesis GfcC;  InterPro: IPR010425 This entry represents uncharacterised bacterial proteins that contain a central beta-grasp like domain related to the SLBB domain [].; PDB: 3P42_B.
Probab=20.26  E-value=63  Score=28.78  Aligned_cols=12  Identities=17%  Similarity=0.429  Sum_probs=7.2

Q ss_pred             EEEcCCCEEeeC
Q 021159          278 CTVNAGEILYLL  289 (316)
Q Consensus       278 ~~L~pGD~LfiP  289 (316)
                      ..|.|||+||||
T Consensus       191 ~~l~PG~~I~Vp  202 (229)
T PF06251_consen  191 QELAPGATIYVP  202 (229)
T ss_dssp             EE--TT-EEEE-
T ss_pred             CCCCCCCEEEEc
Confidence            569999999999


Done!