Query         048097
Match_columns 224
No_of_seqs    261 out of 1643
Neff          6.8 
Searched_HMMs 46136
Date          Fri Mar 29 06:14:30 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/048097.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/048097hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 TIGR03404 bicupin_oxalic bicup 100.0 2.8E-28 6.1E-33  222.7  19.9  163   46-219   200-362 (367)
  2 PLN00212 glutelin; Provisional  99.9 3.9E-25 8.4E-30  207.4  15.6  146   70-221   323-470 (493)
  3 TIGR03404 bicupin_oxalic bicup  99.9 1.2E-23 2.6E-28  192.2  18.2  146   59-219    37-185 (367)
  4 PF00190 Cupin_1:  Cupin;  Inte  99.9 6.8E-24 1.5E-28  169.9  12.4  138   63-214     2-144 (144)
  5 smart00835 Cupin_1 Cupin. This  99.9 2.7E-20 5.8E-25  149.4  17.0  135   73-213     8-145 (146)
  6 PLN00212 glutelin; Provisional  99.8 1.1E-19 2.5E-24  170.7  19.6  140   75-219    61-249 (493)
  7 COG2140 Thermophilic glucose-6  99.8 4.9E-19 1.1E-23  148.9  12.7  151   56-221    49-201 (209)
  8 PF07883 Cupin_2:  Cupin domain  99.4 3.4E-13 7.4E-18   94.1   7.6   70   99-176     2-71  (71)
  9 COG1917 Uncharacterized conser  99.4 4.4E-12 9.5E-17   99.6  11.3   86   85-178    33-118 (131)
 10 PRK13290 ectC L-ectoine syntha  99.4 1.2E-11 2.7E-16   97.3  11.7   81   93-183    33-114 (125)
 11 COG0662 {ManC} Mannose-6-phosp  99.4 9.8E-12 2.1E-16   97.8  11.1   82   93-182    34-115 (127)
 12 PRK04190 glucose-6-phosphate i  99.3 3.8E-11 8.3E-16  100.9  13.5   88   89-179    62-157 (191)
 13 COG3837 Uncharacterized conser  99.1 2.5E-10 5.4E-15   92.1   9.4   82   86-177    35-119 (161)
 14 PRK11171 hypothetical protein;  99.1 1.5E-09 3.3E-14   95.5  13.9  108   51-176    27-135 (266)
 15 TIGR01479 GMP_PMI mannose-1-ph  99.1 7.5E-10 1.6E-14  104.5  11.7   78   94-179   375-452 (468)
 16 PRK09943 DNA-binding transcrip  99.1 1.2E-09 2.6E-14   90.8  11.0   76   93-177   105-181 (185)
 17 COG4101 Predicted mannose-6-ph  99.1 1.3E-09 2.8E-14   84.3   9.8   84   94-183    45-129 (142)
 18 PRK15460 cpsB mannose-1-phosph  99.1 1.2E-09 2.6E-14  103.4  11.4   77   93-177   383-459 (478)
 19 PF01050 MannoseP_isomer:  Mann  99.0 3.7E-09 8.1E-14   85.8  10.0   77   93-177    61-137 (151)
 20 TIGR03214 ura-cupin putative a  99.0 4.4E-09 9.5E-14   92.3  10.9   73   94-174   178-250 (260)
 21 TIGR03214 ura-cupin putative a  98.9 9.2E-09   2E-13   90.3  11.3   75   94-176    57-132 (260)
 22 PRK11171 hypothetical protein;  98.9 9.8E-09 2.1E-13   90.4   9.9   73   94-175   183-256 (266)
 23 PF02041 Auxin_BP:  Auxin bindi  98.7 1.7E-07 3.7E-12   75.3  11.1  100   87-189    38-139 (167)
 24 PF06560 GPI:  Glucose-6-phosph  98.7 2.5E-07 5.4E-12   77.2  11.4   86   90-178    45-146 (182)
 25 PRK13264 3-hydroxyanthranilate  98.5 7.7E-07 1.7E-11   73.8   9.4   66  103-175    42-107 (177)
 26 PF11699 CENP-C_C:  Mif2/CENP-C  98.5 8.8E-07 1.9E-11   65.3   8.3   74   94-175    11-84  (85)
 27 TIGR03037 anthran_nbaC 3-hydro  98.4 1.7E-06 3.6E-11   70.7   9.8   66  103-175    36-101 (159)
 28 TIGR02451 anti_sig_ChrR anti-s  98.4 1.9E-06 4.1E-11   73.7   8.5   72   95-179   127-198 (215)
 29 PF12973 Cupin_7:  ChrR Cupin-l  98.3 1.7E-06 3.7E-11   63.9   7.0   66   94-174    23-88  (91)
 30 PF02311 AraC_binding:  AraC-li  98.3 3.1E-06 6.8E-11   64.4   7.8   64  104-176    12-75  (136)
 31 PF03079 ARD:  ARD/ARD' family;  98.2 1.3E-05 2.8E-10   65.5  10.3   71  107-182    84-154 (157)
 32 PRK15457 ethanolamine utilizat  98.2 1.4E-05 3.1E-10   68.7   9.8   69   95-176   157-225 (233)
 33 PRK10371 DNA-binding transcrip  98.0 2.3E-05 4.9E-10   70.0   8.9   59  100-167    31-89  (302)
 34 TIGR02272 gentisate_1_2 gentis  98.0 1.2E-05 2.7E-10   73.0   7.1   76   94-177    80-155 (335)
 35 COG1791 Uncharacterized conser  98.0 5.9E-05 1.3E-09   62.0   9.9   73  109-186    89-161 (181)
 36 PRK10296 DNA-binding transcrip  97.9 8.5E-05 1.8E-09   64.8  10.1   52  105-165    33-84  (278)
 37 PF05523 FdtA:  WxcM-like, C-te  97.9  0.0001 2.2E-09   58.4   9.3   78   96-179    33-112 (131)
 38 COG4297 Uncharacterized protei  97.8 4.7E-05   1E-09   60.6   5.6   66  105-176    52-118 (163)
 39 COG3435 Gentisate 1,2-dioxygen  97.8   4E-05 8.7E-10   68.2   5.7   92   79-178    71-167 (351)
 40 PRK13500 transcriptional activ  97.8 9.3E-05   2E-09   66.2   8.2   55  104-167    57-111 (312)
 41 TIGR02297 HpaA 4-hydroxyphenyl  97.8 6.2E-05 1.3E-09   65.7   6.9   57  105-169    33-89  (287)
 42 PF05899 Cupin_3:  Protein of u  97.8 7.4E-05 1.6E-09   53.3   5.8   58   95-162     7-64  (74)
 43 PRK13501 transcriptional activ  97.8 9.4E-05   2E-09   65.1   7.6   62   94-166    19-80  (290)
 44 PF14499 DUF4437:  Domain of un  97.7 4.9E-05 1.1E-09   66.5   5.6   73   93-173    34-106 (251)
 45 KOG2107 Uncharacterized conser  97.7 7.4E-05 1.6E-09   61.1   5.5   57  107-167    85-141 (179)
 46 PRK13503 transcriptional activ  97.7 0.00016 3.4E-09   62.8   7.4   53  104-165    24-76  (278)
 47 PF06339 Ectoine_synth:  Ectoin  97.6 0.00084 1.8E-08   52.6  10.3   82   92-182    32-113 (126)
 48 COG3257 GlxB Uncharacterized p  97.6 0.00072 1.6E-08   57.8   9.7   74   95-176    61-135 (264)
 49 PRK13502 transcriptional activ  97.5  0.0004 8.8E-09   60.6   7.9   56  103-167    26-81  (282)
 50 TIGR02272 gentisate_1_2 gentis  97.5  0.0004 8.6E-09   63.2   7.5   86   76-174   232-318 (335)
 51 PF06052 3-HAO:  3-hydroxyanthr  97.4  0.0022 4.8E-08   51.8  10.1   79   98-183    36-114 (151)
 52 COG1898 RfbC dTDP-4-dehydrorha  97.0  0.0077 1.7E-07   50.0   9.9   71  104-174    54-130 (173)
 53 PF06249 EutQ:  Ethanolamine ut  97.0  0.0021 4.6E-08   52.2   6.2   58   95-163    77-134 (152)
 54 PF05995 CDO_I:  Cysteine dioxy  96.7   0.044 9.5E-07   45.3  11.9   86   94-179    74-165 (175)
 55 COG4766 EutQ Ethanolamine util  96.6    0.02 4.2E-07   46.6   9.1   68   95-175   100-167 (176)
 56 COG3450 Predicted enzyme of th  96.5  0.0052 1.1E-07   47.8   5.1   60   95-164    45-104 (116)
 57 PF00908 dTDP_sugar_isom:  dTDP  96.4    0.02 4.4E-07   47.6   8.6   71  103-173    51-129 (176)
 58 TIGR01221 rmlC dTDP-4-dehydror  96.4   0.068 1.5E-06   44.5  11.2   71  103-173    52-129 (176)
 59 PF13621 Cupin_8:  Cupin-like d  96.2   0.024 5.3E-07   47.9   8.2   72   97-169   132-236 (251)
 60 COG3435 Gentisate 1,2-dioxygen  95.9   0.029 6.3E-07   50.3   7.2   89   74-174   241-330 (351)
 61 PF08007 Cupin_4:  Cupin superf  95.7    0.13 2.9E-06   46.4  10.6   70   96-166   114-200 (319)
 62 PF04209 HgmA:  homogentisate 1  95.5    0.12 2.6E-06   48.6   9.8   56  109-174   139-194 (424)
 63 PF13759 2OG-FeII_Oxy_5:  Putat  95.4   0.055 1.2E-06   40.3   6.1   74  100-173     5-98  (101)
 64 PF02678 Pirin:  Pirin;  InterP  95.2    0.07 1.5E-06   40.8   6.1   62  105-173    39-103 (107)
 65 PRK05341 homogentisate 1,2-dio  95.1    0.19 4.1E-06   47.3  10.0   59  108-175   146-204 (438)
 66 PF07385 DUF1498:  Protein of u  94.8    0.21 4.6E-06   43.0   8.7   78  100-179    92-189 (225)
 67 PLN02658 homogentisate 1,2-dio  94.8    0.29 6.3E-06   46.1  10.2   57  109-174   140-196 (435)
 68 TIGR02466 conserved hypothetic  94.7    0.16 3.5E-06   43.1   7.6   76   96-177    97-197 (201)
 69 COG1741 Pirin-related protein   94.7    0.12 2.6E-06   46.0   7.2   68   99-173    48-119 (276)
 70 TIGR01015 hmgA homogentisate 1  94.6    0.31 6.7E-06   45.8  10.0   56  108-173   140-195 (429)
 71 PF12852 Cupin_6:  Cupin         94.6    0.18 3.8E-06   41.5   7.6   43  117-165    36-78  (186)
 72 PF14499 DUF4437:  Domain of un  94.4   0.037 8.1E-07   48.5   3.2   75   95-177   171-245 (251)
 73 PF07847 DUF1637:  Protein of u  94.2    0.28 6.1E-06   41.6   8.1   88   90-178    39-143 (200)
 74 PRK12335 tellurite resistance   94.2    0.24 5.1E-06   43.8   8.0   62  103-166    19-82  (287)
 75 PRK00924 5-keto-4-deoxyuronate  93.9     0.4 8.8E-06   42.6   8.8   82   94-180   174-261 (276)
 76 PF02373 JmjC:  JmjC domain, hy  93.8    0.13 2.9E-06   38.3   5.0   30  139-168    78-107 (114)
 77 PF05118 Asp_Arg_Hydrox:  Aspar  93.7    0.19 4.2E-06   40.9   6.1   82   85-174    68-156 (163)
 78 KOG3706 Uncharacterized conser  93.6   0.047   1E-06   51.8   2.4   91   74-165   285-404 (629)
 79 PRK10572 DNA-binding transcrip  93.3    0.29 6.3E-06   42.8   7.0   44  116-167    49-92  (290)
 80 PRK09685 DNA-binding transcrip  92.1     1.1 2.5E-05   39.1   9.1   66   94-167    44-114 (302)
 81 KOG3995 3-hydroxyanthranilate   91.4    0.34 7.3E-06   41.6   4.6   57  103-164    41-97  (279)
 82 COG5553 Predicted metal-depend  91.2       1 2.2E-05   37.2   7.0   77   95-176    73-155 (191)
 83 COG3806 ChrR Transcriptional a  91.2    0.75 1.6E-05   39.0   6.5   85   75-177   113-197 (216)
 84 PF05726 Pirin_C:  Pirin C-term  91.1    0.91   2E-05   34.1   6.4   67   97-174     1-67  (104)
 85 COG3508 HmgA Homogentisate 1,2  91.1     2.9 6.3E-05   38.6  10.5   73   93-175   123-196 (427)
 86 PF06865 DUF1255:  Protein of u  90.8     2.3   5E-05   31.9   8.1   44  115-164    40-83  (94)
 87 PRK10579 hypothetical protein;  90.3     2.6 5.6E-05   31.6   7.9   44  115-164    40-83  (94)
 88 PRK15131 mannose-6-phosphate i  90.1     1.8 3.9E-05   40.4   8.7   59   94-163   320-378 (389)
 89 PF09313 DUF1971:  Domain of un  89.9     5.8 0.00013   28.9   9.4   63  104-168    12-76  (82)
 90 KOG2757 Mannose-6-phosphate is  88.5     2.4 5.3E-05   39.2   8.0   75   94-177   332-406 (411)
 91 COG3822 ABC-type sugar transpo  88.3     2.3   5E-05   36.0   7.2   80   99-180    90-189 (225)
 92 COG3257 GlxB Uncharacterized p  88.1     2.2 4.7E-05   36.9   7.0   72   92-172   179-251 (264)
 93 PLN02288 mannose-6-phosphate i  87.4       2 4.3E-05   40.2   6.9   58   94-158   333-390 (394)
 94 TIGR00218 manA mannose-6-phosp  87.3     3.5 7.7E-05   36.8   8.4   60   93-163   233-292 (302)
 95 PRK09391 fixK transcriptional   86.2     8.2 0.00018   32.6   9.7  124   94-221    35-204 (230)
 96 COG2850 Uncharacterized conser  86.0       2 4.3E-05   39.7   6.0   64  101-165   125-202 (383)
 97 PF14525 AraC_binding_2:  AraC-  85.0      11 0.00025   29.3   9.4   66   94-167    33-98  (172)
 98 PF00027 cNMP_binding:  Cyclic   84.2     3.2   7E-05   28.6   5.4   48  101-152     3-51  (91)
 99 PRK11753 DNA-binding transcrip  84.2      11 0.00024   30.8   9.4   54   98-154    21-74  (211)
100 PF11142 DUF2917:  Protein of u  83.8     4.9 0.00011   27.7   5.9   56  100-163     2-57  (63)
101 PF04962 KduI:  KduI/IolB famil  83.4      20 0.00044   31.5  11.1   96   78-180   136-247 (261)
102 COG3123 Uncharacterized protei  82.1     5.2 0.00011   29.5   5.6   41  116-162    41-81  (94)
103 PRK13918 CRP/FNR family transc  81.0     7.7 0.00017   31.6   7.2   55   99-155     8-63  (202)
104 smart00100 cNMP Cyclic nucleot  80.3      11 0.00023   26.6   7.0   55   98-155    18-72  (120)
105 PF06172 Cupin_5:  Cupin superf  79.6      24 0.00051   28.2   9.2   78   95-176    41-125 (139)
106 cd00038 CAP_ED effector domain  75.5      13 0.00028   26.1   6.3   54   98-154    18-71  (115)
107 COG1482 ManA Phosphomannose is  73.0      22 0.00048   32.3   8.2   59   94-163   241-299 (312)
108 PRK10402 DNA-binding transcrip  72.9      13 0.00028   31.2   6.5   54   99-155    33-86  (226)
109 PLN02868 acyl-CoA thioesterase  69.1      18  0.0004   33.6   7.1   53   98-154    32-84  (413)
110 TIGR00218 manA mannose-6-phosp  67.4       3 6.4E-05   37.3   1.4   19  143-161   152-170 (302)
111 PF07172 GRP:  Glycine rich pro  66.9     7.7 0.00017   29.0   3.4    9    1-9       1-9   (95)
112 PF04115 Ureidogly_hydro:  Urei  66.7      33 0.00072   28.0   7.4   66  110-175    74-143 (165)
113 PHA02984 hypothetical protein;  65.8      43 0.00094   29.8   8.2   51  117-172    92-144 (286)
114 KOG4281 Uncharacterized conser  64.9       3 6.5E-05   35.9   0.9   42   91-132    71-112 (236)
115 KOG2130 Phosphatidylserine-spe  64.7      11 0.00024   34.4   4.5   46  139-184   260-305 (407)
116 PRK03606 ureidoglycolate hydro  64.3      46   0.001   27.3   7.8   65  109-173    72-138 (162)
117 COG1482 ManA Phosphomannose is  63.4     6.2 0.00013   35.8   2.7   21  143-163   159-179 (312)
118 PHA02890 hypothetical protein;  63.1      64  0.0014   28.6   8.7   45  116-164    90-136 (278)
119 COG3717 KduI 5-keto 4-deoxyuro  62.5      32  0.0007   30.2   6.7   86   90-180   172-263 (278)
120 PRK00924 5-keto-4-deoxyuronate  62.1      48   0.001   29.6   8.0   51  115-173    72-125 (276)
121 PRK15131 mannose-6-phosphate i  61.6     8.5 0.00018   35.9   3.4   22  142-163   237-258 (389)
122 COG0664 Crp cAMP-binding prote  59.9      38 0.00083   26.9   6.7   57   97-156    23-79  (214)
123 PF04962 KduI:  KduI/IolB famil  59.3      36 0.00078   30.0   6.7   78   79-167    14-99  (261)
124 PRK15186 AraC family transcrip  58.7      35 0.00076   30.4   6.7   46  117-169    39-84  (291)
125 PF04622 ERG2_Sigma1R:  ERG2 an  57.5      54  0.0012   28.2   7.3   93  104-211   110-205 (216)
126 PRK11161 fumarate/nitrate redu  57.1      46 0.00099   27.7   6.9   52  100-154    40-91  (235)
127 TIGR03697 NtcA_cyano global ni  57.1      35 0.00076   27.3   6.0   37  116-154    11-47  (193)
128 PRK10202 ebgC cryptic beta-D-g  56.7      40 0.00087   27.0   6.1   54  109-163    58-127 (149)
129 COG2731 EbgC Beta-galactosidas  54.5      51  0.0011   26.9   6.3   61  107-167    60-137 (154)
130 TIGR00022 uncharacterized prot  53.8      83  0.0018   24.8   7.4   56  107-162    60-133 (142)
131 PF04074 DUF386:  Domain of unk  53.6      44 0.00095   26.6   5.9   69   95-163    46-134 (153)
132 PF13640 2OG-FeII_Oxy_3:  2OG-F  52.2      33 0.00071   24.6   4.6   64  100-165     4-86  (100)
133 KOG1417 Homogentisate 1,2-diox  50.1 1.8E+02  0.0038   26.7   9.5   62  108-177   147-208 (446)
134 COG3718 IolB Uncharacterized e  46.6 1.8E+02  0.0039   25.6   8.8   86   79-168    16-103 (270)
135 PRK13395 ureidoglycolate hydro  44.0 1.4E+02  0.0031   24.7   7.5   67  109-175    72-141 (171)
136 PRK14585 pgaD putative PGA bio  43.4      26 0.00056   28.0   2.9   25  195-219    88-112 (137)
137 PF13464 DUF4115:  Domain of un  42.8 1.1E+02  0.0025   21.2   7.4   51  123-177     5-55  (77)
138 KOG2131 Uncharacterized conser  42.6      28 0.00061   32.4   3.4   72   95-168   196-294 (427)
139 PRK09392 ftrB transcriptional   42.6      55  0.0012   27.3   5.1   52   99-154    32-83  (236)
140 PF13994 PgaD:  PgaD-like prote  41.6      31 0.00067   27.2   3.2   24  196-219   100-123 (138)
141 KOG3416 Predicted nucleic acid  40.0 1.2E+02  0.0026   24.1   6.1   66   87-164    11-80  (134)
142 PRK14584 hmsS hemin storage sy  39.5      35 0.00075   27.9   3.2   25  195-219    97-121 (153)
143 PF02787 CPSase_L_D3:  Carbamoy  38.2      32 0.00069   26.8   2.7   26  196-221    72-97  (123)
144 PF13348 Y_phosphatase3C:  Tyro  37.3      34 0.00074   23.2   2.5   24  197-220    44-67  (68)
145 PF10365 DUF2436:  Domain of un  35.7      49  0.0011   26.8   3.4   38   25-64    105-142 (161)
146 PLN03192 Voltage-dependent pot  34.4      90  0.0019   31.8   5.9   53   96-152   396-448 (823)
147 COG1741 Pirin-related protein   34.4 3.4E+02  0.0073   24.2  12.1   43   86-130   165-207 (276)
148 PF06719 AraC_N:  AraC-type tra  33.5 1.9E+02  0.0041   22.9   6.7   70   94-175     5-77  (155)
149 PF14801 GCD14_N:  tRNA methylt  32.3   1E+02  0.0022   20.7   4.0   36  128-166    11-46  (54)
150 PLN02288 mannose-6-phosphate i  32.3      34 0.00075   32.0   2.4   20  144-163   253-272 (394)
151 PF04202 Mfp-3:  Foot protein 3  30.8      47   0.001   23.3   2.3   25    1-26      1-25  (71)
152 PRK02290 3-dehydroquinate synt  30.5 1.5E+02  0.0033   27.4   6.1   82   74-162   250-334 (344)
153 PF05721 PhyH:  Phytanoyl-CoA d  29.9      94   0.002   24.5   4.4   30  140-169   178-208 (211)
154 KOG2132 Uncharacterized conser  29.3      23 0.00049   32.5   0.6   82   82-164   237-348 (355)
155 KOG0500 Cyclic nucleotide-gate  28.5 1.1E+02  0.0024   29.7   5.0   32  116-152   348-379 (536)
156 PF01959 DHQS:  3-dehydroquinat  27.0 1.8E+02   0.004   26.9   6.0   83   74-163   260-345 (354)
157 PF13384 HTH_23:  Homeodomain-l  26.8      69  0.0015   19.9   2.5   26  196-221    17-42  (50)
158 PHA00672 hypothetical protein   24.7 3.6E+02  0.0079   21.5   6.8   67   94-170    46-112 (152)
159 TIGR02408 ectoine_ThpD ectoine  24.2      98  0.0021   27.1   3.7   38  143-180   212-251 (277)
160 KOG0498 K+-channel ERG and rel  24.1 1.3E+02  0.0029   30.5   5.0   48  101-152   446-493 (727)
161 KOG1633 F-box protein JEMMA an  24.0      86  0.0019   32.1   3.7   41  139-179   193-233 (776)
162 KOG1356 Putative transcription  23.4      31 0.00066   35.4   0.4   62  102-166   762-823 (889)
163 PF08194 DIM:  DIM protein;  In  22.3      78  0.0017   19.5   1.9   10   40-50     24-33  (36)
164 PF00325 Crp:  Bacterial regula  21.0   1E+02  0.0022   18.3   2.2   25  197-221     3-27  (32)

No 1  
>TIGR03404 bicupin_oxalic bicupin, oxalate decarboxylase family. Members of this protein family are defined as bicupins as they have two copies of the cupin domain (pfam00190). Two different known activities for members of this family are oxalate decarboxylase (EC 4.1.1.2) and oxalate oxidase (EC 1.2.3.4), although the latter activity has more often been found in distantly related monocupin (germin) proteins.
Probab=99.96  E-value=2.8e-28  Score=222.69  Aligned_cols=163  Identities=17%  Similarity=0.195  Sum_probs=146.3

Q ss_pred             CcccCCCCCCCCCCeeeecCCCCCCccCCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEec
Q 048097           46 GKFCKDPKLAKAEDFFLSGLDKPGNTENRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEG  125 (224)
Q Consensus        46 g~~ck~p~~~~~~df~f~~~~~~~~~~~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G  125 (224)
                      ..+-+.+....++.|+|++...++..  ..|++++.+++.+||+++  ++++++++++||+++++|||++++|++||++|
T Consensus       200 ~~~~~~~~~~~~~~~~~~~~~~~p~~--~~gG~~~~~~~~~~p~~~--~~s~~~~~l~PG~~~~~H~H~~~~E~~yvl~G  275 (367)
T TIGR03404       200 QEAVTGPAGEVPGPFTYHLSEQKPKQ--VPGGTVRIADSTNFPVSK--TIAAAIVTVEPGAMRELHWHPNADEWQYFIQG  275 (367)
T ss_pred             cccCcCCCCCCCccEEEEhhhCCcee--cCCceEEEEChhhccCcc--eEEEEEEEECCCCccCCeeCcCCCeEEEEEEE
Confidence            34445566777788999998888744  567789999999999988  58999999999999999999999999999999


Q ss_pred             EEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCceeechhhhhcCCCCCCHHHHHhh
Q 048097          126 TLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVITIADTVFGANPPINPDFLGKA  205 (224)
Q Consensus       126 ~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~~~~~lf~~~p~~p~~vLa~a  205 (224)
                      ++++++.+++   ++..++.+++||+++||+|..|+++|.|+++++++++|++..++.+.+++|+..    +|++||+++
T Consensus       276 ~~~~~v~d~~---g~~~~~~l~~GD~~~iP~g~~H~i~N~G~e~l~fL~if~s~~~~~i~l~~~l~~----~p~~vl~~~  348 (367)
T TIGR03404       276 QARMTVFAAG---GNARTFDYQAGDVGYVPRNMGHYVENTGDETLVFLEVFKADRFADVSLNQWLAL----TPPQLVAAH  348 (367)
T ss_pred             EEEEEEEecC---CcEEEEEECCCCEEEECCCCeEEEEECCCCCEEEEEEECCCCCceeEHHHHHhh----CCHHHHHHH
Confidence            9999998776   455578999999999999999999999999999999999999999999999754    999999999


Q ss_pred             cCCCHHHHHHhhhh
Q 048097          206 FQLDPKIVKDLQDK  219 (224)
Q Consensus       206 f~~~~~~v~~l~~~  219 (224)
                      |+++++++++|++.
T Consensus       349 ~~~~~~~~~~l~~~  362 (367)
T TIGR03404       349 LNLDDEVIDSLKKE  362 (367)
T ss_pred             hCcCHHHHHhcccc
Confidence            99999999999975


No 2  
>PLN00212 glutelin; Provisional
Probab=99.93  E-value=3.9e-25  Score=207.44  Aligned_cols=146  Identities=21%  Similarity=0.277  Sum_probs=123.1

Q ss_pred             CccCCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCC
Q 048097           70 NTENRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKG  149 (224)
Q Consensus        70 ~~~~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~G  149 (224)
                      ++.++.+++++.+++.+||+|+++|+++.+++|.+|+|.+||||++|+|++||++|+++++|+++++  ++++..+|++|
T Consensus       323 d~y~~~~G~it~v~~~~~P~L~~L~LSa~rv~L~~gam~~PHwn~nA~eI~yV~rG~g~vqvV~~~g--~~vf~~~L~~G  400 (493)
T PLN00212        323 DTYNPRAGRITRLNSQKFPILNLIQMSATRVNLYQNALLSPFWNVNAHSVVYITQGRARVQVVSNNG--KTVFNGVLRPG  400 (493)
T ss_pred             CccCCCceEEEEechhhCccccccCeeEEEEEEcCCcccCCeecCCCCEEEEEeecceEEEEEcCCC--CEEEEEEEcCC
Confidence            4457888899999999999999999999999999999999999999999999999999999998774  88999999999


Q ss_pred             CEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCceeech--hhhhcCCCCCCHHHHHhhcCCCHHHHHHhhhhhc
Q 048097          150 DVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVITIA--DTVFGANPPINPDFLGKAFQLDPKIVKDLQDKFI  221 (224)
Q Consensus       150 Dv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~~~--~~lf~~~p~~p~~vLa~af~~~~~~v~~l~~~~~  221 (224)
                      |+++||+|.+|.... +++...+++.-.+.++-...++  .++|+.   +|.+||+++|+++.+++++||..+.
T Consensus       401 dvfVVPqg~~v~~~A-~~egfe~v~F~tna~~~~s~laG~~Sv~~a---lp~eVla~Af~is~eea~~lk~n~~  470 (493)
T PLN00212        401 QLLIIPQHYAVLKKA-EREGCQYIAFKTNANAMVSHIAGKNSIFRA---LPVDVIANAYRISREEARRLKNNRG  470 (493)
T ss_pred             CEEEECCCCeEEEee-cCCceEEEEeecCCCccccccccHHHHHHh---CCHHHHHHHcCCCHHHHHHHHhccc
Confidence            999999999997654 3444555544333333222222  578884   9999999999999999999998754


No 3  
>TIGR03404 bicupin_oxalic bicupin, oxalate decarboxylase family. Members of this protein family are defined as bicupins as they have two copies of the cupin domain (pfam00190). Two different known activities for members of this family are oxalate decarboxylase (EC 4.1.1.2) and oxalate oxidase (EC 1.2.3.4), although the latter activity has more often been found in distantly related monocupin (germin) proteins.
Probab=99.91  E-value=1.2e-23  Score=192.23  Aligned_cols=146  Identities=20%  Similarity=0.234  Sum_probs=124.5

Q ss_pred             CeeeecCCCCCCccCCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCC
Q 048097           59 DFFLSGLDKPGNTENRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLN  138 (224)
Q Consensus        59 df~f~~~~~~~~~~~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~  138 (224)
                      -|.|+.-.++.    ..|++++.++..+||++++  +++.+++++||+++++|||. +.|++||++|++++++++++   
T Consensus        37 ~~~~~~~~~~~----~~gG~~~~~~~~~lP~l~~--ls~~~~~l~pG~~~~~HwH~-~~E~~yVl~G~~~v~~~d~~---  106 (367)
T TIGR03404        37 KWSFSDSHNRL----ENGGWAREVTVRDLPISTA--IAGVNMRLEPGAIRELHWHK-EAEWAYVLYGSCRITAVDEN---  106 (367)
T ss_pred             eeeeccccCcc----ccCceEEEeChhhccCccc--ccceEEEEcCCCCCCcccCC-CceEEEEEeeEEEEEEEcCC---
Confidence            45665443332    3577899999999999996  79999999999999999995 78999999999999999876   


Q ss_pred             CeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCC---CceeechhhhhcCCCCCCHHHHHhhcCCCHHHHHH
Q 048097          139 NTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQF---PGVITIADTVFGANPPINPDFLGKAFQLDPKIVKD  215 (224)
Q Consensus       139 ~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~---pg~~~~~~~lf~~~p~~p~~vLa~af~~~~~~v~~  215 (224)
                      ++.+.+.|++||+++||+|.+|+++|.+ +.+.++.+|++..   +..+.++.+ |++   +|++||+++|+++++++++
T Consensus       107 g~~~~~~L~~GD~~~fP~g~~H~~~n~~-~~~~~l~vf~~~~f~~~~~~~~~~~-l~~---~p~~Vla~~f~l~~~~~~~  181 (367)
T TIGR03404       107 GRNYIDDVGAGDLWYFPPGIPHSLQGLD-EGCEFLLVFDDGNFSEDGTFLVTDW-LAH---TPKDVLAKNFGVPESAFDN  181 (367)
T ss_pred             CcEEEeEECCCCEEEECCCCeEEEEECC-CCeEEEEEeCCcccCCcceeeHHHH-HHh---CCHHHHHHHhCCCHHHHHh
Confidence            7877789999999999999999999995 5577888887653   557778887 464   9999999999999999999


Q ss_pred             hhhh
Q 048097          216 LQDK  219 (224)
Q Consensus       216 l~~~  219 (224)
                      |++.
T Consensus       182 l~~~  185 (367)
T TIGR03404       182 LPLK  185 (367)
T ss_pred             cccc
Confidence            9985


No 4  
>PF00190 Cupin_1:  Cupin;  InterPro: IPR006045 This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel). This family contains 11S and 7S plant seed storage proteins, and germins. Plant seed storage proteins provide the major nitrogen source for the developing plant. ; GO: 0045735 nutrient reservoir activity; PDB: 2E9Q_A 2EVX_A 1OD5_A 1UCX_A 1UD1_C 1FXZ_C 3KGL_C 3KSC_D 1UIJ_F 1IPK_B ....
Probab=99.91  E-value=6.8e-24  Score=169.88  Aligned_cols=138  Identities=31%  Similarity=0.425  Sum_probs=110.7

Q ss_pred             ecCCCCCCccCCCCeeEEEccccccCccccc-ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCC--CC
Q 048097           63 SGLDKPGNTENRLGFNVTNANVEQIPGLNTL-GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQL--NN  139 (224)
Q Consensus        63 ~~~~~~~~~~~~~g~~v~~~~~~~~p~L~~l-gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~--~~  139 (224)
                      +.....+.. +..+++++.++..++|++.++ ++++.++.++||++++|||| ++.|+.||++|+++++++.++..  ..
T Consensus         2 n~~~~~~~~-~~~~G~~~~~~~~~~p~~~~~~~~~~~~~~i~pg~~~~Ph~h-~a~~i~~V~~G~~~~~~v~~~~~~~~~   79 (144)
T PF00190_consen    2 NLREPRPRV-SNEGGRIREADSEDFPILLGLNGVAVRRVLIEPGGLRAPHYH-NADEIVYVIEGRGRVGVVGPGGPQEEF   79 (144)
T ss_dssp             ETCSSSEEE-EETTEEEEEESTTTSHCHHHHTTEEEEEEEEETTEEEEEEEE-SSEEEEEEEESEEEEEEEETTCSSSEE
T ss_pred             CCCCCCCcc-cCCCEEEEEEChhhCcceecccceEEEeeehhcCCccceeEe-eeeEEeeeeccceEEEEEecCCccccc
Confidence            444333333 445678999999999966665 45666677799999999999 89999999999999999987510  01


Q ss_pred             eeEEEE--ecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCceeechhhhhcCCCCCCHHHHHhhcCCCHHHHH
Q 048097          140 TLIAKV--LNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVITIADTVFGANPPINPDFLGKAFQLDPKIVK  214 (224)
Q Consensus       140 k~~~~~--l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~~~~~lf~~~p~~p~~vLa~af~~~~~~v~  214 (224)
                      +....+  +++||++++|+|.+||+.|.|+++...+.+|++.+|..+            +|+++++++|++++++++
T Consensus        80 ~~~~~~v~l~~Gdv~~vP~G~~h~~~n~~~~~~~~~~~f~~~~~~~~------------l~~~v~~~~F~~~~~~~~  144 (144)
T PF00190_consen   80 RDFSQKVRLKAGDVFVVPAGHPHWIINDGDDEALVLIIFDTNNPPNQ------------LPPEVLAKAFFLSGEEVQ  144 (144)
T ss_dssp             EEEEEEEEEETTEEEEE-TT-EEEEEECSSSSEEEEEEEEESSTTGE------------SSHHHHHHHEESSHHHHB
T ss_pred             eeeeceeeeecccceeeccceeEEEEcCCCCCCEEEEEEECCCCccc------------CCcHHHHHhcCCCcCcCC
Confidence            344555  999999999999999999999888989889988888765            899999999999998763


No 5  
>smart00835 Cupin_1 Cupin. This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel). This family contains 11S and 7S plant seed storage proteins, and germins. Plant seed storage proteins provide the major nitrogen source for the developing plant.
Probab=99.86  E-value=2.7e-20  Score=149.38  Aligned_cols=135  Identities=38%  Similarity=0.568  Sum_probs=115.5

Q ss_pred             CCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097           73 NRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus        73 ~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      +..|+++..++..++|.+++.++.+.+++++||+..++|+|+++.|++||++|++++.+.+..+  ++.+...+++||++
T Consensus         8 ~~~~g~~~~~~~~~~~~~~~~~~~~~~~~i~pg~~~~~h~H~~~~e~~~Vl~G~~~~~~~~~~~--~~~~~~~l~~GD~~   85 (146)
T smart00835        8 SNEGGRLREADPTNFPALNGLGISAARVNLEPGGMLPPHYHPRATELLYVVRGEGRVGVVDPNG--NKVYDARLREGDVF   85 (146)
T ss_pred             cCCCceEEEeCchhCcccccCceEEEEEEecCCcCcCCeeCCCCCEEEEEEeCeEEEEEEeCCC--CeEEEEEecCCCEE
Confidence            3456668999999999999999999999999999999999998899999999999999876531  45567899999999


Q ss_pred             EEcCCCeeEEEeCCCCcEEEEEEEeCCCCceee---chhhhhcCCCCCCHHHHHhhcCCCHHHH
Q 048097          153 VFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVIT---IADTVFGANPPINPDFLGKAFQLDPKIV  213 (224)
Q Consensus       153 v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~---~~~~lf~~~p~~p~~vLa~af~~~~~~v  213 (224)
                      ++|+|..|+..|.++++++++ ++.+++|..-.   -..++|.   ++++++++++|+++++++
T Consensus        86 ~ip~g~~H~~~n~~~~~~~~l-~~~~~~~~~~~~~~~~~~~~~---~~~~~~~~~~~~~~~~~~  145 (146)
T smart00835       86 VVPQGHPHFQVNSGDENLEFV-AFNTNDPNRRFFLAGRNSVLR---GLPPEVLAAAFGVSAEEV  145 (146)
T ss_pred             EECCCCEEEEEcCCCCCEEEE-EEecCCCCceeEeecccchhh---cCCHHHHHHHhCcChHHc
Confidence            999999999999999999998 57667765421   1235677   599999999999999875


No 6  
>PLN00212 glutelin; Provisional
Probab=99.84  E-value=1.1e-19  Score=170.67  Aligned_cols=140  Identities=19%  Similarity=0.305  Sum_probs=114.8

Q ss_pred             CCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCC-CC-CCeeE----------
Q 048097           75 LGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSN-QL-NNTLI----------  142 (224)
Q Consensus        75 ~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~-~~-~~k~~----------  142 (224)
                      -|+ ++.....+-+.|.+.|++++|++++|+|+++||+| ++++++||++|++.++++.+. ++ -++.+          
T Consensus        61 e~G-~~E~~~~~~~q~~caGv~~~R~~i~p~gL~lP~y~-na~~liyV~qG~G~~G~v~pGcpeT~~~~~~~~~~~~~~~  138 (493)
T PLN00212         61 EAG-VTEYFDEKNEQFQCTGVFVIRRVIEPQGLLLPRYS-NTPGLVYIIQGRGSMGLTFPGCPATYQQQFQQFLTEGQSQ  138 (493)
T ss_pred             cCc-eeeecCCCChhhcccceEEEEEEecCCcccCcccc-CCCeEEEEEeCeEEEEEEeCCCcchhhhhccccccccccc
Confidence            344 66677788999999999999999999999999999 699999999999999999642 00 00110          


Q ss_pred             ----------EEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCC--------ceeech-----------------
Q 048097          143 ----------AKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFP--------GVITIA-----------------  187 (224)
Q Consensus       143 ----------~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~p--------g~~~~~-----------------  187 (224)
                                .+.|++||++++|+|.+||++|.|+++++++++++..++        ..+.++                 
T Consensus       139 ~~~~~d~hqkv~~lr~GDViaiPaG~~hw~yN~Gd~~~v~v~~~d~~n~~Nqld~~~r~F~LaG~~~~~~~~~~~~~~~~  218 (493)
T PLN00212        139 SQKFRDEHQKIHQFRQGDVVALPAGVAHWFYNDGDAPVVALYVYDINNNANQLEPRQREFLLAGNNNRQQQVYGRSIEQH  218 (493)
T ss_pred             ccccccccccceEeccCCEEEECCCCeEEEEeCCCCcEEEEEEEeccccccccCCCcceeeccCCCcccccccccccccc
Confidence                      158999999999999999999999999998888864432        233333                 


Q ss_pred             --hhhhcCCCCCCHHHHHhhcCCCHHHHHHhhhh
Q 048097          188 --DTVFGANPPINPDFLGKAFQLDPKIVKDLQDK  219 (224)
Q Consensus       188 --~~lf~~~p~~p~~vLa~af~~~~~~v~~l~~~  219 (224)
                        .++|+   ++++++|++||+++.++++||+..
T Consensus       219 ~~~nifs---GF~~e~La~Afnv~~e~~~klq~~  249 (493)
T PLN00212        219 SGQNIFS---GFSTELLSEALGINAQVAKRLQSQ  249 (493)
T ss_pred             ccCchhh---cCCHHHHHHHHCCCHHHHHHHhcc
Confidence              24888   699999999999999999999865


No 7  
>COG2140 Thermophilic glucose-6-phosphate isomerase and related metalloenzymes [Carbohydrate transport and metabolism / General function prediction only]
Probab=99.80  E-value=4.9e-19  Score=148.86  Aligned_cols=151  Identities=22%  Similarity=0.298  Sum_probs=134.4

Q ss_pred             CCCCeeeecCCCCCCccCCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcE--EEEEEecEEEEEEEe
Q 048097           56 KAEDFFLSGLDKPGNTENRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATE--ILVVLEGTLYVGFVT  133 (224)
Q Consensus        56 ~~~df~f~~~~~~~~~~~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~E--i~~Vl~G~~~v~~v~  133 (224)
                      ..+||+|..+.+.+...   |+.+.......+|+-     +-..+.+.||++...||||++.|  |.||++|++++.+..
T Consensus        49 ~~~~~~yel~~~~~~~~---~g~L~~~~t~~~pGs-----~g~e~~~t~G~~~~~H~Hp~ade~E~y~vi~G~g~m~v~~  120 (209)
T COG2140          49 KEDDFVYELLESEPGER---GGDLRLDVTRIFPGS-----AGAEVFKTPGAMRELHYHPNADEPEIYYVLKGEGRMLVQK  120 (209)
T ss_pred             CCCceEEEeeccccccc---CCeEEEEeeccCCCc-----cceEEEecCCcccccccCCCCCcccEEEEEeccEEEEEEc
Confidence            67899999877765442   788999999999986     55778999999999999999999  999999999999887


Q ss_pred             CCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCceeechhhhhcCCCCCCHHHHHhhcCCCHHHH
Q 048097          134 SNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVITIADTVFGANPPINPDFLGKAFQLDPKIV  213 (224)
Q Consensus       134 ~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~~~~~lf~~~p~~p~~vLa~af~~~~~~v  213 (224)
                      ++   +++....+++||++++|++..|+..|+|++|++++.++....+....+..++++    ++..+++..++.+...+
T Consensus       121 ~~---G~~~v~~~~~Gd~iyVPp~~gH~t~N~Gd~pLvf~~v~~~~~~~~y~~~~~~~~----~~~~~~~~~~~~~~~~~  193 (209)
T COG2140         121 PE---GEARVIAVRAGDVIYVPPGYGHYTINTGDEPLVFLNVYPADAGQDYDLIAWLGG----MPPVLVENGLNKNPKYV  193 (209)
T ss_pred             CC---CcEEEEEecCCcEEEeCCCcceEeecCCCCCEEEEEEEeCCCCceeeeeehhcc----CCceeeccccccCcccc
Confidence            76   678889999999999999999999999999999999999988999988888776    78889999999998888


Q ss_pred             HHhhhhhc
Q 048097          214 KDLQDKFI  221 (224)
Q Consensus       214 ~~l~~~~~  221 (224)
                      |.++.++.
T Consensus       194 D~p~~~~~  201 (209)
T COG2140         194 DVPRIKFA  201 (209)
T ss_pred             cCcccccc
Confidence            88877665


No 8  
>PF07883 Cupin_2:  Cupin domain;  InterPro: IPR013096 This family represents the conserved barrel domain of the cupin superfamily [] (cupa is the Latin term for a small barrel). ; PDB: 2OPK_C 3BU7_B 2PHD_D 3NVC_A 3NKT_A 3NJZ_A 3NW4_A 3NST_A 3NL1_A 2H0V_A ....
Probab=99.45  E-value=3.4e-13  Score=94.13  Aligned_cols=70  Identities=29%  Similarity=0.432  Sum_probs=62.8

Q ss_pred             EEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEE
Q 048097           99 RIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGF  176 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~  176 (224)
                      +++++||+..++|+|+...|++||++|++++.+ +     ++  ...+++||.+++|+|..|...|.++++++++.++
T Consensus         2 ~~~~~pG~~~~~h~H~~~~e~~~vl~G~~~~~~-~-----~~--~~~l~~Gd~~~i~~~~~H~~~n~~~~~~~~l~V~   71 (71)
T PF07883_consen    2 LVTLPPGGSIPPHRHPGEDEFFYVLSGEGTLTV-D-----GE--RVELKPGDAIYIPPGVPHQVRNPGDEPARFLVVY   71 (71)
T ss_dssp             EEEEETTEEEEEEEESSEEEEEEEEESEEEEEE-T-----TE--EEEEETTEEEEEETTSEEEEEEESSSEEEEEEEE
T ss_pred             EEEECCCCCCCCEECCCCCEEEEEEECCEEEEE-c-----cE--EeEccCCEEEEECCCCeEEEEECCCCCEEEEEEC
Confidence            578999999999999976699999999999984 2     33  5899999999999999999999999999998775


No 9  
>COG1917 Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=99.39  E-value=4.4e-12  Score=99.63  Aligned_cols=86  Identities=28%  Similarity=0.382  Sum_probs=72.9

Q ss_pred             cccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097           85 EQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus        85 ~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      .-.+...+..+.+.++.++||+..+.|+||...+.+||++|++++++..     .   .+.+++||++++|+|..|+..|
T Consensus        33 ~~~~~~~~~~~~~~~v~~~~G~~~~~H~hp~~~~~~~Vl~G~~~~~~~g-----~---~~~l~~Gd~i~ip~g~~H~~~a  104 (131)
T COG1917          33 RVLPRNEGENLSVVLVTFEPGAVIPWHTHPLGEQTIYVLEGEGTVQLEG-----E---KKELKAGDVIIIPPGVVHGLKA  104 (131)
T ss_pred             eeccCCCCceEEEEEEEECCCcccccccCCCcceEEEEEecEEEEEecC-----C---ceEecCCCEEEECCCCeeeecc
Confidence            3444445667899999999999999999996689999999999999862     2   3899999999999999999999


Q ss_pred             CCCCcEEEEEEEeC
Q 048097          165 IGKTSAVAFAGFSS  178 (224)
Q Consensus       165 ~G~~~a~~l~~~~s  178 (224)
                      .++.+.+.++++..
T Consensus       105 ~~~~~~~~l~v~~~  118 (131)
T COG1917         105 VEDEPMVLLLVFPL  118 (131)
T ss_pred             CCCCceeEEEEeee
Confidence            99887666666654


No 10 
>PRK13290 ectC L-ectoine synthase; Reviewed
Probab=99.35  E-value=1.2e-11  Score=97.28  Aligned_cols=81  Identities=15%  Similarity=0.139  Sum_probs=69.8

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEE-EEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVG-FVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAV  171 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~-~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~  171 (224)
                      .++++.++.++||+..+.|+|.. .|++||++|++++. +.+     ++  .+.|++||++++|++..|.+.|.  ++++
T Consensus        33 ~~~~~~~~~l~pG~~~~~h~h~~-~E~~yVL~G~~~~~~i~~-----g~--~~~L~aGD~i~~~~~~~H~~~N~--e~~~  102 (125)
T PRK13290         33 MGFSFHETTIYAGTETHLHYKNH-LEAVYCIEGEGEVEDLAT-----GE--VHPIRPGTMYALDKHDRHYLRAG--EDMR  102 (125)
T ss_pred             CCEEEEEEEECCCCcccceeCCC-EEEEEEEeCEEEEEEcCC-----CE--EEEeCCCeEEEECCCCcEEEEcC--CCEE
Confidence            36799999999999999999975 69999999999998 432     23  48999999999999999999997  8999


Q ss_pred             EEEEEeCCCCce
Q 048097          172 AFAGFSSQFPGV  183 (224)
Q Consensus       172 ~l~~~~s~~pg~  183 (224)
                      ++++++..-+|.
T Consensus       103 ~l~v~tP~~~~~  114 (125)
T PRK13290        103 LVCVFNPPLTGR  114 (125)
T ss_pred             EEEEECCCCCCc
Confidence            999988665554


No 11 
>COG0662 {ManC} Mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=99.35  E-value=9.8e-12  Score=97.79  Aligned_cols=82  Identities=29%  Similarity=0.240  Sum_probs=72.7

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      ...++.++.+.||+-..+|.|.+.+|++||++|++.+.+.+      +  ...|++||++++|+|..|...|.|..++.+
T Consensus        34 ~~~~~~~~~v~pg~~~~~~~H~~~dE~~~Vl~G~g~v~~~~------~--~~~v~~gd~~~iP~g~~H~~~N~G~~~L~l  105 (127)
T COG0662          34 DRYSIARILVKPGEEISLHHHHHRDEHWYVLEGTGKVTIGG------E--EVEVKAGDSVYIPAGTPHRVRNTGKIPLVL  105 (127)
T ss_pred             CcEEEEEEEECCCcccCcccccCcceEEEEEeeEEEEEECC------E--EEEecCCCEEEECCCCcEEEEcCCCcceEE
Confidence            46799999999999999999988899999999999998753      3  589999999999999999999999999999


Q ss_pred             EEEEeCCCCc
Q 048097          173 FAGFSSQFPG  182 (224)
Q Consensus       173 l~~~~s~~pg  182 (224)
                      +.+......+
T Consensus       106 iei~~p~~~~  115 (127)
T COG0662         106 IEVQSPPYLG  115 (127)
T ss_pred             EEEecCCcCC
Confidence            9887655443


No 12 
>PRK04190 glucose-6-phosphate isomerase; Provisional
Probab=99.32  E-value=3.8e-11  Score=100.89  Aligned_cols=88  Identities=19%  Similarity=0.137  Sum_probs=74.8

Q ss_pred             cccccceEEEEEEEcCCCc------CCCccCCCC--cEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCee
Q 048097           89 GLNTLGTSAVRIDYAPYGQ------NPPHTHPRA--TEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIH  160 (224)
Q Consensus        89 ~L~~lgis~~~v~l~pgg~------~ppH~Hp~a--~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H  160 (224)
                      .++..++.+..+.+.||..      .+.|+|+..  .|+.||++|++.+.+.+.+   +......+++||+++||+|..|
T Consensus        62 ~~~~~~L~~g~t~l~PG~~g~e~~mt~gH~H~~~~~~EiyyvlsG~g~~~l~~~~---G~~~~~~v~pGd~v~IPpg~~H  138 (191)
T PRK04190         62 EETEGDLNFGTTRLYPGKVGDEYFMTKGHFHAKADRAEIYYGLKGKGLMLLQDPE---GEARWIEMEPGTVVYVPPYWAH  138 (191)
T ss_pred             CCcCCceEEEEEEECCCcEecccccCCCeEcCCCCCCEEEEEEeCEEEEEEecCC---CcEEEEEECCCCEEEECCCCcE
Confidence            4555679999999999996      567999854  4999999999999887654   3445689999999999999999


Q ss_pred             EEEeCCCCcEEEEEEEeCC
Q 048097          161 FQVNIGKTSAVAFAGFSSQ  179 (224)
Q Consensus       161 ~~~N~G~~~a~~l~~~~s~  179 (224)
                      ...|.|++++++++++...
T Consensus       139 ~~iN~G~epl~fl~v~p~~  157 (191)
T PRK04190        139 RSVNTGDEPLVFLACYPAD  157 (191)
T ss_pred             EeEECCCCCEEEEEEEcCC
Confidence            9999999999999987643


No 13 
>COG3837 Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=99.15  E-value=2.5e-10  Score=92.13  Aligned_cols=82  Identities=23%  Similarity=0.220  Sum_probs=68.5

Q ss_pred             ccCcccccceEEEEEEEcCCCc-CCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCC--CeeEE
Q 048097           86 QIPGLNTLGTSAVRIDYAPYGQ-NPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIG--LIHFQ  162 (224)
Q Consensus        86 ~~p~L~~lgis~~~v~l~pgg~-~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G--~~H~~  162 (224)
                      .+-||...||  ....++||+. ...|||...+|++|||+|++++.+.+     .   ...|++||++-||+|  ..|..
T Consensus        35 ~~~Gl~~fGv--n~~~v~PG~~Ss~~H~Hs~edEfv~ILeGE~~l~~d~-----~---e~~lrpGD~~gFpAG~~~aHhl  104 (161)
T COG3837          35 DALGLKRFGV--NLEIVEPGGESSLRHWHSAEDEFVYILEGEGTLREDG-----G---ETRLRPGDSAGFPAGVGNAHHL  104 (161)
T ss_pred             hhcChhhccc--ceEEeCCCCccccccccccCceEEEEEcCceEEEECC-----e---eEEecCCceeeccCCCcceeEE
Confidence            4556665444  4556899995 79999999999999999999998653     2   389999999999999  99999


Q ss_pred             EeCCCCcEEEEEEEe
Q 048097          163 VNIGKTSAVAFAGFS  177 (224)
Q Consensus       163 ~N~G~~~a~~l~~~~  177 (224)
                      .|.|+..++.+++=+
T Consensus       105 iN~s~~~~~yL~vG~  119 (161)
T COG3837         105 INRSDVILRYLEVGT  119 (161)
T ss_pred             eecCCceEEEEEecc
Confidence            999999999997654


No 14 
>PRK11171 hypothetical protein; Provisional
Probab=99.12  E-value=1.5e-09  Score=95.49  Aligned_cols=108  Identities=18%  Similarity=0.085  Sum_probs=81.2

Q ss_pred             CCCCCCCCCeeeecCCCCCCccCCCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCC-CCcEEEEEEecEEEE
Q 048097           51 DPKLAKAEDFFLSGLDKPGNTENRLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHP-RATEILVVLEGTLYV  129 (224)
Q Consensus        51 ~p~~~~~~df~f~~~~~~~~~~~~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp-~a~Ei~~Vl~G~~~v  129 (224)
                      +.+.+++++.+.+.+..-.      +..++.....   . .+.++.+.+++++||+....|.|+ ...|++||++|++++
T Consensus        27 ~~a~~~p~~~v~~~lp~~~------~~~~~~L~~~---~-~~~~~~~~~~~l~PG~~~~~~~h~~~~eE~~~VlsG~l~v   96 (266)
T PRK11171         27 AYAVIPPDDIVTSVLPGWE------NTRAWVLARP---G-LGATFSQYLVEVEPGGGSDQPEPDEGAETFLFVVEGEITL   96 (266)
T ss_pred             CeEEECCcCEEeecCCCCC------CeEEEEEeCC---C-CCCcEEEEEEEECCCCcCCCCCCCCCceEEEEEEeCEEEE
Confidence            3455566666666553222      2334433332   1 144689999999999987777775 568999999999999


Q ss_pred             EEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEE
Q 048097          130 GFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGF  176 (224)
Q Consensus       130 ~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~  176 (224)
                      .+.      ++  +..|++||.++||++..|.+.|.|+++++++++.
T Consensus        97 ~~~------g~--~~~L~~GDsi~~p~~~~H~~~N~g~~~a~~l~v~  135 (266)
T PRK11171         97 TLE------GK--THALSEGGYAYLPPGSDWTLRNAGAEDARFHWIR  135 (266)
T ss_pred             EEC------CE--EEEECCCCEEEECCCCCEEEEECCCCCEEEEEEE
Confidence            864      33  5899999999999999999999999999998875


No 15 
>TIGR01479 GMP_PMI mannose-1-phosphate guanylyltransferase/mannose-6-phosphate isomerase. This enzyme is known to be bifunctional, as both mannose-6-phosphate isomerase (EC 5.3.1.8) (PMI) and mannose-1-phosphate guanylyltransferase (EC 2.7.7.22) in Pseudomonas aeruginosa, Xanthomonas campestris, and Gluconacetobacter xylinus. The literature on the enzyme from E. coli attributes mannose-6-phosphate isomerase activity to an adjacent gene, but the present sequence has not been shown to lack the activity. The PMI domain is C-terminal.
Probab=99.09  E-value=7.5e-10  Score=104.54  Aligned_cols=78  Identities=23%  Similarity=0.250  Sum_probs=70.3

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      ++.+.++.++||+..++|+|+...|.+||++|++++.+.      ++  ...|++||+++||+|.+|.+.|.|+++++++
T Consensus       375 ~~~~~~~~i~PG~~~~~h~H~~~~E~~~Vl~G~~~v~~d------g~--~~~l~~GDsi~ip~~~~H~~~N~g~~~~~~i  446 (468)
T TIGR01479       375 RYQVKRITVKPGEKLSLQMHHHRAEHWIVVSGTARVTIG------DE--TLLLTENESTYIPLGVIHRLENPGKIPLELI  446 (468)
T ss_pred             CEEEEEEEECCCCccCccccCCCceEEEEEeeEEEEEEC------CE--EEEecCCCEEEECCCCcEEEEcCCCCCEEEE
Confidence            688999999999999999998889999999999999864      33  4899999999999999999999999999999


Q ss_pred             EEEeCC
Q 048097          174 AGFSSQ  179 (224)
Q Consensus       174 ~~~~s~  179 (224)
                      ++...+
T Consensus       447 ~v~~~~  452 (468)
T TIGR01479       447 EVQSGS  452 (468)
T ss_pred             EEEcCC
Confidence            987633


No 16 
>PRK09943 DNA-binding transcriptional repressor PuuR; Provisional
Probab=99.08  E-value=1.2e-09  Score=90.82  Aligned_cols=76  Identities=18%  Similarity=0.194  Sum_probs=64.3

Q ss_pred             cceEEEEEEEcCCCcC-CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEE
Q 048097           93 LGTSAVRIDYAPYGQN-PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAV  171 (224)
Q Consensus        93 lgis~~~v~l~pgg~~-ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~  171 (224)
                      ..+.+.++.++||+.. +.|+|+ ..|++||++|++++.+.+      +  .+.|++||.++||.+.+|.+.|.|++++.
T Consensus       105 ~~~~~~~~~~~pg~~~~~~~~h~-~~E~~~Vl~G~~~~~~~~------~--~~~l~~Gd~~~~~~~~~H~~~n~~~~~~~  175 (185)
T PRK09943        105 RTLAMIFETYQPGTTTGERIKHQ-GEEIGTVLEGEIVLTING------Q--DYHLVAGQSYAINTGIPHSFSNTSAGICR  175 (185)
T ss_pred             CeeEEEEEEccCCCCcccccccC-CcEEEEEEEeEEEEEECC------E--EEEecCCCEEEEcCCCCeeeeCCCCCCeE
Confidence            3567778889999864 466776 699999999999998742      3  48999999999999999999999999999


Q ss_pred             EEEEEe
Q 048097          172 AFAGFS  177 (224)
Q Consensus       172 ~l~~~~  177 (224)
                      ++++..
T Consensus       176 ~l~~~~  181 (185)
T PRK09943        176 IISAHT  181 (185)
T ss_pred             EEEEeC
Confidence            988753


No 17 
>COG4101 Predicted mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=99.07  E-value=1.3e-09  Score=84.26  Aligned_cols=84  Identities=23%  Similarity=0.287  Sum_probs=74.5

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCee-EEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTL-IAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~-~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      +|.+-.++++||.....|.|.+.+-.+||++|+..+++.      +|+ +..++++||.|+||+|++|.-.|.+++++.+
T Consensus        45 ~i~~~~vTi~pgAkakaH~H~~hEtaIYvlsG~ah~w~G------~rLE~ha~~~pGDf~YiPpgVPHqp~N~S~ep~s~  118 (142)
T COG4101          45 GICMHLVTIPPGAKAKAHLHEEHETAIYVLSGEAHTWYG------NRLEEHAEVGPGDFFYIPPGVPHQPANLSTEPLSA  118 (142)
T ss_pred             eeeEEEEeeCCCccccccccccccEEEEEEeceeeeeec------cceeeeEEecCCCeEEcCCCCCCcccccCCCCeEE
Confidence            788999999999999999999888899999999999875      454 3568899999999999999999999999999


Q ss_pred             EEEEeCCCCce
Q 048097          173 FAGFSSQFPGV  183 (224)
Q Consensus       173 l~~~~s~~pg~  183 (224)
                      +.+.+..|+..
T Consensus       119 vIaRsDp~~~E  129 (142)
T COG4101         119 VIARSDPNPQE  129 (142)
T ss_pred             EEEccCCCCCc
Confidence            98887666653


No 18 
>PRK15460 cpsB mannose-1-phosphate guanyltransferase; Provisional
Probab=99.06  E-value=1.2e-09  Score=103.43  Aligned_cols=77  Identities=25%  Similarity=0.213  Sum_probs=69.4

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      .++.+.+++++||+....|+|...+|.+||++|++++.+.+      +  ++.|++||.++||+|.+|.+.|.|++++++
T Consensus       383 ~~~~v~~i~v~PG~~~~~~~H~~~~E~~~VlsG~~~v~idg------~--~~~L~~GDSi~ip~g~~H~~~N~g~~~l~i  454 (478)
T PRK15460        383 DRYQVKRITVKPGEGLSVQMHHHRAEHWVVVAGTAKVTIDG------D--IKLLGENESIYIPLGATHCLENPGKIPLDL  454 (478)
T ss_pred             CcEEEEEEEECCCCcCCcCCCCCCceEEEEEeeEEEEEECC------E--EEEecCCCEEEECCCCcEEEEcCCCCCEEE
Confidence            36889999999999888888877889999999999998753      3  589999999999999999999999999999


Q ss_pred             EEEEe
Q 048097          173 FAGFS  177 (224)
Q Consensus       173 l~~~~  177 (224)
                      +++..
T Consensus       455 I~V~~  459 (478)
T PRK15460        455 IEVRS  459 (478)
T ss_pred             EEEEc
Confidence            99864


No 19 
>PF01050 MannoseP_isomer:  Mannose-6-phosphate isomerase;  InterPro: IPR001538 Mannose-6-phosphate isomerase or phosphomannose isomerase (5.3.1.8 from EC) (PMI) is the enzyme that catalyses the interconversion of mannose-6-phosphate and fructose-6-phosphate. In eukaryotes PMI is involved in the synthesis of GDP-mannose, a constituent of N- and O-linked glycans and GPI anchors and in prokaryotes it participates in a variety of pathways, including capsular polysaccharide biosynthesis and D-mannose metabolism. PMI's belong to the cupin superfamily whose functions range from isomerase and epimerase activities involved in the modification of cell wall carbohydrates in bacteria and plants, to non-enzymatic storage proteins in plant seeds, and transcription factors linked to congenital baldness in mammals []. Three classes of PMI have been defined []. The type II phosphomannose isomerases are bifunctional enzymes 5.3.1.8 from EC. This entry covers the isomerase region of the protein []. The guanosine diphospho-D-mannose pyrophosphorylase region is described in another InterPro entry (see IPR005836 from INTERPRO).; GO: 0016779 nucleotidyltransferase activity, 0005976 polysaccharide metabolic process
Probab=98.99  E-value=3.7e-09  Score=85.79  Aligned_cols=77  Identities=26%  Similarity=0.237  Sum_probs=69.8

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      -+..+-++.+.||..+..|.|...+|..+|++|++.+.+.      ++  .+.+++||.+++|+|..|.+.|.|..++.+
T Consensus        61 ~~~~vkri~V~pG~~lSlq~H~~R~E~W~Vv~G~a~v~~~------~~--~~~~~~g~sv~Ip~g~~H~i~n~g~~~L~~  132 (151)
T PF01050_consen   61 EGYKVKRITVNPGKRLSLQYHHHRSEHWTVVSGTAEVTLD------DE--EFTLKEGDSVYIPRGAKHRIENPGKTPLEI  132 (151)
T ss_pred             CCEEEEEEEEcCCCccceeeecccccEEEEEeCeEEEEEC------CE--EEEEcCCCEEEECCCCEEEEECCCCcCcEE
Confidence            3678899999999999999999999999999999999874      33  489999999999999999999999999999


Q ss_pred             EEEEe
Q 048097          173 FAGFS  177 (224)
Q Consensus       173 l~~~~  177 (224)
                      +-+-.
T Consensus       133 IEVq~  137 (151)
T PF01050_consen  133 IEVQT  137 (151)
T ss_pred             EEEec
Confidence            97754


No 20 
>TIGR03214 ura-cupin putative allantoin catabolism protein. This model represents a protein containing a tandem arrangement of cupin domains (N-terminal part of pfam07883 and C-terminal more distantly related to pfam00190). This protein is found in the vicinity of genes involved in the catabolism of allantoin, a breakdown product of urate and sometimes of urate iteslf. The distribution of pathway components in the genomes in which this family is observed suggests that the function is linked to the allantoate catabolism to glyoxylate pathway (GenProp0686) since it is sometimes found in genomes lacking any elements of the xanthine-to-allantoin pathways (e.g. in Enterococcus faecalis).
Probab=98.98  E-value=4.4e-09  Score=92.33  Aligned_cols=73  Identities=15%  Similarity=0.048  Sum_probs=62.9

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      ++.+.+++++||+.++.|.|..-+|.+|||+|++.+.+.      ++  ...+++||++++|++.+|+++|.|++++++|
T Consensus       178 ~~~~~~~~~~PG~~~~~~~~H~~eh~~yiL~G~G~~~~~------g~--~~~V~~GD~i~i~~~~~h~~~~~G~~~~~~l  249 (260)
T TIGR03214       178 DMNVHILSFEPGASHPYIETHVMEHGLYVLEGKGVYNLD------NN--WVPVEAGDYIWMGAYCPQACYAGGRGEFRYL  249 (260)
T ss_pred             CcEEEEEEECCCcccCCcccccceeEEEEEeceEEEEEC------CE--EEEecCCCEEEECCCCCEEEEecCCCcEEEE
Confidence            678888999999999964443468899999999999764      33  5899999999999999999999999999887


Q ss_pred             E
Q 048097          174 A  174 (224)
Q Consensus       174 ~  174 (224)
                      .
T Consensus       250 ~  250 (260)
T TIGR03214       250 L  250 (260)
T ss_pred             E
Confidence            4


No 21 
>TIGR03214 ura-cupin putative allantoin catabolism protein. This model represents a protein containing a tandem arrangement of cupin domains (N-terminal part of pfam07883 and C-terminal more distantly related to pfam00190). This protein is found in the vicinity of genes involved in the catabolism of allantoin, a breakdown product of urate and sometimes of urate iteslf. The distribution of pathway components in the genomes in which this family is observed suggests that the function is linked to the allantoate catabolism to glyoxylate pathway (GenProp0686) since it is sometimes found in genomes lacking any elements of the xanthine-to-allantoin pathways (e.g. in Enterococcus faecalis).
Probab=98.93  E-value=9.2e-09  Score=90.30  Aligned_cols=75  Identities=19%  Similarity=0.134  Sum_probs=64.7

Q ss_pred             ceEEEEEEEcCCCcC-CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           94 GTSAVRIDYAPYGQN-PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        94 gis~~~v~l~pgg~~-ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      .+.+.+++++||+-. .+|.|+...|++||++|++++.+.      ++  ++.|++||.+++|+|..|.+.|.+++++++
T Consensus        57 ~f~~~~v~l~pgg~~~~~~~~~g~ee~iyVl~G~l~v~~~------g~--~~~L~~Gd~~y~pa~~~H~~~N~~~~~a~~  128 (260)
T TIGR03214        57 TFVQYIVEVHPGGGNTTGFGGEGIETFLFVISGEVNVTAE------GE--THELREGGYAYLPPGSKWTLANAQAEDARF  128 (260)
T ss_pred             cEEEEEEEECCCCcCCCCCCCCceEEEEEEEeCEEEEEEC------CE--EEEECCCCEEEECCCCCEEEEECCCCCEEE
Confidence            589999999998754 566677668999999999999864      23  479999999999999999999999999999


Q ss_pred             EEEE
Q 048097          173 FAGF  176 (224)
Q Consensus       173 l~~~  176 (224)
                      +++-
T Consensus       129 l~v~  132 (260)
T TIGR03214       129 FLYK  132 (260)
T ss_pred             EEEE
Confidence            8765


No 22 
>PRK11171 hypothetical protein; Provisional
Probab=98.89  E-value=9.8e-09  Score=90.38  Aligned_cols=73  Identities=18%  Similarity=0.036  Sum_probs=63.9

Q ss_pred             ceEEEEEEEcCCCcCCCc-cCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           94 GTSAVRIDYAPYGQNPPH-THPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH-~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      ++.+.+++++||+.++.| .| ...|.+||++|++++.+.      ++  ++.|++||+++||.+..|++.|.|++++++
T Consensus       183 ~~~~~~~~l~PG~~~~~~~~~-~~ee~i~Vl~G~~~~~~~------~~--~~~l~~GD~i~~~~~~~h~~~N~g~~~~~y  253 (266)
T PRK11171        183 DMHVNIVTFEPGASIPFVETH-VMEHGLYVLEGKGVYRLN------ND--WVEVEAGDFIWMRAYCPQACYAGGPGPFRY  253 (266)
T ss_pred             CcEEEEEEECCCCEEccCcCC-CceEEEEEEeCEEEEEEC------CE--EEEeCCCCEEEECCCCCEEEECCCCCcEEE
Confidence            468999999999998885 55 578999999999999864      33  589999999999999999999999999988


Q ss_pred             EEE
Q 048097          173 FAG  175 (224)
Q Consensus       173 l~~  175 (224)
                      +..
T Consensus       254 l~~  256 (266)
T PRK11171        254 LLY  256 (266)
T ss_pred             EEE
Confidence            853


No 23 
>PF02041 Auxin_BP:  Auxin binding protein;  InterPro: IPR000526 Auxin binding protein is located in the lumen of the endoplasmic reticulum (ER). The primary structure contains an N-terminal hydrophobic leader sequence of 30-40 amino acids, which could represent a signal for translocation of the protein to the ER [, ]. The mature protein comprises around 165 residues, and contains a number of potential N-glycosylation sites. In vitro transport studies have demonstrated co-translational glycosylation []. Retention within the lumen of the ER correlates with an additional signal located at the C terminus, represented by the sequence Lys-Asp-Glu-Leu, known to be responsible for preventing secretion of proteins from the lumen of the ER in eukaryotic cells [, ].; GO: 0004872 receptor activity, 0005788 endoplasmic reticulum lumen; PDB: 1LR5_D 1LRH_D.
Probab=98.73  E-value=1.7e-07  Score=75.26  Aligned_cols=100  Identities=19%  Similarity=0.211  Sum_probs=60.2

Q ss_pred             cCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCC-CCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097           87 IPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQL-NNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus        87 ~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~-~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                      .-|++  .+.+.+-+++||...|+|-|. .+|+++|++|+++..+...... .++-.++.+-+++.|.||.+..|...|+
T Consensus        38 ~hGmk--evEVwlQTfAPG~~TPiHRHs-CEEVFvVLkG~GTl~l~~~~~~~pG~pqef~~~pnSTf~IPvn~~HQv~NT  114 (167)
T PF02041_consen   38 LHGMK--EVEVWLQTFAPGSATPIHRHS-CEEVFVVLKGSGTLYLASSHEKYPGKPQEFPIFPNSTFHIPVNDAHQVWNT  114 (167)
T ss_dssp             HH--S--SEEEEEEEE-TT-B--EEEES-S-EEEEEEE--EEEEE--SSSSS--S-EEEEE-TTEEEEE-TT--EEEE--
T ss_pred             hcCce--eeeEEeeeecCCCCCCCcccc-ccEEEEEEecceEEEEecccccCCCCceEEEecCCCeEEeCCCCcceeecC
Confidence            34555  578899999999999999996 8999999999999988754310 1334468899999999999999999999


Q ss_pred             C-CCcEEEEEEEeCCCCceeechhh
Q 048097          166 G-KTSAVAFAGFSSQFPGVITIADT  189 (224)
Q Consensus       166 G-~~~a~~l~~~~s~~pg~~~~~~~  189 (224)
                      + .+++.++++++..--..+.+.+|
T Consensus       115 ~e~eDlqvlViiSrpPvkvf~y~dw  139 (167)
T PF02041_consen  115 NEHEDLQVLVIISRPPVKVFIYDDW  139 (167)
T ss_dssp             -SSS-EEEEEEEESSS--EEEESST
T ss_pred             CCCcceEEEEEecCCCeEEEEeccc
Confidence            9 58898887775444445555665


No 24 
>PF06560 GPI:  Glucose-6-phosphate isomerase (GPI);  InterPro: IPR010551 This entry consists of several bacterial and archaeal glucose-6-phosphate isomerase (GPI) proteins (5.3.1.9 from EC), which are involved in glycolysis and in gluconeogenesis and catalyse the conversion of D-glucose 6-phosphate to D-fructose 6-phosphate. The deduced amino acid sequence of the first archaeal PGI isolated from Pyrococcus furiosus revealed that it is not related to its eukaryotic and many of its bacterial counterparts. In contrast, this archaeal PGI shares similarity with the cupin superfamily that consists of a variety of proteins that are generally involved in sugar metabolism in both prokaryotes and eukaryotes [].; GO: 0004347 glucose-6-phosphate isomerase activity, 0006094 gluconeogenesis, 0006096 glycolysis, 0005737 cytoplasm; PDB: 1J3Q_B 1J3R_B 1J3P_A 2GC0_A 1X8E_A 1X82_A 1QY4_B 2GC2_B 1QXJ_A 1QXR_B ....
Probab=98.69  E-value=2.5e-07  Score=77.22  Aligned_cols=86  Identities=24%  Similarity=0.232  Sum_probs=56.8

Q ss_pred             ccccceEEEEEEEcCCCc------CCCccCCC------CcEEEEEEecEEEEEEEeCCCCCC----eeEEEEecCCCEEE
Q 048097           90 LNTLGTSAVRIDYAPYGQ------NPPHTHPR------ATEILVVLEGTLYVGFVTSNQLNN----TLIAKVLNKGDVFV  153 (224)
Q Consensus        90 L~~lgis~~~v~l~pgg~------~ppH~Hp~------a~Ei~~Vl~G~~~v~~v~~~~~~~----k~~~~~l~~GDv~v  153 (224)
                      |...++......+.||-+      ..=|+|+.      ..|+.+|++|++.+-+-+.+   +    +.+...+++||+++
T Consensus        45 ~~~~~L~ygiTvi~Pg~vG~E~~~T~GH~H~~~~~~~~~pEvY~vl~G~g~~lLq~~~---~~~~~~~~~v~~~~G~~v~  121 (182)
T PF06560_consen   45 LQKRNLRYGITVIPPGKVGGEYFMTKGHYHPISPCGLSYPEVYEVLSGEGLILLQKEE---GDDVGDVIAVEAKPGDVVY  121 (182)
T ss_dssp             -----EEEEEEEE---EETTEE-B---BB-SS----TT--EEEEEEESSEEEEEE-TT---S-----EEEEEE-TTEEEE
T ss_pred             ceeeeEEeeeEEEcCcccCCccccCCCccCCccccCCCCCcEEEEEeCEEEEEEEecC---CCcceeEEEEEeCCCCEEE
Confidence            344467788888888754      35699998      78999999999999888765   4    56778999999999


Q ss_pred             EcCCCeeEEEeCCCCcEEEEEEEeC
Q 048097          154 FPIGLIHFQVNIGKTSAVAFAGFSS  178 (224)
Q Consensus       154 ~P~G~~H~~~N~G~~~a~~l~~~~s  178 (224)
                      ||++..|...|+|++++++.....+
T Consensus       122 IPp~yaH~tIN~g~~~L~~~~~~~~  146 (182)
T PF06560_consen  122 IPPGYAHRTINTGDEPLVFAAWVPR  146 (182)
T ss_dssp             E-TT-EEEEEE-SSS-EEEEEEEET
T ss_pred             ECCCceEEEEECCCCcEEEEEEEec
Confidence            9999999999999999988877753


No 25 
>PRK13264 3-hydroxyanthranilate 3,4-dioxygenase; Provisional
Probab=98.51  E-value=7.7e-07  Score=73.75  Aligned_cols=66  Identities=18%  Similarity=0.350  Sum_probs=53.3

Q ss_pred             cCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEE
Q 048097          103 APYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAG  175 (224)
Q Consensus       103 ~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~  175 (224)
                      .||.....|+|+ ..|++|+++|++++.+.+.    ++.....|++||++++|+|..|.....  +..+.+.+
T Consensus        42 Gpn~r~d~H~~~-tdE~FyqleG~~~l~v~d~----g~~~~v~L~eGd~fllP~gvpHsP~r~--~~tv~Lvi  107 (177)
T PRK13264         42 GPNARTDFHYDP-GEEFFYQLEGDMYLKVQED----GKRRDVPIREGEMFLLPPHVPHSPQRE--AGSIGLVI  107 (177)
T ss_pred             cCCcccccccCC-CceEEEEECCeEEEEEEcC----CceeeEEECCCCEEEeCCCCCcCCccC--CCeEEEEE
Confidence            667778889998 6999999999999999874    444468999999999999999998653  44444443


No 26 
>PF11699 CENP-C_C:  Mif2/CENP-C like; PDB: 2VPV_B.
Probab=98.49  E-value=8.8e-07  Score=65.25  Aligned_cols=74  Identities=27%  Similarity=0.353  Sum_probs=55.1

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .++...++|+||+.-++----+..-++||++|.+++++.+      .  +..+++||++.+|+|-.-.+.|.++++|+++
T Consensus        11 ~fa~G~l~Lpp~~~K~~k~s~~~~~vF~V~~G~v~Vti~~------~--~f~v~~G~~F~VP~gN~Y~i~N~~~~~a~Lf   82 (85)
T PF11699_consen   11 FFASGMLELPPGGEKPPKNSRDNTMVFYVIKGKVEVTIHE------T--SFVVTKGGSFQVPRGNYYSIKNIGNEEAKLF   82 (85)
T ss_dssp             S-EEEEEEE-TCCCEEEEE--SEEEEEEEEESEEEEEETT------E--EEEEETT-EEEE-TT-EEEEEE-SSS-EEEE
T ss_pred             CceeEEEEeCCCCccCCcccCCcEEEEEEEeCEEEEEEcC------c--EEEEeCCCEEEECCCCEEEEEECCCCcEEEE
Confidence            4688899999999865543335789999999999999853      2  4899999999999999999999999999887


Q ss_pred             EE
Q 048097          174 AG  175 (224)
Q Consensus       174 ~~  175 (224)
                      -+
T Consensus        83 F~   84 (85)
T PF11699_consen   83 FV   84 (85)
T ss_dssp             EE
T ss_pred             Ee
Confidence            43


No 27 
>TIGR03037 anthran_nbaC 3-hydroxyanthranilate 3,4-dioxygenase. Members of this protein family, from both bacteria and eukaryotes, are the enzyme 3-hydroxyanthranilate 3,4-dioxygenase. This enzyme acts on the tryptophan metabolite 3-hydroxyanthranilate and produces 2-amino-3-carboxymuconate semialdehyde, which can rearrange spontaneously to quinolinic acid and feed into nicotinamide biosynthesis, or undergo further enzymatic degradation.
Probab=98.45  E-value=1.7e-06  Score=70.68  Aligned_cols=66  Identities=18%  Similarity=0.369  Sum_probs=51.2

Q ss_pred             cCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEE
Q 048097          103 APYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAG  175 (224)
Q Consensus       103 ~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~  175 (224)
                      .||.....|.|+ ..|++|+++|++.+.+.+.    ++.....|++||++++|+|..|...-.+  ..+.+.+
T Consensus        36 Gpn~R~d~H~~~-tdE~FyqleG~~~l~v~d~----g~~~~v~L~eGd~flvP~gvpHsP~r~~--~t~~LvI  101 (159)
T TIGR03037        36 GPNARTDFHDDP-GEEFFYQLKGEMYLKVTEE----GKREDVPIREGDIFLLPPHVPHSPQRPA--GSIGLVI  101 (159)
T ss_pred             CCCCCcccccCC-CceEEEEEcceEEEEEEcC----CcEEEEEECCCCEEEeCCCCCcccccCC--CcEEEEE
Confidence            455556789887 7999999999999998764    3444689999999999999999987643  3444433


No 28 
>TIGR02451 anti_sig_ChrR anti-sigma factor, putative, ChrR family. The member of this family from Rhodobacter sphaeroides has been shown both to form a complex with sigma(E) and to negatively regulate tetrapyrrole biosynthesis. This protein likely contains (at least) two distinct functional domains; several smaller homologs (excluded by the model) show homology only to the C-terminal, including a motif PxHxHxGxE.
Probab=98.36  E-value=1.9e-06  Score=73.73  Aligned_cols=72  Identities=18%  Similarity=0.191  Sum_probs=62.1

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      ..+..++++||+.+|.|.|. +.|+++||+|+..    ++.        ..+.+||++..|.|..|...+.++++.++++
T Consensus       127 ~~v~Ll~i~pG~~~p~H~H~-G~E~tlVLeG~f~----de~--------g~y~~Gd~i~~p~~~~H~p~a~~~~~Cicl~  193 (215)
T TIGR02451       127 ARVRLLYIEAGQSIPQHTHK-GFELTLVLHGAFS----DET--------GVYGVGDFEEADGSVQHQPRTVSGGDCLCLA  193 (215)
T ss_pred             cEEEEEEECCCCccCCCcCC-CcEEEEEEEEEEE----cCC--------CccCCCeEEECCCCCCcCcccCCCCCeEEEE
Confidence            46778899999999999995 7899999999953    332        4689999999999999999999889999998


Q ss_pred             EEeCC
Q 048097          175 GFSSQ  179 (224)
Q Consensus       175 ~~~s~  179 (224)
                      +.+.+
T Consensus       194 v~dap  198 (215)
T TIGR02451       194 VLDAP  198 (215)
T ss_pred             EecCC
Confidence            87644


No 29 
>PF12973 Cupin_7:  ChrR Cupin-like domain; PDB: 3O14_B 2Z2S_F 2Q1Z_B 3EBR_A.
Probab=98.35  E-value=1.7e-06  Score=63.89  Aligned_cols=66  Identities=26%  Similarity=0.403  Sum_probs=51.4

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      |-.+..++++||+..|.|.|+ +.|.+|||+|++..    .    +    ..+.+||.++.|+|..|...-  .+.+.++
T Consensus        23 g~~~~L~r~~pG~~~p~H~H~-g~ee~~VLeG~~~d----~----~----~~~~~G~~~~~p~g~~h~~~s--~~gc~~~   87 (91)
T PF12973_consen   23 GERVSLLRLEPGASLPRHRHP-GGEEILVLEGELSD----G----D----GRYGAGDWLRLPPGSSHTPRS--DEGCLIL   87 (91)
T ss_dssp             TEEEEEEEE-TTEEEEEEEES-S-EEEEEEECEEEE----T----T----CEEETTEEEEE-TTEEEEEEE--SSCEEEE
T ss_pred             cCEEEEEEECCCCCcCccCCC-CcEEEEEEEEEEEE----C----C----ccCCCCeEEEeCCCCccccCc--CCCEEEE
Confidence            568888999999999999998 57888999999964    2    2    356999999999999999883  4556655


Q ss_pred             E
Q 048097          174 A  174 (224)
Q Consensus       174 ~  174 (224)
                      .
T Consensus        88 v   88 (91)
T PF12973_consen   88 V   88 (91)
T ss_dssp             E
T ss_pred             E
Confidence            3


No 30 
>PF02311 AraC_binding:  AraC-like ligand binding domain;  InterPro: IPR003313 This entry defines the arabinose-binding and dimerisation domain of the bacterial gene regulatory protein AraC. The crystal structure of the arabinose-binding and dimerization domain of the Escherichia coli gene regulatory protein AraC was determined in the presence and absence of L-arabinose. The arabinose-bound molecule shows that the protein adopts an unusual fold, binding sugar within a beta barrel and completely burying the arabinose with the amino-terminal arm of the protein. Dimer contacts in the presence of arabinose are mediated by an antiparallel coiled-coil. In the uncomplexed protein, the amino-terminal arm is disordered, uncovering the sugar-binding pocket and allowing it to serve as an oligomerization interface [].; GO: 0006355 regulation of transcription, DNA-dependent; PDB: 1XJA_B 2ARA_A 2AAC_B 2ARC_A.
Probab=98.30  E-value=3.1e-06  Score=64.38  Aligned_cols=64  Identities=27%  Similarity=0.296  Sum_probs=45.1

Q ss_pred             CCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEE
Q 048097          104 PYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGF  176 (224)
Q Consensus       104 pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~  176 (224)
                      ++-..++|+|+ .-|+.||++|++++.+.      ++  .+.+++||++++|+|.+|.....++++...+.+.
T Consensus        12 ~~~~~~~h~h~-~~~i~~v~~G~~~~~~~------~~--~~~l~~g~~~li~p~~~H~~~~~~~~~~~~~~i~   75 (136)
T PF02311_consen   12 PNFEFPPHWHD-FYEIIYVLSGEGTLHID------GQ--EYPLKPGDLFLIPPGQPHSYYPDSNEPWEYYWIY   75 (136)
T ss_dssp             TT-SEEEETT--SEEEEEEEEE-EEEEET------TE--EEEE-TT-EEEE-TTS-EEEEE-TTSEEEEEEEE
T ss_pred             CCCccCCEECC-CEEEEEEeCCEEEEEEC------CE--EEEEECCEEEEecCCccEEEecCCCCCEEEEEEE
Confidence            44456899997 69999999999999764      33  5899999999999999999988877666655443


No 31 
>PF03079 ARD:  ARD/ARD' family;  InterPro: IPR004313 The two acireductone dioxygenase enzymes (ARD and ARD', previously known as E-2 and E-2') from Klebsiella pneumoniae share the same amino acid sequence Q9ZFE7 from SWISSPROT, but bind different metal ions: ARD binds Ni2+, ARD' binds Fe2+ []. ARD and ARD' can be experimentally interconverted by removal of the bound metal ion and reconstitution with the appropriate metal ion. The two enzymes share the same substrate, 1,2-dihydroxy-3-keto-5-(methylthio)pentene, but yield different products. ARD' yields the alpha-keto precursor of methionine (and formate), thus forming part of the ubiquitous methionine salvage pathway that converts 5'-methylthioadenosine (MTA) to methionine. This pathway is responsible for the tight control of the concentration of MTA, which is a powerful inhibitor of polyamine biosynthesis and transmethylation reactions []. ARD yields methylthiopropanoate, carbon monoxide and formate, and thus prevents the conversion of MTA to methionine. The role of the ARD catalysed reaction is unclear: methylthiopropanoate is cytotoxic, and carbon monoxide can activate guanylyl cyclase, leading to increased intracellular cGMP levels [, ].  This family also contains other proteins, whose functions are not well characterised.; GO: 0010309 acireductone dioxygenase [iron(II)-requiring] activity, 0055114 oxidation-reduction process; PDB: 1VR3_A 1ZRR_A 2HJI_A.
Probab=98.23  E-value=1.3e-05  Score=65.50  Aligned_cols=71  Identities=25%  Similarity=0.334  Sum_probs=50.3

Q ss_pred             cCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCc
Q 048097          107 QNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPG  182 (224)
Q Consensus       107 ~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg  182 (224)
                      ....|.|. ..|+-|+++|++.+.+...+   ++.....+++||++++|+|+.||+.-......+++=.| ...||
T Consensus        84 f~~EH~H~-deEvR~i~~G~g~Fdvr~~~---~~wiri~~e~GDli~vP~g~~HrF~~~~~~~i~aiRlF-~~~~g  154 (157)
T PF03079_consen   84 FFEEHTHE-DEEVRYIVDGSGYFDVRDGD---DVWIRILCEKGDLIVVPAGTYHRFTLGESPYIKAIRLF-KDEPG  154 (157)
T ss_dssp             HCS-EEES-S-EEEEEEECEEEEEEE-TT---CEEEEEEEETTCEEEE-TT--EEEEESTTSSEEEEEEE-SSCGG
T ss_pred             hheeEecC-hheEEEEeCcEEEEEEEcCC---CEEEEEEEcCCCEEecCCCCceeEEcCCCCcEEEEEee-cCCCC
Confidence            34789997 59999999999999998765   56556789999999999999999975444456666445 44454


No 32 
>PRK15457 ethanolamine utilization protein EutQ; Provisional
Probab=98.17  E-value=1.4e-05  Score=68.69  Aligned_cols=69  Identities=22%  Similarity=0.087  Sum_probs=49.0

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      ++.....++. +  ..+||-+..|+.||++|++++.+.      ++  ++.+++||+++||+|..|.+...+  .++++.
T Consensus       157 m~aGf~~~~~-~--sf~wtl~~dEi~YVLEGe~~l~Id------G~--t~~l~pGDvlfIPkGs~~hf~tp~--~aRfly  223 (233)
T PRK15457        157 MAAGFMQWEN-A--FFPWTLNYDEIDMVLEGELHVRHE------GE--TMIAKAGDVMFIPKGSSIEFGTPS--SVRFLY  223 (233)
T ss_pred             eeeEEEEEec-C--ccceeccceEEEEEEEeEEEEEEC------CE--EEEeCCCcEEEECCCCeEEecCCC--CeeEEE
Confidence            4444444543 2  344777789999999999999874      33  589999999999999995554443  555554


Q ss_pred             EE
Q 048097          175 GF  176 (224)
Q Consensus       175 ~~  176 (224)
                      +.
T Consensus       224 V~  225 (233)
T PRK15457        224 VA  225 (233)
T ss_pred             EE
Confidence            44


No 33 
>PRK10371 DNA-binding transcriptional regulator MelR; Provisional
Probab=98.04  E-value=2.3e-05  Score=69.96  Aligned_cols=59  Identities=20%  Similarity=0.163  Sum_probs=48.5

Q ss_pred             EEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          100 IDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      ..-.|..+.++|||. .-|++|+++|++.+.+.      ++  ...+++||+++++.|.+|.....++
T Consensus        31 ~~~~~~~m~~~HwH~-e~Ei~yv~~G~~~~~i~------g~--~~~l~~Gd~ili~s~~~H~~~~~~~   89 (302)
T PRK10371         31 EFRPPHIMPTSHWHG-QVEVNVPFDGDVEYLIN------NE--KVQINQGHITLFWACTPHQLTDPGN   89 (302)
T ss_pred             EeeCCCCCCCCCccc-cEEEEEecCCcEEEEEC------CE--EEEEcCCcEEEEecCCcccccccCC
Confidence            345667789999997 58999999999988753      34  5889999999999999998765444


No 34 
>TIGR02272 gentisate_1_2 gentisate 1,2-dioxygenase. This family consists of gentisate 1,2-dioxygenases. This ring-opening enzyme acts in salicylate degradation that goes via gentisate rather than via catechol. It converts gentisate to maleylpyruvate. Some putative gentisate 1,2-dioxygenases are excluded by a relatively high trusted cutoff score because they are too closely related to known examples of 1-hydroxy-2-naphthoate dioxygenase. Therefore some homologs may be bona fide gentisate 1,2-dioxygenases even if they score below the given cutoffs.
Probab=98.04  E-value=1.2e-05  Score=72.98  Aligned_cols=76  Identities=20%  Similarity=0.224  Sum_probs=63.8

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .|.+..-.+.||...++|-|. +.-+.+|++|++....++.     +  +..+++||+|+.|.+..|...|.|+++++.+
T Consensus        80 tl~a~~q~l~pGe~~~~HRht-~sAl~~vveG~G~~t~V~g-----~--~~~~~~gD~~~tP~w~wH~H~n~~d~~~~wl  151 (335)
T TIGR02272        80 SLYAGLQLILPGEVAPSHRHT-QSALRFIVEGKGAFTAVDG-----E--RTTMHPGDFIITPSWTWHDHGNPGDEPMIWL  151 (335)
T ss_pred             hHHhhhEEeCCCCCCCccccc-cceEEEEEEcCceEEEECC-----E--EEeeeCCCEEEeCCCeeEecccCCCCcEEEE
Confidence            455666778999999999997 7899999999996556643     3  4899999999999999999999999997776


Q ss_pred             EEEe
Q 048097          174 AGFS  177 (224)
Q Consensus       174 ~~~~  177 (224)
                      .+++
T Consensus       152 d~lD  155 (335)
T TIGR02272       152 DGLD  155 (335)
T ss_pred             ecCC
Confidence            6654


No 35 
>COG1791 Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=98.01  E-value=5.9e-05  Score=61.97  Aligned_cols=73  Identities=19%  Similarity=0.278  Sum_probs=59.8

Q ss_pred             CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCceeec
Q 048097          109 PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVITI  186 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~~~  186 (224)
                      .-|.|. ..|+-|++.|.+.+.+...+   ++.+...+.+||.+.+|+|.-||+--..+...+++=.| ...+|.+.+
T Consensus        89 ~EH~H~-d~EvRy~vaG~GiF~v~~~d---~~~~~i~c~~gDLI~vP~gi~HwFtlt~~~~f~AvRlF-~~~~gWVa~  161 (181)
T COG1791          89 QEHLHT-DDEVRYFVAGEGIFDVHSPD---GKVYQIRCEKGDLISVPPGIYHWFTLTESPNFKAVRLF-TEPEGWVAI  161 (181)
T ss_pred             HHhccC-CceEEEEEecceEEEEECCC---CcEEEEEEccCCEEecCCCceEEEEccCCCcEEEEEEe-eCCCCceee
Confidence            569996 69999999999999999876   78899999999999999999999965545556666545 466777643


No 36 
>PRK10296 DNA-binding transcriptional regulator ChbR; Provisional
Probab=97.92  E-value=8.5e-05  Score=64.81  Aligned_cols=52  Identities=25%  Similarity=0.360  Sum_probs=43.3

Q ss_pred             CCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097          105 YGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus       105 gg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                      +...++|||. ..|++||++|++++.+.      ++  ...+.+||++++|+|..|.....
T Consensus        33 ~~~~~~H~H~-~~ei~~v~~G~~~~~i~------~~--~~~l~~g~l~~i~p~~~H~~~~~   84 (278)
T PRK10296         33 ESVSGLHQHD-YYEFTLVLTGRYYQEIN------GK--RVLLERGDFVFIPLGSHHQSFYE   84 (278)
T ss_pred             hcCCCCcccc-cEEEEEEEeceEEEEEC------CE--EEEECCCcEEEeCCCCccceeee
Confidence            3456899996 78999999999998763      33  47999999999999999976543


No 37 
>PF05523 FdtA:  WxcM-like, C-terminal ;  InterPro: IPR008894  This entry includes FdtA (Q6T1W8 from SWISSPROT) from Aneurinibacillus thermoaerophilus, which has been characterised as a dTDP-6-deoxy-3,4-keto-hexulose isomerase []. It also includes WxcM (Q93S92 from SWISSPROT) from Xanthomonas campestris pv campestris) []. ; PDB: 2PAK_A 2PAE_A 2PA7_B 2PAM_A.
Probab=97.90  E-value=0.0001  Score=58.38  Aligned_cols=78  Identities=22%  Similarity=0.280  Sum_probs=46.9

Q ss_pred             EEEEEEEcCCC-cCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCC-CEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           96 SAVRIDYAPYG-QNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKG-DVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        96 s~~~v~l~pgg-~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~G-Dv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .+..+.-.|+| ....|.|...+|+++|++|+..+.+.+..   .+ ....|... ..+.+|+|..|.+.|.+.+ ++++
T Consensus        33 rvy~i~~~~~~~~RG~H~Hk~~~~~~~~l~Gs~~v~~~d~~---~~-~~~~L~~~~~~L~Ippg~w~~~~~~s~~-svlL  107 (131)
T PF05523_consen   33 RVYYIYNVPPGVIRGWHAHKKTTQWFIVLSGSFKVVLDDGR---EE-EEFILDEPNKGLYIPPGVWHGIKNFSED-SVLL  107 (131)
T ss_dssp             EEEEEES--SS--EEEEEESS--EEEEEEES-EEEEEE-SS----E-EEEEE--TTEEEEE-TT-EEEEE---TT--EEE
T ss_pred             EEEEEEcCCCCCcccccccccccEEEEEEeCEEEEEEecCC---Cc-EEEEECCCCeEEEECCchhhHhhccCCC-cEEE
Confidence            33444334445 58999999999999999999999987643   22 45677554 5999999999999999887 6666


Q ss_pred             EEEeCC
Q 048097          174 AGFSSQ  179 (224)
Q Consensus       174 ~~~~s~  179 (224)
                       ++.+.
T Consensus       108 -v~as~  112 (131)
T PF05523_consen  108 -VLASE  112 (131)
T ss_dssp             -EEESS
T ss_pred             -EEcCC
Confidence             46554


No 38 
>COG4297 Uncharacterized protein containing double-stranded beta helix domain [Function unknown]
Probab=97.79  E-value=4.7e-05  Score=60.56  Aligned_cols=66  Identities=23%  Similarity=0.320  Sum_probs=51.2

Q ss_pred             CCcC-CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEE
Q 048097          105 YGQN-PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGF  176 (224)
Q Consensus       105 gg~~-ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~  176 (224)
                      |++. --|||..+.|++.|++|+..+.+...+   +.  ...+++||++++|+|.-|.-. ...-+..++.++
T Consensus        52 g~Vf~yHHYHs~aHEVl~vlrgqA~l~iGG~~---G~--el~v~~GDvlliPAGvGH~rl-~sS~DF~VvGaY  118 (163)
T COG4297          52 GGVFNYHHYHSGAHEVLGVLRGQAGLQIGGAD---GQ--ELEVGEGDVLLIPAGVGHCRL-HSSADFQVVGAY  118 (163)
T ss_pred             ccccccccccCCcceEEEEecceeEEEecCCC---Cc--eeeecCCCEEEEecCcccccc-cCCCCeEEEccc
Confidence            4543 457999999999999999999988776   44  478999999999999999763 344445555444


No 39 
>COG3435 Gentisate 1,2-dioxygenase [Secondary metabolites biosynthesis, transport, and catabolism]
Probab=97.79  E-value=4e-05  Score=68.19  Aligned_cols=92  Identities=22%  Similarity=0.220  Sum_probs=76.8

Q ss_pred             EEEccccccCcccccc-----eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEE
Q 048097           79 VTNANVEQIPGLNTLG-----TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFV  153 (224)
Q Consensus        79 v~~~~~~~~p~L~~lg-----is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v  153 (224)
                      ++.+-.-+.|+|++..     +-+..--+.||.+.|.|.|. .+-+-||++|++-.+.++.    .|   ..+++||.++
T Consensus        71 ~RRvi~L~NP~l~g~ssiT~TLyAglQlilPGEvApsHrHs-qsAlRFvveG~Ga~T~VdG----er---~~M~~GDfil  142 (351)
T COG3435          71 VRRVIYLENPGLRGRSSITPTLYAGLQLILPGEVAPSHRHN-QSALRFVVEGKGAYTVVDG----ER---TPMEAGDFIL  142 (351)
T ss_pred             eeEEEEecCCCCCCcccccHHHHhhhheecCcccCCccccc-ccceEEEEeccceeEeecC----ce---eeccCCCEEE
Confidence            6777777889888773     22334467899999999996 6899999999998888864    33   7899999999


Q ss_pred             EcCCCeeEEEeCCCCcEEEEEEEeC
Q 048097          154 FPIGLIHFQVNIGKTSAVAFAGFSS  178 (224)
Q Consensus       154 ~P~G~~H~~~N~G~~~a~~l~~~~s  178 (224)
                      -|++..|..-|.|.+|.+.+-.++.
T Consensus       143 TP~w~wHdHgn~g~eP~iWlDgLDi  167 (351)
T COG3435         143 TPAWTWHDHGNEGTEPCIWLDGLDI  167 (351)
T ss_pred             ccCceeccCCCCCCCceEEEcccch
Confidence            9999999999999999999887753


No 40 
>PRK13500 transcriptional activator RhaR; Provisional
Probab=97.79  E-value=9.3e-05  Score=66.18  Aligned_cols=55  Identities=20%  Similarity=0.271  Sum_probs=45.4

Q ss_pred             CCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          104 PYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       104 pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      |....++|||+ .-|++||++|++...+.+      +  ...+++||++++|+|..|......+
T Consensus        57 ~~~~~~~H~H~-~~el~~v~~G~g~~~v~~------~--~~~l~~Gdl~~I~~~~~H~~~~~~~  111 (312)
T PRK13500         57 PQDVFAEHTHD-FCELVIVWRGNGLHVLND------R--PYRITRGDLFYIHADDKHSYASVND  111 (312)
T ss_pred             CCCCCCccccc-eEEEEEEEcCeEEEEECC------E--EEeecCCeEEEECCCCeecccccCC
Confidence            33457899997 789999999999987642      3  4899999999999999999876444


No 41 
>TIGR02297 HpaA 4-hydroxyphenylacetate catabolism regulatory protein HpaA. This putative transcriptional regulator, which contains both the substrate-binding, dimerization domain (pfam02311) and the helix-turn-helix DNA-binding domain (pfam00165) of the AraC famil, is located proximal to genes of the 4-hydroxyphenylacetate catabolism pathway.
Probab=97.78  E-value=6.2e-05  Score=65.74  Aligned_cols=57  Identities=18%  Similarity=0.108  Sum_probs=46.3

Q ss_pred             CCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCc
Q 048097          105 YGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTS  169 (224)
Q Consensus       105 gg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~  169 (224)
                      +...++|||.+.-|++|+++|++++.+.      ++  ...+++||++++|+|..|.....++..
T Consensus        33 ~~~~~~H~H~~~~~l~~~~~G~~~~~~~------~~--~~~l~~g~~~ii~~~~~H~~~~~~~~~   89 (287)
T TIGR02297        33 GRNMPVHFHDRYYQLHYLTEGSIALQLD------EH--EYSEYAPCFFLTPPSVPHGFVTDLDAD   89 (287)
T ss_pred             CCCCCCcccccceeEEEEeeCceEEEEC------CE--EEEecCCeEEEeCCCCccccccCCCcc
Confidence            3468999997568999999999988763      33  478999999999999999987654433


No 42 
>PF05899 Cupin_3:  Protein of unknown function (DUF861);  InterPro: IPR008579 The function of the proteins in this entry are unknown. They contain the conserved barrel domain of the 'cupin' superfamily and members are specific to plants and bacteria.; PDB: 1RC6_A 3MYX_A 1O5U_A 2K9Z_A 1LKN_A 3ES4_A 1SFN_B 3BCW_A.
Probab=97.76  E-value=7.4e-05  Score=53.33  Aligned_cols=58  Identities=24%  Similarity=0.251  Sum_probs=42.7

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQ  162 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~  162 (224)
                      ++....+..||. ...++.  ..|++|||+|++++...  +   ++  +.++++||++++|+|..-.+
T Consensus         7 ~~~g~w~~~pg~-~~~~~~--~~E~~~vleG~v~it~~--~---G~--~~~~~aGD~~~~p~G~~~~w   64 (74)
T PF05899_consen    7 FSAGVWECTPGK-FPWPYP--EDEFFYVLEGEVTITDE--D---GE--TVTFKAGDAFFLPKGWTGTW   64 (74)
T ss_dssp             EEEEEEEEECEE-EEEEES--SEEEEEEEEEEEEEEET--T---TE--EEEEETTEEEEE-TTEEEEE
T ss_pred             EEEEEEEECCce-eEeeCC--CCEEEEEEEeEEEEEEC--C---CC--EEEEcCCcEEEECCCCEEEE
Confidence            466667778865 334444  48999999999999753  2   33  48999999999999986554


No 43 
>PRK13501 transcriptional activator RhaR; Provisional
Probab=97.75  E-value=9.4e-05  Score=65.09  Aligned_cols=62  Identities=21%  Similarity=0.193  Sum_probs=48.3

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCC
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIG  166 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G  166 (224)
                      .+.+.+  ..+....++|||. ..|++||++|++++.+.      ++  ...+++||++++|+|.+|.+...+
T Consensus        19 ~~~~~~--~~~~~~~~~H~H~-~~ei~~i~~G~~~~~i~------~~--~~~l~~g~~~~I~p~~~H~~~~~~   80 (290)
T PRK13501         19 PVAVTN--RYPQETFVEHTHQ-FCEIVIVWRGNGLHVLN------DH--PYRITCGDVFYIQAADHHSYESVH   80 (290)
T ss_pred             ceEEec--CCCCCCCcccccc-ceeEEEEecCceEEEEC------Ce--eeeecCCeEEEEcCCCcccccccC
Confidence            345444  2334457799996 69999999999999864      33  489999999999999999987543


No 44 
>PF14499 DUF4437:  Domain of unknown function (DUF4437); PDB: 2QDR_A.
Probab=97.75  E-value=4.9e-05  Score=66.50  Aligned_cols=73  Identities=27%  Similarity=0.360  Sum_probs=47.0

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      .|-+..|+.+.+|-..|||+|. +++-.|||+|.+..+  +     .+...+-|.+|..+..|+|..|+....+.+.+.+
T Consensus        34 ~g~~~~~vkf~~g~~~pph~H~-~~~~~~Vi~G~~~~~--~-----~~a~~~~l~~Gsy~~~PaG~~h~~~~~~~~~~~~  105 (251)
T PF14499_consen   34 DGPSGMRVKFPAGFSSPPHIHN-ADYRGTVISGELHNG--D-----PKAAAMWLPAGSYWFQPAGEPHITAAEGETNLLF  105 (251)
T ss_dssp             TS-EEEEEEE-TT-EE--BEES-S-EEEEEEESEEEET--T-----EE-----E-TTEEEEE-TT-EEEETTS-EE-EEE
T ss_pred             CCcceEEEEcCCCccCCCccee-eeEEEEEEEeEEEcC--C-----CcccceecCCCceEeccCCCceeeeccCccEEEE
Confidence            3778999999999999999997 799999999987663  1     2333467999999999999999987766655544


Q ss_pred             E
Q 048097          173 F  173 (224)
Q Consensus       173 l  173 (224)
                      +
T Consensus       106 ~  106 (251)
T PF14499_consen  106 I  106 (251)
T ss_dssp             E
T ss_pred             E
Confidence            4


No 45 
>KOG2107 consensus Uncharacterized conserved protein, contains double-stranded beta-helix domain [Function unknown]
Probab=97.70  E-value=7.4e-05  Score=61.05  Aligned_cols=57  Identities=30%  Similarity=0.431  Sum_probs=48.9

Q ss_pred             cCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          107 QNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       107 ~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      ..+.|.|+ .+|+-||++|++++-+-+.+   ++-+..-+++||.+++|+|+-|.+.-+.+
T Consensus        85 FfEEhlh~-deeiR~il~GtgYfDVrd~d---d~WIRi~vekGDlivlPaGiyHRFTtt~~  141 (179)
T KOG2107|consen   85 FFEEHLHE-DEEIRYILEGTGYFDVRDKD---DQWIRIFVEKGDLIVLPAGIYHRFTTTPS  141 (179)
T ss_pred             HHHHhcCc-hhheEEEeecceEEeeccCC---CCEEEEEEecCCEEEecCcceeeeecCch
Confidence            34899998 49999999999999988776   67777889999999999999999864433


No 46 
>PRK13503 transcriptional activator RhaS; Provisional
Probab=97.65  E-value=0.00016  Score=62.79  Aligned_cols=53  Identities=26%  Similarity=0.244  Sum_probs=44.5

Q ss_pred             CCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097          104 PYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus       104 pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                      +....++|||. .-|++||++|++++.+.+.        ...+++||++++|+|..|.....
T Consensus        24 ~~~~~~~H~H~-~~ei~~v~~G~~~~~i~~~--------~~~l~~g~~~~i~~~~~h~~~~~   76 (278)
T PRK13503         24 PQAAFPEHHHD-FHEIVIVEHGTGIHVFNGQ--------PYTLSGGTVCFVRDHDRHLYEHT   76 (278)
T ss_pred             ccccccccccC-ceeEEEEecCceeeEecCC--------cccccCCcEEEECCCccchhhhc
Confidence            44567899996 7999999999999987532        37899999999999999987654


No 47 
>PF06339 Ectoine_synth:  Ectoine synthase;  InterPro: IPR010462 This family consists of several bacterial ectoine synthase proteins. The ectABC genes encode the diaminobutyric acid acetyltransferase (EctA), the diaminobutyric acid aminotransferase (EctB), and the ectoine synthase (EctC). Together these proteins constitute the ectoine biosynthetic pathway [].; GO: 0016836 hydro-lyase activity, 0006596 polyamine biosynthetic process
Probab=97.62  E-value=0.00084  Score=52.65  Aligned_cols=82  Identities=15%  Similarity=0.133  Sum_probs=70.1

Q ss_pred             ccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEE
Q 048097           92 TLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAV  171 (224)
Q Consensus        92 ~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~  171 (224)
                      +.|+|+-...+.+|.....||-. .-|-.||++|++++.-...    ++  .+.+++|.++...+-..|+....  ++++
T Consensus        32 gmGFS~h~T~i~aGtet~~~Ykn-HlEAvyci~G~Gev~~~~~----G~--~~~i~pGt~YaLd~hD~H~lra~--~dm~  102 (126)
T PF06339_consen   32 GMGFSFHETTIYAGTETHIHYKN-HLEAVYCIEGEGEVEDLDT----GE--VHPIKPGTMYALDKHDRHYLRAK--TDMR  102 (126)
T ss_pred             CCCEEEEEEEEeCCCeeEEEecC-ceEEEEEEeceEEEEEccC----Cc--EEEcCCCeEEecCCCccEEEEec--CCEE
Confidence            45899999999999999999874 6899999999999987654    34  58999999999999999999754  4899


Q ss_pred             EEEEEeCCCCc
Q 048097          172 AFAGFSSQFPG  182 (224)
Q Consensus       172 ~l~~~~s~~pg  182 (224)
                      ++++||.+--|
T Consensus       103 ~vCVFnPpltG  113 (126)
T PF06339_consen  103 LVCVFNPPLTG  113 (126)
T ss_pred             EEEEcCCCCcC
Confidence            99999866444


No 48 
>COG3257 GlxB Uncharacterized protein, possibly involved in glyoxylate utilization [General function prediction only]
Probab=97.55  E-value=0.00072  Score=57.83  Aligned_cols=74  Identities=19%  Similarity=0.163  Sum_probs=63.7

Q ss_pred             eEEEEEEEcCCC-cCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           95 TSAVRIDYAPYG-QNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        95 is~~~v~l~pgg-~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      ++-+.+++.|+| .-.|-.-++++-++||++|++++.+.      ++  ++.|++|+..++|+|..|...|...+++.+.
T Consensus        61 F~qyive~~p~GGs~~~e~d~~ae~~lfVv~Ge~tv~~~------G~--th~l~eggyaylPpgs~~~~~N~~~~~~rfh  132 (264)
T COG3257          61 FVQYIVELHPNGGSQRPEGDEGAETFLFVVSGEITVKAE------GK--THALREGGYAYLPPGSGWTLRNAQKEDSRFH  132 (264)
T ss_pred             hhhheEEECCCCCCCCCCCCCcceEEEEEEeeeEEEEEc------Ce--EEEeccCCeEEeCCCCcceEeeccCCceEEE
Confidence            456778998876 67788788899999999999999875      34  5899999999999999999999999999887


Q ss_pred             EEE
Q 048097          174 AGF  176 (224)
Q Consensus       174 ~~~  176 (224)
                      ..-
T Consensus       133 w~r  135 (264)
T COG3257         133 WIR  135 (264)
T ss_pred             EEe
Confidence            654


No 49 
>PRK13502 transcriptional activator RhaR; Provisional
Probab=97.50  E-value=0.0004  Score=60.58  Aligned_cols=56  Identities=20%  Similarity=0.246  Sum_probs=45.4

Q ss_pred             cCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          103 APYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       103 ~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      .|.-..++|||. .-|++||.+|++++.+.      ++  ...+++||++++|+|.+|.....++
T Consensus        26 ~~~~~~~~H~h~-~~~l~~v~~G~~~~~i~------~~--~~~l~~g~l~li~~~~~H~~~~~~~   81 (282)
T PRK13502         26 YPQDVFAEHTHE-FCELVMVWRGNGLHVLN------ER--PYRITRGDLFYIRAEDKHSYTSVND   81 (282)
T ss_pred             CCCCCCCccccc-eEEEEEEecCcEEEEEC------CE--EEeecCCcEEEECCCCcccccccCC
Confidence            344447899996 78999999999998763      33  4899999999999999999865443


No 50 
>TIGR02272 gentisate_1_2 gentisate 1,2-dioxygenase. This family consists of gentisate 1,2-dioxygenases. This ring-opening enzyme acts in salicylate degradation that goes via gentisate rather than via catechol. It converts gentisate to maleylpyruvate. Some putative gentisate 1,2-dioxygenases are excluded by a relatively high trusted cutoff score because they are too closely related to known examples of 1-hydroxy-2-naphthoate dioxygenase. Therefore some homologs may be bona fide gentisate 1,2-dioxygenases even if they score below the given cutoffs.
Probab=97.46  E-value=0.0004  Score=63.25  Aligned_cols=86  Identities=19%  Similarity=0.109  Sum_probs=64.1

Q ss_pred             CeeEEEccccccCc-ccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           76 GFNVTNANVEQIPG-LNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        76 g~~v~~~~~~~~p~-L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      |..+..++..+=+. ..+++..+  ..+.+|....+|-|. ++.+++|++|++++.+.      ++  +...++||+|++
T Consensus       232 g~~l~y~NP~TG~~~~pti~~~~--q~L~~G~~t~~~r~T-~s~Vf~VieG~G~s~ig------~~--~~~W~~gD~f~v  300 (335)
T TIGR02272       232 GLKLRYVNPATGGYPMPTIGAFI--QLLPKGFRTATYRST-DATVFCVVEGRGQVRIG------DA--VFRFSPKDVFVV  300 (335)
T ss_pred             eEEEEEeCCCCCCCcchhHHHHH--hccCCCCCCCCcccc-ccEEEEEEeCeEEEEEC------CE--EEEecCCCEEEE
Confidence            45567777655553 44445443  557888899999996 68999999999999874      33  478999999999


Q ss_pred             cCCCeeEEEeCCCCcEEEEE
Q 048097          155 PIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       155 P~G~~H~~~N~G~~~a~~l~  174 (224)
                      |....|...|.  ++++++.
T Consensus       301 PsW~~~~h~a~--~da~Lf~  318 (335)
T TIGR02272       301 PSWHPVRFEAS--DDAVLFS  318 (335)
T ss_pred             CCCCcEecccC--CCeEEEE
Confidence            99988877663  4566553


No 51 
>PF06052 3-HAO:  3-hydroxyanthranilic acid dioxygenase;  InterPro: IPR010329 Members of this protein family, from both bacteria and eukaryotes, are the enzyme 3-hydroxyanthranilate 3,4-dioxygenase (1.13.11.6 from EC). It is part of the kynurenine pathway for the degradation of tryptophan and the biosynthesis of nicotinic acid [].The prokaryotic homologue is involved in the 2-nitrobenzoate degradation pathway []. The enzyme acts on the tryptophan metabolite 3-hydroxyanthranilate and produces 2-amino-3-carboxymuconate semialdehyde, which can rearrange spontaneously to quinolinic acid and feed into nicotinamide biosynthesis, or undergo further enzymatic degradation.; GO: 0000334 3-hydroxyanthranilate 3,4-dioxygenase activity, 0005506 iron ion binding, 0008152 metabolic process, 0055114 oxidation-reduction process; PDB: 1ZVF_A 1YFX_A 1YFW_A 1YFY_A 1YFU_A 2QNK_A 3FE5_A.
Probab=97.39  E-value=0.0022  Score=51.80  Aligned_cols=79  Identities=15%  Similarity=0.253  Sum_probs=49.3

Q ss_pred             EEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEe
Q 048097           98 VRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFS  177 (224)
Q Consensus        98 ~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~  177 (224)
                      ..+.=.|+...--|+.+ +.|++|-++|...+.+++.    ++.....+++||+|+.|++.+|.-+-..  ..+.+++-.
T Consensus        36 VmvVGGPN~R~DyHine-~eE~FyQ~kG~m~Lkv~e~----g~~kdi~I~EGe~fLLP~~vpHsP~R~~--~tiGLViEr  108 (151)
T PF06052_consen   36 VMVVGGPNQRTDYHINE-TEEFFYQLKGDMCLKVVED----GKFKDIPIREGEMFLLPANVPHSPQRPA--DTIGLVIER  108 (151)
T ss_dssp             EEEEESSB--SSEEE-S-S-EEEEEEES-EEEEEEET----TEEEEEEE-TTEEEEE-TT--EEEEE-T--T-EEEEEEE
T ss_pred             EEEEcCCCCCCccccCC-cceEEEEEeCcEEEEEEeC----CceEEEEeCCCcEEecCCCCCCCCcCCC--CcEEEEEEe
Confidence            34455677777889997 7999999999999998875    4666789999999999999999986543  345554444


Q ss_pred             CCCCce
Q 048097          178 SQFPGV  183 (224)
Q Consensus       178 s~~pg~  183 (224)
                      ...+|.
T Consensus       109 ~R~~~~  114 (151)
T PF06052_consen  109 KRPEGE  114 (151)
T ss_dssp             ---TTS
T ss_pred             ccCCCC
Confidence            344443


No 52 
>COG1898 RfbC dTDP-4-dehydrorhamnose 3,5-epimerase and related enzymes [Cell envelope biogenesis, outer membrane]
Probab=97.00  E-value=0.0077  Score=50.00  Aligned_cols=71  Identities=15%  Similarity=0.212  Sum_probs=55.9

Q ss_pred             CCCcCCCccCCCC-cEEEEEEecEEEEEEEeCCCCC---CeeEEEEecCC--CEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097          104 PYGQNPPHTHPRA-TEILVVLEGTLYVGFVTSNQLN---NTLIAKVLNKG--DVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       104 pgg~~ppH~Hp~a-~Ei~~Vl~G~~~v~~v~~~~~~---~k~~~~~l~~G--Dv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      +|-++..|+|.+- .+++.|++|++..-.++-..++   ++....++.+-  ..+.+|+|..|.++|.+++..+.+.
T Consensus        54 ~GvlRGlHyq~~~q~klv~~v~G~v~dv~vDlR~~SpTyg~~~~~~ls~~N~~~l~IP~G~AHGf~~L~d~~~~~y~  130 (173)
T COG1898          54 PGVLRGLHYQHKPQGKLVRVVSGKVFDVAVDLRKDSPTYGKWVGVVLSAENKRQLYIPPGFAHGFQVLSDDAEVVYK  130 (173)
T ss_pred             CCeeEEEEcccCCCCeEEEEecCeEEEEEEEccCCCCCcceEEEEEecCCCceEEEeCCcccceeEEccCceEEEEE
Confidence            8889999999988 8999999999999888743210   13445566654  8999999999999999998744443


No 53 
>PF06249 EutQ:  Ethanolamine utilisation protein EutQ;  InterPro: IPR010424 The eut operon of Salmonella typhimurium encodes proteins involved in the cobalamin-dependent degradation of ethanolamine. The role of EutQ in this process is unclear [].; PDB: 2PYT_B 3LWC_A.
Probab=96.98  E-value=0.0021  Score=52.20  Aligned_cols=58  Identities=26%  Similarity=0.177  Sum_probs=39.4

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      +++...+++..   +.-|.-.-.|+.||++|++.+...      ++  +...++||+++||+|.-=.+.
T Consensus        77 l~~Gf~~le~~---~f~wtl~YDEi~~VlEG~L~i~~~------G~--~~~A~~GDvi~iPkGs~I~fs  134 (152)
T PF06249_consen   77 LSAGFMELEKT---SFPWTLTYDEIKYVLEGTLEISID------GQ--TVTAKPGDVIFIPKGSTITFS  134 (152)
T ss_dssp             SEEEEEEEEEE---EEEEE-SSEEEEEEEEEEEEEEET------TE--EEEEETT-EEEE-TT-EEEEE
T ss_pred             eeeEEEEEeCC---CccEEeecceEEEEEEeEEEEEEC------CE--EEEEcCCcEEEECCCCEEEEe
Confidence            44444555553   456777789999999999988732      34  478899999999999765553


No 54 
>PF05995 CDO_I:  Cysteine dioxygenase type I;  InterPro: IPR010300 Cysteine dioxygenase type I (1.13.11.20 from EC) converts cysteine to cysteinesulphinic acid and is the rate-limiting step in sulphate production.; GO: 0005506 iron ion binding, 0017172 cysteine dioxygenase activity, 0046439 L-cysteine metabolic process, 0055114 oxidation-reduction process; PDB: 2IC1_A 3EQE_B 3ELN_A 2B5H_A 2GH2_A 2Q4S_A 2ATF_A 2GM6_A 3USS_B.
Probab=96.65  E-value=0.044  Score=45.34  Aligned_cols=86  Identities=21%  Similarity=0.193  Sum_probs=57.8

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCC-CCee----EEEEecCCCEEEEcCCCeeEEEeCC-C
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQL-NNTL----IAKVLNKGDVFVFPIGLIHFQVNIG-K  167 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~-~~k~----~~~~l~~GDv~v~P~G~~H~~~N~G-~  167 (224)
                      .+++..+.-.||...+.|=|..+.=++.|++|+++-........ +.+.    ....+..|.+.+++.+.+|.+.|.+ +
T Consensus        74 ~~el~ll~W~pGq~S~IHDH~~s~g~~~vl~G~l~e~~y~~~~~~~~~~~~~~~~~~~~~g~~~~~~~~~iH~v~n~s~~  153 (175)
T PF05995_consen   74 RFELWLLCWPPGQRSPIHDHGGSWGWVKVLSGELEETRYRRPDDGGAPLELVGRERLLPGGVTYIFDPHGIHRVENPSGD  153 (175)
T ss_dssp             T-EEEEEEE-TT-B--EEE-TTSEEEEEEEESEEEEEEEEESTSSS-EEEECEEEEEETTTEEEEBTTTBEEEEEES-SS
T ss_pred             CeEEEEEEeCCCCcCCCCCCCCceEEEEEecceEEEEEeccCCcccCcccccCceEecCCCeEEecCCCCeEEeccCCCC
Confidence            46778889999999999999877778889999988776543310 0111    2345688888899999999999887 8


Q ss_pred             CcEEEEEEEeCC
Q 048097          168 TSAVAFAGFSSQ  179 (224)
Q Consensus       168 ~~a~~l~~~~s~  179 (224)
                      ++++-+=+++.+
T Consensus       154 ~~avSLHvYspP  165 (175)
T PF05995_consen  154 EPAVSLHVYSPP  165 (175)
T ss_dssp             S-EEEEEEEES-
T ss_pred             CCEEEEEEcCCC
Confidence            888888777644


No 55 
>COG4766 EutQ Ethanolamine utilization protein [Amino acid transport and metabolism]
Probab=96.61  E-value=0.02  Score=46.56  Aligned_cols=68  Identities=25%  Similarity=0.170  Sum_probs=47.1

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      +++...++++ ..+|.-.  +-+|+-|||||++.+...+      +  +..-++||++++|+|.---+--.|.  +.++-
T Consensus       100 l~aG~m~~~~-~tf~wtl--~yDe~d~VlEGrL~V~~~g------~--tv~a~aGDvifiPKgssIefst~ge--a~fly  166 (176)
T COG4766         100 LGAGLMEMKN-TTFPWTL--NYDEIDYVLEGRLHVRIDG------R--TVIAGAGDVIFIPKGSSIEFSTTGE--AKFLY  166 (176)
T ss_pred             cccceeeecc-ccCccee--cccceeEEEeeeEEEEEcC------C--eEecCCCcEEEecCCCeEEEeccce--EEEEE
Confidence            4455555666 4444443  4689999999999998653      2  3677999999999998766654444  55554


Q ss_pred             E
Q 048097          175 G  175 (224)
Q Consensus       175 ~  175 (224)
                      +
T Consensus       167 v  167 (176)
T COG4766         167 V  167 (176)
T ss_pred             E
Confidence            3


No 56 
>COG3450 Predicted enzyme of the cupin superfamily [General function prediction only]
Probab=96.52  E-value=0.0052  Score=47.80  Aligned_cols=60  Identities=22%  Similarity=0.192  Sum_probs=44.1

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      +.....+-.||.   .|++-...|+.++|+|++++.-.  +   ++  ...+++||+++||+|..=-++-
T Consensus        45 ~~~GiWe~TpG~---~r~~y~~~E~chil~G~v~~T~d--~---Ge--~v~~~aGD~~~~~~G~~g~W~V  104 (116)
T COG3450          45 VETGIWECTPGK---FRVTYDEDEFCHILEGRVEVTPD--G---GE--PVEVRAGDSFVFPAGFKGTWEV  104 (116)
T ss_pred             eeEeEEEecCcc---ceEEcccceEEEEEeeEEEEECC--C---Ce--EEEEcCCCEEEECCCCeEEEEE
Confidence            455556666665   34555568999999999988632  2   34  4799999999999998766543


No 57 
>PF00908 dTDP_sugar_isom:  dTDP-4-dehydrorhamnose 3,5-epimerase;  InterPro: IPR000888 Deoxythymidine diphosphate (dTDP)-4-keto-6-deoxy-d-hexulose 3, 5-epimerase (RmlC, 5.1.3.13 from EC) is involved in the biosynthesis of dTDP-l-rhamnose, which is an essential component of the bacterial cell wall, converting dTDP-4-keto-6-deoxy-D-glucose to dTDP-4-keto-L-rhamnose. The crystal structure of RmlC from Methanobacterium thermoautotrophicum was determined in the presence and absence of a substrate analogue. RmlC is a homodimer comprising a central jelly roll motif, which extends in two directions into longer beta-sheets. Binding of dTDP is stabilised by ionic interactions to the phosphate group and by a combination of ionic and hydrophobic interactions with the base. The active site, which is located in the centre of the jelly roll, is formed by residues that are conserved in all known RmlC sequence homologues. The active site is lined with a number of charged residues and a number of residues with hydrogen-bonding potentials, which together comprise a potential network for substrate binding and catalysis. The active site is also lined with aromatic residues which provide favorable environments for the base moiety of dTDP and potentially for the sugar moiety of the substrate [].; GO: 0008830 dTDP-4-dehydrorhamnose 3,5-epimerase activity, 0009103 lipopolysaccharide biosynthetic process; PDB: 1EPZ_A 1EP0_A 1NXM_A 1NZC_D 2IXL_C 1NYW_B 2IXC_D 1PM7_B 1UPI_A 3RYK_B ....
Probab=96.45  E-value=0.02  Score=47.58  Aligned_cols=71  Identities=13%  Similarity=0.140  Sum_probs=53.0

Q ss_pred             cCCCcCCCccCCCC---cEEEEEEecEEEEEEEeCCCC---CCeeEEEEecCCC--EEEEcCCCeeEEEeCCCCcEEEE
Q 048097          103 APYGQNPPHTHPRA---TEILVVLEGTLYVGFVTSNQL---NNTLIAKVLNKGD--VFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus       103 ~pgg~~ppH~Hp~a---~Ei~~Vl~G~~~v~~v~~~~~---~~k~~~~~l~~GD--v~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .+|-++.+|+|..-   ..++.|++|++..-++|-..+   =++.....|.+++  .++||+|..|.....+++..+.+
T Consensus        51 ~~gvlRGlH~q~~~~~q~Klv~~~~G~i~dV~vDlR~~SpTfg~~~~~~Ls~~n~~~l~IP~G~aHGf~~l~d~a~v~Y  129 (176)
T PF00908_consen   51 KKGVLRGLHYQSPPYAQAKLVRCLRGEIFDVAVDLRKGSPTFGKWVSVELSAENPRQLYIPPGVAHGFQTLEDDAEVLY  129 (176)
T ss_dssp             ETTBEEEEEEESTTT-EEEEEEEEESEEEEEEEE-BTTSTTTT-EEEEEEETTT--EEEE-TTEEEEEEESSSEEEEEE
T ss_pred             cccEEEEEEEecCCCCCCcEEEEecCeEEEEEEECCCCCCCCCEEEEEEeCccccCEEEeCCcceeeEEeccCceEEEE
Confidence            34778999999764   689999999999988873311   1456678887776  79999999999999977744444


No 58 
>TIGR01221 rmlC dTDP-4-dehydrorhamnose 3,5-epimerase. This enzyme participates in the biosynthesis of dTDP-L-rhamnose, often as a precursor to LPS O-antigen
Probab=96.36  E-value=0.068  Score=44.45  Aligned_cols=71  Identities=14%  Similarity=0.127  Sum_probs=54.5

Q ss_pred             cCCCcCCCccC--CCCcEEEEEEecEEEEEEEeCCCC---CCeeEEEEecC--CCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097          103 APYGQNPPHTH--PRATEILVVLEGTLYVGFVTSNQL---NNTLIAKVLNK--GDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus       103 ~pgg~~ppH~H--p~a~Ei~~Vl~G~~~v~~v~~~~~---~~k~~~~~l~~--GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .+|-++.+|.|  +....+++|++|++..-++|-..+   -++.....|.+  +..++||+|..|.....+++..+.+
T Consensus        52 ~~gvlRGlH~q~~~~q~Klv~c~~G~i~dV~VDlR~~SpTfG~~~~~~L~~~~~~~l~IP~G~aHGF~~L~d~a~v~Y  129 (176)
T TIGR01221        52 YKGVLRGLHYQRPHPQGKLVRVLRGEVFDVAVDLRRNSPTFGKWVGVLLSAENKRQLWIPEGFAHGFVVLSDEAEFLY  129 (176)
T ss_pred             cCCEEEEEEECCCCCCceEEEEccCCEEEEEEECCCCcCCCCeEEEEEECCCCCCEEEeCCcceeEEEEcCCCeEEEE
Confidence            56778999998  336899999999999988875421   13455677776  6699999999999999886633333


No 59 
>PF13621 Cupin_8:  Cupin-like domain; PDB: 3AL6_C 3AL5_C 2XUM_A 2Y0I_A 1MZE_A 3KCY_A 1MZF_A 1YCI_A 2ILM_A 1H2L_A ....
Probab=96.24  E-value=0.024  Score=47.86  Aligned_cols=72  Identities=22%  Similarity=0.335  Sum_probs=49.6

Q ss_pred             EEEEEEcCCC-cCCCccCCCCcEEEEEEecEEEEEEEeCCCC--------------------------------CCeeEE
Q 048097           97 AVRIDYAPYG-QNPPHTHPRATEILVVLEGTLYVGFVTSNQL--------------------------------NNTLIA  143 (224)
Q Consensus        97 ~~~v~l~pgg-~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~--------------------------------~~k~~~  143 (224)
                      ...+-+.++| ..+.|+.+ ..-++.+++|+=++.+..+...                                ..+.+.
T Consensus       132 ~~~l~ig~~gs~t~lH~D~-~~n~~~~i~G~K~~~L~pP~~~~~l~~~~~~~~~~~~~~~d~~~~d~~~~p~~~~~~~~~  210 (251)
T PF13621_consen  132 SSNLWIGPPGSFTPLHYDP-SHNLLAQIRGRKRWILFPPDDSPNLYPRPDSHGGTVFSWVDPDNPDLERFPKFRKAPPYE  210 (251)
T ss_dssp             EEEEEEE-TTEEEEEEE-S-SEEEEEEEESEEEEEEE-GGGGGGCTBETTTST-TCBBSS-TTS--TTT-CGGGG--EEE
T ss_pred             ccEEEEeCCCceeeeeECc-hhhhhhccCCCEEEEEECCccccccccceecccccceeeeeccChhhhhhhhhccCceeE
Confidence            4456666644 78999987 6789999999999988765410                                113567


Q ss_pred             EEecCCCEEEEcCCCeeEEEeCCCCc
Q 048097          144 KVLNKGDVFVFPIGLIHFQVNIGKTS  169 (224)
Q Consensus       144 ~~l~~GDv~v~P~G~~H~~~N~G~~~  169 (224)
                      .+|++||+++||+|..|+.+|...++
T Consensus       211 ~~l~pGD~LfiP~gWwH~V~~~~~~~  236 (251)
T PF13621_consen  211 VVLEPGDVLFIPPGWWHQVENLSDDD  236 (251)
T ss_dssp             EEEETT-EEEE-TT-EEEEEESTTSS
T ss_pred             EEECCCeEEEECCCCeEEEEEcCCCC
Confidence            89999999999999999999984333


No 60 
>COG3435 Gentisate 1,2-dioxygenase [Secondary metabolites biosynthesis, transport, and catabolism]
Probab=95.90  E-value=0.029  Score=50.30  Aligned_cols=89  Identities=26%  Similarity=0.240  Sum_probs=63.2

Q ss_pred             CCCeeEEEccccccC-cccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097           74 RLGFNVTNANVEQIP-GLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus        74 ~~g~~v~~~~~~~~p-~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      -.|..+..++..+=- ...+  |....--|.||-.-.+|-|- .+-+..|.+|++++.+.      ++  ++...+||+|
T Consensus       241 ~dG~~~ryvNP~TGg~~mpt--I~a~mqlL~~Gf~~~~~r~t-~s~iy~V~eGsg~~~Ig------~~--rf~~~~~D~f  309 (351)
T COG3435         241 FDGYKMRYVNPVTGGYAMPT--IGAFMQLLPPGFHGKAHRHT-DSTIYHVVEGSGYTIIG------GE--RFDWSAGDIF  309 (351)
T ss_pred             CCcceEEEecCCCCCCcCch--HHHHHHhcCCcccCCceecc-CCEEEEEEecceeEEEC------CE--EeeccCCCEE
Confidence            346666666653311 1111  22223346788788999886 47888899999999764      33  4889999999


Q ss_pred             EEcCCCeeEEEeCCCCcEEEEE
Q 048097          153 VFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       153 v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      ++|.-..|...|. .+.+++++
T Consensus       310 vVPsW~~~~~~~g-s~da~LFs  330 (351)
T COG3435         310 VVPSWAWHEHVNG-SEDAVLFS  330 (351)
T ss_pred             EccCcceeecccC-CcceEEEe
Confidence            9999999999875 77787774


No 61 
>PF08007 Cupin_4:  Cupin superfamily protein;  InterPro: IPR022777  This signature represents primarily the cupin fold found in JmjC transcription factors. The fold is also found in lysine-specific demethylase NO66.; PDB: 2XDV_A 1VRB_B 4DIQ_B.
Probab=95.65  E-value=0.13  Score=46.36  Aligned_cols=70  Identities=23%  Similarity=0.270  Sum_probs=45.4

Q ss_pred             EEEEEEEcCCC--cCCCccCCCCcEEEEEEecEEEEEEEeCCC------C---------CCeeEEEEecCCCEEEEcCCC
Q 048097           96 SAVRIDYAPYG--QNPPHTHPRATEILVVLEGTLYVGFVTSNQ------L---------NNTLIAKVLNKGDVFVFPIGL  158 (224)
Q Consensus        96 s~~~v~l~pgg--~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~------~---------~~k~~~~~l~~GDv~v~P~G~  158 (224)
                      ..+-+.+.|+|  -+.|||=. ..-+++=++|+=+..+.....      .         .......+|++||++++|+|.
T Consensus       114 ~~~n~Y~tp~g~~g~~~H~D~-~dvfvlQ~~G~K~W~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~L~pGD~LYlPrG~  192 (319)
T PF08007_consen  114 VGANAYLTPPGSQGFGPHYDD-HDVFVLQLEGRKRWRLYPPPDEPAPLYSDQPFKQLEEFEPVEEVVLEPGDVLYLPRGW  192 (319)
T ss_dssp             EEEEEEEETSSBEESECEE-S-SEEEEEEEES-EEEEEE-SCCCTTTSSCE--TTTCG--STSEEEEE-TT-EEEE-TT-
T ss_pred             cceEEEecCCCCCCccCEECC-cccEEEECCceeEEEECCCCcccccccCCCCccccccCceeEEEEECCCCEEEECCCc
Confidence            34456678888  78999876 567777788876666654210      0         122456899999999999999


Q ss_pred             eeEEEeCC
Q 048097          159 IHFQVNIG  166 (224)
Q Consensus       159 ~H~~~N~G  166 (224)
                      +|.....+
T Consensus       193 ~H~~~~~~  200 (319)
T PF08007_consen  193 WHQAVTTD  200 (319)
T ss_dssp             EEEEEESS
T ss_pred             cCCCCCCC
Confidence            99999888


No 62 
>PF04209 HgmA:  homogentisate 1,2-dioxygenase;  InterPro: IPR005708  Alkaptonuria (AKU), a rare hereditary disorder, was the first disease to be interpreted as an inborn error of metabolism. The deficiency causes homogentisic aciduria, ochronosis, and arthritis. AKU patients are deficient for homogentisate 1,2 dioxygenase (1.13.11.5 from EC), the enzyme that mediates the conversion of homogentisate to maleylacetoacetate; a step in the catabolism of both tyrosine and phenylalanine.  Homogentisate + O(2) = 4-maleylacetoacetate.   ; GO: 0004411 homogentisate 1,2-dioxygenase activity, 0006559 L-phenylalanine catabolic process, 0006570 tyrosine metabolic process, 0055114 oxidation-reduction process; PDB: 1EY2_A 1EYB_A.
Probab=95.46  E-value=0.12  Score=48.62  Aligned_cols=56  Identities=16%  Similarity=0.159  Sum_probs=37.9

Q ss_pred             CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097          109 PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      ..-.+-+++|++++-+|++++.-  +-   ++   ..+++||+++||+|+.+.+.-.  +++..+.
T Consensus       139 ~~f~NaDGD~Li~~q~G~l~l~T--e~---G~---L~v~pGd~~VIPRG~~~rv~l~--~p~rgyi  194 (424)
T PF04209_consen  139 RAFRNADGDELIFPQQGSLRLET--EF---GR---LDVRPGDYVVIPRGTRFRVELP--GPARGYI  194 (424)
T ss_dssp             EEEEESSEEEEEEEEES-EEEEE--TT---EE---EEE-TTEEEEE-TT--EEEE-S--SSEEEEE
T ss_pred             cceEcCCCCEEEEEEECCEEEEe--cC---ee---EEEcCCeEEEECCeeEEEEEeC--CCceEEE
Confidence            34457789999999999998863  32   33   6799999999999999998765  5555543


No 63 
>PF13759 2OG-FeII_Oxy_5:  Putative 2OG-Fe(II) oxygenase; PDB: 3BVC_B 2RG4_A.
Probab=95.38  E-value=0.055  Score=40.35  Aligned_cols=74  Identities=26%  Similarity=0.317  Sum_probs=33.8

Q ss_pred             EEEcCCCcCCCccCCCCc--EEEEEE--ecEEEEEEEeCCCC---------------CCeeEEEEecCCCEEEEcCCCee
Q 048097          100 IDYAPYGQNPPHTHPRAT--EILVVL--EGTLYVGFVTSNQL---------------NNTLIAKVLNKGDVFVFPIGLIH  160 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp~a~--Ei~~Vl--~G~~~v~~v~~~~~---------------~~k~~~~~l~~GDv~v~P~G~~H  160 (224)
                      ....+|+..++|.|+.+.  =++||-  ++...+.|.++...               ....+....++||+++||.-+.|
T Consensus         5 ni~~~g~~~~~H~H~~s~~SgVyYv~~p~~~~~l~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~p~~G~lvlFPs~l~H   84 (101)
T PF13759_consen    5 NIYRKGGYNEPHNHPNSWLSGVYYVQVPEGSGPLRFHDPRGSFSFGAPFDNYDQNDLNSPYYIVEPEEGDLVLFPSWLWH   84 (101)
T ss_dssp             EEE-TT--EEEE--TT-SEEEEEECE--TTS-SEEEE-TTCCCGTTS----TTTTCCC-SEEEE---TTEEEEEETTSEE
T ss_pred             EEeCCCCccCceECCCcCEEEEEEEECCCCCCceeeeCCCccceecccccccccCcccCceEEeCCCCCEEEEeCCCCEE
Confidence            456789999999999752  222221  22222333333210               01234567899999999999999


Q ss_pred             EEE-eCCCCcEEEE
Q 048097          161 FQV-NIGKTSAVAF  173 (224)
Q Consensus       161 ~~~-N~G~~~a~~l  173 (224)
                      ... |.++++-+-+
T Consensus        85 ~v~p~~~~~~Risi   98 (101)
T PF13759_consen   85 GVPPNNSDEERISI   98 (101)
T ss_dssp             EE----SSS-EEEE
T ss_pred             eccCcCCCCCEEEE
Confidence            985 5555444443


No 64 
>PF02678 Pirin:  Pirin;  InterPro: IPR003829 This entry represents N-terminal domain of Pirin proteins from both eukaryotes and prokaryotes. The function of Pirin is unknown but the gene coding for this protein is known to be expressed in all tissues in the human body although it is expressed most strongly in the liver and heart. Pirin is known to be a nuclear protein, exclusively localised within the nucleoplasma and predominantly concentrated within dot-like subnuclear structures []. Pirin is composed of two structurally similar domains arranged face to face. The N-terminal domain additionally features four beta-strands, and the C-terminal domain also includes four additional -strands and a short alpha-helix. Although the two domains are similar, the C-terminal domain of Pirin differs from the N-terminal domain as it does not contain a metal binding site and its sequence does not contain the conserved metal-coordinating residues [].  Pirin is confirmed to be a member of the cupin superfamily on the basis of primary sequence and structural similarity. The presence of a metal binding site in the N-terminal beta-barrel of Pirin, may be significant in its role in regulating NFI DNA replication and NF-kappaB transcription factor activity []. Pirin structure has been found to closely resemble members of the cupin superfamily. Pirin contains the two characteristic sequences of the cupin superfamily, namely PG-(X)5-HXH-(X)4-E-(X)6-G and G-(X)5-PXG-(X)2-H-(X)3-N separated by a variable stretch of 15-50 amino acids. These motifs are best conserved in the N-terminal where the conserved histidine and glutamic acid residues correspond to the metal-coordinating residues. The C-terminal domain motifs lack the metal binding residues normally associated with the cupin fold [].  Pirin was identified to be a metal-binding protein [], and was found that the metal-binding residues of Pirins are highly conserved across mammals, plants, fungi, and prokaryotic organisms. Pirin acts as a cofactor for the transcription factor NFI, the regulatory mechanism of which is generally believed to require the assistance of a metal ion []. Structural data supports the hypothesis that the bound iron of Pirin may participate in this transcriptional regulation by enhancing and stabilising the formation of the p50,Bcl3,DNA complex []. Metals have been implicated directly or indirectly in the NF-kappaB family of transcription factors that control expression of a number of early response genes associated with inflammatory responses, cell growth, cell cycle progression, and neoplastic transformation []. However, most metal-dependent transcription factors are DNA-binding proteins that bind to specific sequences when the metal binds to the protein. Pirin, on the other hand, appears to function differently and bind to the transcription factor DNA complex [].; PDB: 2VEC_A 1J1L_A 3ACL_A 2P17_A 1TQ5_A.
Probab=95.16  E-value=0.07  Score=40.85  Aligned_cols=62  Identities=29%  Similarity=0.305  Sum_probs=46.4

Q ss_pred             CCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcC--CCeeEEEeCCC-CcEEEE
Q 048097          105 YGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPI--GLIHFQVNIGK-TSAVAF  173 (224)
Q Consensus       105 gg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~--G~~H~~~N~G~-~~a~~l  173 (224)
                      +.-.++|-|.+-+-+.||++|+++-.  |+.+  ++   .+|++||+-+.-+  |+.|...|.++ +++..+
T Consensus        39 ~~gf~~HPH~g~eivTyv~~G~~~H~--Ds~G--~~---~~l~~G~vq~m~AG~Gi~H~E~~~~~~~~~~~l  103 (107)
T PF02678_consen   39 GAGFPMHPHRGFEIVTYVLEGELRHR--DSLG--NR---GVLRAGDVQWMTAGSGIVHSERNASDGGPLHGL  103 (107)
T ss_dssp             TTEEEEEEECSEEEEEEEEESEEEEE--ETTS--EE---EEEETTEEEEEE-TTTEEEEEEE-TSSS-EEEE
T ss_pred             CCCCCCcCCCCceEEEEEecCEEEEE--CCCC--Ce---eEeCCCeEEEEeCCCCceEEEecCCCCCeEEEE
Confidence            55669999987777889999998664  4442  44   7899999998876  68999999887 666665


No 65 
>PRK05341 homogentisate 1,2-dioxygenase; Provisional
Probab=95.12  E-value=0.19  Score=47.33  Aligned_cols=59  Identities=14%  Similarity=0.170  Sum_probs=44.5

Q ss_pred             CCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEE
Q 048097          108 NPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAG  175 (224)
Q Consensus       108 ~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~  175 (224)
                      ...-.+.+++|++++-+|++.+.-.-     ++   ..+++||+++||+|+.+.+. ..+++++.+..
T Consensus       146 ~~~f~NaDGD~Livpq~G~l~i~TEf-----G~---L~v~pgei~VIPRG~~frv~-l~~gp~rgyi~  204 (438)
T PRK05341        146 DRYFYNADGELLIVPQQGRLRLATEL-----GV---LDVEPGEIAVIPRGVKFRVE-LPDGPARGYVC  204 (438)
T ss_pred             cceeecCCCCEEEEEEeCCEEEEEec-----cc---eEecCCCEEEEcCccEEEEe-cCCCCeeEEEE
Confidence            44456778999999999999886432     33   68999999999999998885 33456555433


No 66 
>PF07385 DUF1498:  Protein of unknown function (DUF1498);  InterPro: IPR010864 This family consists of several hypothetical bacterial proteins of around 225 residues in length. The function of this family is unknown.; PDB: 3MPB_B 3KMH_A.
Probab=94.80  E-value=0.21  Score=42.96  Aligned_cols=78  Identities=21%  Similarity=0.241  Sum_probs=46.3

Q ss_pred             EEEcCCCcCCCccCCCCcEEEEEEe-cEEEEEEEeCCC--C-----------CCeeE------EEEecCCCEEEEcCCCe
Q 048097          100 IDYAPYGQNPPHTHPRATEILVVLE-GTLYVGFVTSNQ--L-----------NNTLI------AKVLNKGDVFVFPIGLI  159 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp~a~Ei~~Vl~-G~~~v~~v~~~~--~-----------~~k~~------~~~l~~GDv~v~P~G~~  159 (224)
                      +-+.+|...|.|.|..-.|=++.-- |.+.+.+...++  +           .++.+      ...|+||+.+-+++|+.
T Consensus        92 m~~~~~Q~tP~H~H~~K~EDIINRGGG~L~i~l~~s~~~~~~~~~~~v~V~~DG~~~t~~aG~~l~L~PGESiTL~Pg~y  171 (225)
T PF07385_consen   92 MIVREGQVTPMHFHWKKMEDIINRGGGNLVIELYNSDPDGELDADTDVTVPVDGIRRTVPAGTQLRLNPGESITLPPGIY  171 (225)
T ss_dssp             EEE-BT-EEEEEEESS--EEEEEEEES-EEEEEEEB--TTSSB-SS-EEEEETTEEEEE-TT-EEEE-TT-EEEE-TTEE
T ss_pred             eeccCCCcCCcccCcchhhheeecCCceEEEEEEeccCCCccccCCCeEEecCCcEEEecCCceEEeCCCCeEeeCCCCe
Confidence            5668899999999998888777665 577777654331  0           11111      25799999999999999


Q ss_pred             eEEEeCCCCcEEEEEEEeCC
Q 048097          160 HFQVNIGKTSAVAFAGFSSQ  179 (224)
Q Consensus       160 H~~~N~G~~~a~~l~~~~s~  179 (224)
                      |++.-.+..  +++.-+++-
T Consensus       172 H~Fw~e~g~--vLigEVStv  189 (225)
T PF07385_consen  172 HWFWGEGGD--VLIGEVSTV  189 (225)
T ss_dssp             EEEEE-TTS--EEEEEEEE-
T ss_pred             eeEEecCCC--EEEEeeecc
Confidence            999875544  555555543


No 67 
>PLN02658 homogentisate 1,2-dioxygenase
Probab=94.76  E-value=0.29  Score=46.06  Aligned_cols=57  Identities=12%  Similarity=0.197  Sum_probs=43.1

Q ss_pred             CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097          109 PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      ..-.+.+++|++++-+|++.+.-.-     ++   ..+++||+++||+|+.+.+.= .+++++.+.
T Consensus       140 ~~f~NaDGD~Livpq~G~l~i~TEf-----G~---L~v~pgei~VIPRG~~frv~l-~~gp~rgyv  196 (435)
T PLN02658        140 CAFCNADGDFLIVPQQGRLWIKTEL-----GK---LQVSPGEIVVIPRGFRFAVDL-PDGPSRGYV  196 (435)
T ss_pred             ceeecCCCCEEEEEEeCCEEEEEec-----cc---eEecCCCEEEecCccEEEEec-CCCCeeEEE
Confidence            3356778999999999999886432     33   688999999999999988853 234555543


No 68 
>TIGR02466 conserved hypothetical protein. This family consists of uncharacterized proteins in Caulobacter crescentus CB15, Bdellovibrio bacteriovorus HD100, Synechococcus sp. WH 8102 (2), Silicibacter pomeroyi DSS-3 (2), and Hyphomonas neptunium ATCC 15444. The context of nearby genes differs substantially between members and does point to any specific biological role.
Probab=94.68  E-value=0.16  Score=43.13  Aligned_cols=76  Identities=24%  Similarity=0.287  Sum_probs=45.6

Q ss_pred             EEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEE---------EeCCCC---------------CCeeEEEEecCCCE
Q 048097           96 SAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGF---------VTSNQL---------------NNTLIAKVLNKGDV  151 (224)
Q Consensus        96 s~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~---------v~~~~~---------------~~k~~~~~l~~GDv  151 (224)
                      .+-.+.+.+||....|.||.+     +++|..++.+         .++...               ........-++||+
T Consensus        97 ~~W~ni~~~Gg~h~~H~Hp~~-----~lSgvyYl~~p~~~g~~~f~~p~~~~~~~~~~~~~~~~~~~~~~~~v~P~~G~l  171 (201)
T TIGR02466        97 KAWVNILPQGGTHSPHLHPGS-----VISGTYYVQTPENCGAIKFEDPRLDDMMAAPMRIPNAKRAVQRFVYVPPQEGRV  171 (201)
T ss_pred             eEeEEEcCCCCccCceECCCc-----eEEEEEEEeCCCCCCceeEecCcchhhhccccccCccccccCccEEECCCCCeE
Confidence            344456789999999999975     3444444433         221100               00011123489999


Q ss_pred             EEEcCCCeeEEE-eCCCCcEEEEEEEe
Q 048097          152 FVFPIGLIHFQV-NIGKTSAVAFAGFS  177 (224)
Q Consensus       152 ~v~P~G~~H~~~-N~G~~~a~~l~~~~  177 (224)
                      ++||.-+.|... |.++++-+- .+||
T Consensus       172 vlFPS~L~H~v~p~~~~~~RIS-iSFN  197 (201)
T TIGR02466       172 LLFESWLRHEVPPNESEEERIS-VSFN  197 (201)
T ss_pred             EEECCCCceecCCCCCCCCEEE-EEEe
Confidence            999999999975 555554333 3554


No 69 
>COG1741 Pirin-related protein [General function prediction only]
Probab=94.67  E-value=0.12  Score=45.96  Aligned_cols=68  Identities=26%  Similarity=0.336  Sum_probs=52.7

Q ss_pred             EEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcC--CCeeEEEeC-C-CCcEEEE
Q 048097           99 RIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPI--GLIHFQVNI-G-KTSAVAF  173 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~--G~~H~~~N~-G-~~~a~~l  173 (224)
                      ..++.||.-++||-|.+-+=+.||++|+++-.  |+.+  |+   ..+++||+-+.-+  |+.|.-.|. . .+++..+
T Consensus        48 ~~~~~pG~~f~pHPHrg~etvTyvl~G~i~Hr--DS~G--n~---~~i~pGdvqwMTAG~GI~HSE~~~~~~~~~l~~~  119 (276)
T COG1741          48 PDVLAPGRGFPPHPHRGLETVTYVLDGEIEHR--DSLG--NK---GVIRPGDVQWMTAGSGIVHSEMNPPSTGKPLHGL  119 (276)
T ss_pred             cccccCCCcCCCCCCCCcEEEEEEEccEEEEe--ecCC--ce---eeecccceeEEcCCCceeecccCCccCCCcccee
Confidence            45688999999999988777889999998775  3332  55   7899999999986  689999987 3 3355444


No 70 
>TIGR01015 hmgA homogentisate 1,2-dioxygenase. Missing in human disease alkaptonuria.
Probab=94.63  E-value=0.31  Score=45.80  Aligned_cols=56  Identities=14%  Similarity=0.226  Sum_probs=43.7

Q ss_pred             CCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097          108 NPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus       108 ~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      ...-.+.+++|++++-+|++.+.-.-     ++   ..+++||+++||+|+.+.+.-.|  +++.+
T Consensus       140 ~~~f~NaDGD~Livpq~G~l~i~TEf-----G~---L~v~pgei~VIPRG~~frv~l~g--p~rgy  195 (429)
T TIGR01015       140 NRAFYNADGDFLIVPQQGALLITTEF-----GR---LLVEPNEICVIPRGVRFRVTVLE--PARGY  195 (429)
T ss_pred             cceeeccCCCEEEEEEeCcEEEEEec-----cc---eEecCCCEEEecCccEEEEeeCC--CceEE
Confidence            44556778999999999999886433     33   68999999999999999886554  55444


No 71 
>PF12852 Cupin_6:  Cupin
Probab=94.57  E-value=0.18  Score=41.45  Aligned_cols=43  Identities=23%  Similarity=0.387  Sum_probs=34.8

Q ss_pred             cEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097          117 TEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus       117 ~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                      .-+.+|++|+.++.+.+..    .  ...|++||++++|+|..|.+...
T Consensus        36 ~~fh~V~~G~~~l~~~~~~----~--~~~L~~GDivllp~g~~H~l~~~   78 (186)
T PF12852_consen   36 ASFHVVLRGSCWLRVPGGG----E--PIRLEAGDIVLLPRGTAHVLSSD   78 (186)
T ss_pred             eEEEEEECCeEEEEEcCCC----C--eEEecCCCEEEEcCCCCeEeCCC
Confidence            5778899999999865421    2  48999999999999999999543


No 72 
>PF14499 DUF4437:  Domain of unknown function (DUF4437); PDB: 2QDR_A.
Probab=94.38  E-value=0.037  Score=48.54  Aligned_cols=75  Identities=21%  Similarity=0.200  Sum_probs=43.1

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      +.-..+.++.|--..+|+|+ ..|=.|||+|++....-...   +   ...|.+|-.+.-|....|... .++++++++.
T Consensus       171 ~~gll~kLPagf~g~i~~h~-~~eraVvI~G~~~~~~~~~~---~---~~~L~~GSYf~s~~~~~H~~~-~~e~~~vlyI  242 (251)
T PF14499_consen  171 YTGLLLKLPAGFTGRIHTHA-SNERAVVISGELDYQSYGAS---N---FGTLDPGSYFGSPGHITHGIF-ITEDECVLYI  242 (251)
T ss_dssp             E-EEEEE-SSEE--SEEE---S-EEEEEEEEEEEETTEEEE---T---TEEEEE-TT-EE--E-------EESS-EEEEE
T ss_pred             eeeEEEEcCCCCcCceeccC-CceEEEEEEeEEEEeecccC---C---CccccCCcccccCCccccccc-ccCCCEEEEE
Confidence            44555667777778999998 68999999999998643221   2   279999999999999999998 7788888886


Q ss_pred             EEe
Q 048097          175 GFS  177 (224)
Q Consensus       175 ~~~  177 (224)
                      -.+
T Consensus       243 Rtd  245 (251)
T PF14499_consen  243 RTD  245 (251)
T ss_dssp             EES
T ss_pred             EEC
Confidence            544


No 73 
>PF07847 DUF1637:  Protein of unknown function (DUF1637);  InterPro: IPR012864 This entry represents cysteamine dioxygenase, which is a non-heme iron protein that is involved in the biosynthesis of taurine. Requires catalytic amounts of a cofactor-like compound, such as sulphur, sulphide, selenium or methylene blue for maximal activity. 3-Aminopropanethiol (homocysteamine) and 2-mercaptoethanol can also act as substrates, but glutathione, cysteine, and cysteine ethyl- and methyl esters are not good substrates [, ]. ; GO: 0047800 cysteamine dioxygenase activity, 0055114 oxidation-reduction process
Probab=94.21  E-value=0.28  Score=41.63  Aligned_cols=88  Identities=19%  Similarity=0.144  Sum_probs=62.6

Q ss_pred             ccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCC---C----CCeeEEE------Ee-cCCC-EEEE
Q 048097           90 LNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQ---L----NNTLIAK------VL-NKGD-VFVF  154 (224)
Q Consensus        90 L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~---~----~~k~~~~------~l-~~GD-v~v~  154 (224)
                      .+...+++...-+.+|..+|+|=||+-+-+.-|+.|++.+.-.+--.   .    +.+....      ++ .+++ .+..
T Consensus        39 yE~~~fsi~iF~lp~g~~IPLHDHP~M~v~sKvL~Gs~~v~Syd~~~~~~~~~~~~~~~~~a~~~~d~~~~a~~~~~vL~  118 (200)
T PF07847_consen   39 YEDEDFSIGIFCLPPGAVIPLHDHPGMTVLSKVLYGSLHVKSYDWVDEPSDSIEGQRQPRLARLVVDGEMTAPSDTCVLY  118 (200)
T ss_pred             EECCCcEEEEEEeCCCCEeCCCCCCchHhhHhhEeeeEEEEEccccccccccccccccceeeEEEecceecCCCCCeEEc
Confidence            45557899999999999999999999888888999999996543210   0    0011111      12 3334 5566


Q ss_pred             cC--CCeeEEEeCCCCcEEEEEEEeC
Q 048097          155 PI--GLIHFQVNIGKTSAVAFAGFSS  178 (224)
Q Consensus       155 P~--G~~H~~~N~G~~~a~~l~~~~s  178 (224)
                      |.  |-+|.+.+.+ +++.++-++..
T Consensus       119 P~~ggNiH~f~a~~-~p~AflDIL~P  143 (200)
T PF07847_consen  119 PTSGGNIHEFTALT-GPCAFLDILAP  143 (200)
T ss_pred             cCCCCeeEEEEeCC-CCeEEEEEccC
Confidence            65  4899999987 88999988863


No 74 
>PRK12335 tellurite resistance protein TehB; Provisional
Probab=94.20  E-value=0.24  Score=43.79  Aligned_cols=62  Identities=16%  Similarity=0.079  Sum_probs=47.2

Q ss_pred             cCCCcCCCccC-CCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecC-CCEEEEcCCCeeEEEeCC
Q 048097          103 APYGQNPPHTH-PRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNK-GDVFVFPIGLIHFQVNIG  166 (224)
Q Consensus       103 ~pgg~~ppH~H-p~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~-GDv~v~P~G~~H~~~N~G  166 (224)
                      -|++.+.+|.| +...|.+.|++|++.+.+.++.+  .......+.+ ++.-++|++..|.+.-..
T Consensus        19 ~p~~~~~~H~t~~g~~~~~~vl~G~l~~~~~de~g--~~~~~~~l~~~~~~~~i~p~~wh~v~~~s   82 (287)
T PRK12335         19 LPEMFQEKHNTKEGTWAKLTVLKGELKFYELTEDG--EELSEHIFDAENQPPFIEPQAWHRIEAAS   82 (287)
T ss_pred             chHHHHhccCCCCCcceEEEEEeeeEEEEEECCCC--CeeeEEEEecCCCCceeCCcceEEEEEcC
Confidence            37788999999 56679999999999998877652  3444455655 456679999999998653


No 75 
>PRK00924 5-keto-4-deoxyuronate isomerase; Provisional
Probab=93.89  E-value=0.4  Score=42.64  Aligned_cols=82  Identities=18%  Similarity=0.205  Sum_probs=54.9

Q ss_pred             ceEEEEEEEcCCC---cCCCccCCCCcEEEE---EEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097           94 GTSAVRIDYAPYG---QNPPHTHPRATEILV---VLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus        94 gis~~~v~l~pgg---~~ppH~Hp~a~Ei~~---Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      .+-+....+.|||   .-|||.|.+..|..+   +-++.--+++..+-   ++.+...++-+|+++.|+-.+|.-  .|.
T Consensus       174 qLlmG~tvltPGg~WSSyPPHkHDrr~E~YlYf~l~~~qrV~h~mG~p---dETrh~~v~n~~aVisP~wsih~g--~gt  248 (276)
T PRK00924        174 QLVMGLTELEPGSVWNTMPCHTHDRRMEVYFYFDMPEDARVFHFMGEP---QETRHIVVHNEQAVISPSWSIHSG--VGT  248 (276)
T ss_pred             cEEEEEEEEcCCCCCCCCCCccCCCCcceEEEEEcCCCceEEecCCCc---cceeeEEEECCCEEECCCcceecC--cCc
Confidence            4667767789999   369999997777554   22222222332221   333347899999999999999987  456


Q ss_pred             CcEEEEEEEeCCC
Q 048097          168 TSAVAFAGFSSQF  180 (224)
Q Consensus       168 ~~a~~l~~~~s~~  180 (224)
                      ..-.||++..-+|
T Consensus       249 ~~y~fiw~m~gen  261 (276)
T PRK00924        249 SNYTFIWGMAGEN  261 (276)
T ss_pred             cccEEEEEecccC
Confidence            6667777765554


No 76 
>PF02373 JmjC:  JmjC domain, hydroxylase;  InterPro: IPR013129 Jumonji protein is required for neural tube formation in mice [].There is evidence of domain swapping within the jumonji family of transcription factors []. This domain is often associated with jmjN (see IPR003349 from INTERPRO) and belongs to the Cupin superfamily [].; PDB: 2YU2_A 2YU1_A 3AVR_A 3AVS_A 2OX0_B 2OQ6_B 2WWJ_A 2Q8D_A 3PDQ_A 2YBK_A ....
Probab=93.84  E-value=0.13  Score=38.29  Aligned_cols=30  Identities=23%  Similarity=0.368  Sum_probs=22.4

Q ss_pred             CeeEEEEecCCCEEEEcCCCeeEEEeCCCC
Q 048097          139 NTLIAKVLNKGDVFVFPIGLIHFQVNIGKT  168 (224)
Q Consensus       139 ~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~  168 (224)
                      -+.++.+-++||.+++|+|..|+..|.|..
T Consensus        78 i~~~~~~Q~~Ge~V~i~pg~~H~v~n~g~~  107 (114)
T PF02373_consen   78 IPVYRFVQKPGEFVFIPPGAYHQVFNLGDN  107 (114)
T ss_dssp             S--EEEEEETT-EEEE-TT-EEEEEESSSE
T ss_pred             cccccceECCCCEEEECCCceEEEEeCCce
Confidence            356678899999999999999999999964


No 77 
>PF05118 Asp_Arg_Hydrox:  Aspartyl/Asparaginyl beta-hydroxylase;  InterPro: IPR007803 The alpha-ketoglutarate-dependent dioxygenase aspartyl (asparaginyl) beta-hydroxylase (1.14.11.16 from EC) specifically hydroxylates one aspartic or asparagine residue in certain epidermal growth factor-like domains of a number of proteins. Its action may be due to histidine-675, which, when mutated to an alanine residue, causes the loss of enzymatic activity in the protein [].  An invertebrate alpha-ketoglutarate-dependent aspartyl/asparaginyl beta-hydroxylase, which posttranslationally hydroxylates specific aspartyl or asparaginyl residues within epidermal growth factor-like modules [], activity was found to be similar to that of the purified mammalian aspartyl/asparaginyl beta-hydroxylase with respect to cofactor requirements, stereochemistry and substrate sequence specificity []. This enzyme requires Fe2+ as a cofactor. Some vitamin K-dependent coagulation factors, as well as synthetic peptides based on the structure of the first epidermal growth factor domain of human coagulation factor IX or X, can act as acceptors.; GO: 0018193 peptidyl-amino acid modification, 0030176 integral to endoplasmic reticulum membrane; PDB: 3RCQ_A 1E5S_A 1E5R_B.
Probab=93.75  E-value=0.19  Score=40.93  Aligned_cols=82  Identities=20%  Similarity=0.299  Sum_probs=46.0

Q ss_pred             cccCcccc-cce-EEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeC-CC----CCCeeEEEEecCCCEEEEcCC
Q 048097           85 EQIPGLNT-LGT-SAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTS-NQ----LNNTLIAKVLNKGDVFVFPIG  157 (224)
Q Consensus        85 ~~~p~L~~-lgi-s~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~-~~----~~~k~~~~~l~~GDv~v~P~G  157 (224)
                      +++|...+ ..+ .+....+.||+.+.||.-+....+-      +.+++..+ .+    -+++  ....++|++++|--.
T Consensus        68 ~~lp~~~~~~~~~~~~~s~l~pg~~I~pH~d~~~~~lR------~Hl~L~~p~~~~~~~v~~~--~~~w~~G~~~~fD~s  139 (163)
T PF05118_consen   68 EQLPGVTGGCPLGRVRFSRLPPGTHIKPHRDPTNLRLR------LHLPLIVPNPGCYIRVGGE--TRHWREGECWVFDDS  139 (163)
T ss_dssp             CCSHHHHCSTTCEEEEEEEEECTEEEEEE-SS-TTEEE------EEEEEC--STTEEEEETTE--EEB--CTEEEEE-TT
T ss_pred             HhCcccccccchhhEEEEEECCCCEECCeeCCCCcceE------EEEEEEcCCCCeEEEECCe--EEEeccCcEEEEeCC
Confidence            45555443 223 3444577999999999887433321      22222222 10    0133  467899999999999


Q ss_pred             CeeEEEeCCCCcEEEEE
Q 048097          158 LIHFQVNIGKTSAVAFA  174 (224)
Q Consensus       158 ~~H~~~N~G~~~a~~l~  174 (224)
                      ..|...|.|+++-+.+.
T Consensus       140 ~~H~~~N~~~~~Rv~L~  156 (163)
T PF05118_consen  140 FEHEVWNNGDEDRVVLI  156 (163)
T ss_dssp             S-EEEEESSSS-EEEEE
T ss_pred             EEEEEEeCCCCCEEEEE
Confidence            99999999988765553


No 78 
>KOG3706 consensus Uncharacterized conserved protein [Function unknown]
Probab=93.59  E-value=0.047  Score=51.79  Aligned_cols=91  Identities=21%  Similarity=0.285  Sum_probs=59.1

Q ss_pred             CCCeeEEEccccccCc--------cccc-c-eEEEEEEEcC-CC-cCCCccCCCCcEEEEEEecEEEEEEEeCCC-----
Q 048097           74 RLGFNVTNANVEQIPG--------LNTL-G-TSAVRIDYAP-YG-QNPPHTHPRATEILVVLEGTLYVGFVTSNQ-----  136 (224)
Q Consensus        74 ~~g~~v~~~~~~~~p~--------L~~l-g-is~~~v~l~p-gg-~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~-----  136 (224)
                      ..|-++...+.+.|-.        |... | +--+-+.+.| |+ -.+|||-. -.-+++-++|+=+..+..+..     
T Consensus       285 q~~cSiqllnPqty~drlwq~cevlqeqFgc~vGaNvYLTPagSqGfaPHyDd-IeaFvlQvEGrK~Wrly~P~~~~eel  363 (629)
T KOG3706|consen  285 QKGCSIQLLNPQTYKDRLWQICEVLQEQFGCLVGANVYLTPAGSQGFAPHYDD-IEAFVLQVEGRKHWRLYHPTVPLEEL  363 (629)
T ss_pred             hcCceEEeeCchhHHHHHHHHHHHHHHHhccccccceeecCCCCCCCCCchhh-hhhhhheeccceeeEeecCCCcHhhh
Confidence            4566777777766532        0000 1 1223355555 43 48999984 566777899987776654430     


Q ss_pred             ------------CCCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097          137 ------------LNNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus       137 ------------~~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                                  -|..++...|++||+++||+|.+|.....
T Consensus       364 ~l~sS~Nf~eedlgePV~e~vle~GDllYfPRG~IHQA~t~  404 (629)
T KOG3706|consen  364 ALVSSDNFTEEDLGEPVHEFVLEPGDLLYFPRGTIHQADTP  404 (629)
T ss_pred             hhccCCCCChhHhCCchHHhhcCCCcEEEecCcceeecccc
Confidence                        03456678999999999999999987543


No 79 
>PRK10572 DNA-binding transcriptional regulator AraC; Provisional
Probab=93.35  E-value=0.29  Score=42.77  Aligned_cols=44  Identities=23%  Similarity=0.220  Sum_probs=35.4

Q ss_pred             CcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          116 ATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       116 a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      +-++.++++|++.+...      ++  ...+++||++++|+|.+|......+
T Consensus        49 ~~~i~~~~~G~~~~~~~------~~--~~~~~~g~~i~i~p~~~h~~~~~~~   92 (290)
T PRK10572         49 GYILNLTIRGQGVIFNG------GR--AFVCRPGDLLLFPPGEIHHYGRHPD   92 (290)
T ss_pred             ceEEEEEEeccEEEecC------Ce--eEecCCCCEEEECCCCceeeccCCC
Confidence            46889999999998642      33  4899999999999999998765443


No 80 
>PRK09685 DNA-binding transcriptional activator FeaR; Provisional
Probab=92.13  E-value=1.1  Score=39.10  Aligned_cols=66  Identities=12%  Similarity=0.053  Sum_probs=45.5

Q ss_pred             ceEEEEEEEcCCCcC-----CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097           94 GTSAVRIDYAPYGQN-----PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus        94 gis~~~v~l~pgg~~-----ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      ++.+.++...+..+.     ..|.+.+.-.++++++|++.+...      ++  ...+++||++++|.+.+|.+.-.+.
T Consensus        44 ~~~l~~~~~~~~~~~R~~~~i~~~~~~~~~l~~~~~G~~~~~~~------g~--~~~l~~G~~~l~~~~~p~~~~~~~~  114 (302)
T PRK09685         44 GLKLSTVTTNAVNLSRTWQEIKHSDDAHFFTVFQLSGHAIIEQD------DR--QVQLAAGDITLIDASRPCSIYPQGL  114 (302)
T ss_pred             CEEEEEEecCCceEEeChHHhccCCCCcEEEEEEecceEEEEEC------Ce--EEEEcCCCEEEEECCCCcEeecCCC
Confidence            456666666654321     234444445677889999988753      33  4789999999999999998765443


No 81 
>KOG3995 consensus 3-hydroxyanthranilate oxygenase HAAO [Amino acid transport and metabolism]
Probab=91.41  E-value=0.34  Score=41.58  Aligned_cols=57  Identities=18%  Similarity=0.377  Sum_probs=47.1

Q ss_pred             cCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097          103 APYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus       103 ~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      .|+..---|..+ ..|++|-.+|.....+++.    ++....++++||++..|..++|.-+-
T Consensus        41 GPN~RkdyHiee-geE~FyQ~KGdMvLKVie~----g~~rDivI~qGe~flLParVpHSPqR   97 (279)
T KOG3995|consen   41 GPNTRKDYHIEE-GEEVFYQLKGDMVLKVLEQ----GKHRDVVIRQGEIFLLPARVPHSPQR   97 (279)
T ss_pred             CCCcccccccCC-cchhheeecCceEEeeecc----CcceeeEEecCcEEEeccCCCCChhh
Confidence            455556778887 7999999999999998876    45557889999999999999998643


No 82 
>COG5553 Predicted metal-dependent enzyme of the double-stranded beta helix superfamily [General function prediction only]
Probab=91.24  E-value=1  Score=37.19  Aligned_cols=77  Identities=25%  Similarity=0.276  Sum_probs=48.9

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEe--CC----CCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCC
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVT--SN----QLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKT  168 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~--~~----~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~  168 (224)
                      +++..+++.||...|+|-|- -.-++=|+.|.-+-.+..  ..    ++ ..  .+...+|++-.-| |.+|...|+|..
T Consensus        73 ltV~~~t~~PG~~~p~HnH~-~wglVgil~G~E~n~~y~~~~~~~~~P~-~q--dk~~apgeV~lSp-gdihsv~n~~sd  147 (191)
T COG5553          73 LTVYHITLSPGVQYPPHNHL-MWGLVGILWGGETNFIYPLAGEEVDEPE-RQ--DKFAAPGEVHLSP-GDIHSVANTGSD  147 (191)
T ss_pred             EEEEEEEeCCCcccCCcccc-hheeeeeeecccccceecccCCCCCCcc-hh--hhhcCcceEeeCC-CCeeeecccCCC
Confidence            58899999999999999994 677777888854433221  11    11 11  2456677777333 777777777665


Q ss_pred             cEEEEEEE
Q 048097          169 SAVAFAGF  176 (224)
Q Consensus       169 ~a~~l~~~  176 (224)
                      ....|-++
T Consensus       148 rs~aiHvy  155 (191)
T COG5553         148 RSGAIHVY  155 (191)
T ss_pred             ccceEEEE
Confidence            44444444


No 83 
>COG3806 ChrR Transcriptional activator [Transcription]
Probab=91.21  E-value=0.75  Score=39.02  Aligned_cols=85  Identities=20%  Similarity=0.201  Sum_probs=63.8

Q ss_pred             CCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           75 LGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        75 ~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      .|.++..+...+     .-..+++++.+.||..+|-|+|- +-|.+.|++|..    .+++        -.+-+||...-
T Consensus       113 ~G~rv~~v~l~~-----dds~~V~llki~~g~s~P~HtH~-G~E~t~vl~G~~----sde~--------G~y~vgD~~~~  174 (216)
T COG3806         113 PGGRVEPVRLPT-----DDSRRVALLKIEPGRSFPDHTHV-GIERTAVLEGAF----SDEN--------GEYLVGDFTLA  174 (216)
T ss_pred             CCcceeecccCC-----CCCceeEEEEeccCccccccccc-ceEEEEEEeecc----ccCC--------CccccCceeec
Confidence            455555443322     22578999999999999999996 799999999975    4444        26788999999


Q ss_pred             cCCCeeEEEeCCCCcEEEEEEEe
Q 048097          155 PIGLIHFQVNIGKTSAVAFAGFS  177 (224)
Q Consensus       155 P~G~~H~~~N~G~~~a~~l~~~~  177 (224)
                      +.+.-|.-.-...++...++++.
T Consensus       175 d~~v~H~piv~~~~eClcl~al~  197 (216)
T COG3806         175 DGTVQHSPIVLPPGECLCLAALD  197 (216)
T ss_pred             CCccccccccCCCCCceEEEEcC
Confidence            99999986555566777777764


No 84 
>PF05726 Pirin_C:  Pirin C-terminal cupin domain;  InterPro: IPR008778 This entry represents C-terminal domain of Pirin proteins from both eukaryotes and prokaryotes. The function of Pirin is unknown but the gene coding for this protein is known to be expressed in all tissues in the human body although it is expressed most strongly in the liver and heart. Pirin is known to be a nuclear protein, exclusively localised within the nucleoplasma and predominantly concentrated within dot-like subnuclear structures []. Pirin is composed of two structurally similar domains arranged face to face. The N-terminal domain additionally features four beta-strands, and the C-terminal domain also includes four additional -strands and a short alpha-helix. Although the two domains are similar, the C-terminal domain of Pirin differs from the N-terminal domain as it does not contain a metal binding site and its sequence does not contain the conserved metal-coordinating residues [].  Pirin is confirmed to be a member of the cupin superfamily on the basis of primary sequence and structural similarity. The presence of a metal binding site in the N-terminal beta-barrel of Pirin, may be significant in its role in regulating NFI DNA replication and NF-kappaB transcription factor activity []. Pirin structure has been found to closely resemble members of the cupin superfamily. Pirin contains the two characteristic sequences of the cupin superfamily, namely PG-(X)5-HXH-(X)4-E-(X)6-G and G-(X)5-PXG-(X)2-H-(X)3-N separated by a variable stretch of 15-50 amino acids. These motifs are best conserved in the N-terminal where the conserved histidine and glutamic acid residues correspond to the metal-coordinating residues. The C-terminal domain motifs lack the metal binding residues normally associated with the cupin fold [].  Pirin was identified to be a metal-binding protein [], and was found that the metal-binding residues of Pirins are highly conserved across mammals, plants, fungi, and prokaryotic organisms. Pirin acts as a cofactor for the transcription factor NFI, the regulatory mechanism of which is generally believed to require the assistance of a metal ion []. Structural data supports the hypothesis that the bound iron of Pirin may participate in this transcriptional regulation by enhancing and stabilising the formation of the p50,Bcl3,DNA complex []. Metals have been implicated directly or indirectly in the NF-kappaB family of transcription factors that control expression of a number of early response genes associated with inflammatory responses, cell growth, cell cycle progression, and neoplastic transformation []. However, most metal-dependent transcription factors are DNA-binding proteins that bind to specific sequences when the metal binds to the protein. Pirin, on the other hand, appears to function differently and bind to the transcription factor DNA complex [].; PDB: 1J1L_A 3ACL_A 2P17_A.
Probab=91.14  E-value=0.91  Score=34.07  Aligned_cols=67  Identities=21%  Similarity=0.187  Sum_probs=42.3

Q ss_pred             EEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEE
Q 048097           97 AVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFA  174 (224)
Q Consensus        97 ~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~  174 (224)
                      +..+.++||+.......+...-++||++|++.+.   .    .+   ..+.+|+++++..|..=.+.+.+ +.+.++.
T Consensus         1 y~di~l~~g~~~~~~~~~~~~~~iyv~~G~~~v~---~----~~---~~~~~~~~~~l~~g~~i~~~a~~-~~a~~ll   67 (104)
T PF05726_consen    1 YLDIKLEPGASFTLPLPPGHNAFIYVLEGSVEVG---G----EE---DPLEAGQLVVLEDGDEIELTAGE-EGARFLL   67 (104)
T ss_dssp             EEEEEE-TT-EEEEEEETT-EEEEEEEESEEEET---T----TT---EEEETTEEEEE-SECEEEEEESS-SSEEEEE
T ss_pred             CEEEEECCCCEEEeecCCCCEEEEEEEECcEEEC---C----Cc---ceECCCcEEEECCCceEEEEECC-CCcEEEE
Confidence            3567889998654333334567899999998663   1    22   57899999999966555555543 6666653


No 85 
>COG3508 HmgA Homogentisate 1,2-dioxygenase [Secondary metabolites biosynthesis, transport, and catabolism]
Probab=91.07  E-value=2.9  Score=38.56  Aligned_cols=73  Identities=12%  Similarity=0.067  Sum_probs=50.3

Q ss_pred             cceEEEEEEEcCCCcC-CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEE
Q 048097           93 LGTSAVRIDYAPYGQN-PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAV  171 (224)
Q Consensus        93 lgis~~~v~l~pgg~~-ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~  171 (224)
                      .|+.+..-.+. -+|. -.-+..+.+|++++-+|++++--.-     +   ..++++||+.+||+|.....+-.+.+ +.
T Consensus       123 ~g~~i~~y~~n-~sm~~~~f~NADge~Livpq~G~l~l~te~-----G---~l~v~pgeiavIPRG~~frve~~~~~-~r  192 (427)
T COG3508         123 DGVAIHVYKVN-ESMTKRFFRNADGELLIVPQQGELRLKTEL-----G---VLEVEPGEIAVIPRGTTFRVELKDGE-AR  192 (427)
T ss_pred             CceEEEEEEcc-ccchhhhhhcCCCCEEEEeecceEEEEEee-----c---eEEecCCcEEEeeCCceEEEEecCCc-eE
Confidence            35554433333 3444 5557788899999999999885432     2   37899999999999999888765444 44


Q ss_pred             EEEE
Q 048097          172 AFAG  175 (224)
Q Consensus       172 ~l~~  175 (224)
                      .+..
T Consensus       193 gy~~  196 (427)
T COG3508         193 GYGC  196 (427)
T ss_pred             EEEE
Confidence            4433


No 86 
>PF06865 DUF1255:  Protein of unknown function (DUF1255);  InterPro: IPR009664 This family consists of several conserved hypothetical bacterial proteins of around 95 residues in length. The function of this family is unknown; PDB: 2OYZ_A 3HQX_A.
Probab=90.79  E-value=2.3  Score=31.87  Aligned_cols=44  Identities=20%  Similarity=0.203  Sum_probs=33.1

Q ss_pred             CCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097          115 RATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus       115 ~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      .+.|++-|++|++++.+-+++    .  ++.+++|+.|.+|++.---++-
T Consensus        40 ~~~E~M~vvsG~l~V~lpg~~----e--w~~~~aGesF~VpanssF~v~v   83 (94)
T PF06865_consen   40 SAPERMEVVSGELEVKLPGED----E--WQTYSAGESFEVPANSSFDVKV   83 (94)
T ss_dssp             SS-EEEEEEESEEEEEETT-S----S---EEEETT-EEEE-TTEEEEEEE
T ss_pred             CCCEEEEEEEeEEEEEcCCCc----c--cEEeCCCCeEEECCCCeEEEEE
Confidence            468999999999999986443    2  6899999999999998877765


No 87 
>PRK10579 hypothetical protein; Provisional
Probab=90.30  E-value=2.6  Score=31.60  Aligned_cols=44  Identities=23%  Similarity=0.228  Sum_probs=36.8

Q ss_pred             CCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097          115 RATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus       115 ~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      .+.|++-|++|++++.+-+++    .  ++.+++|+.|-+|.+.-.-++.
T Consensus        40 ~~~E~MeivsG~l~V~Lpg~~----e--w~~~~aG~sF~VpanssF~l~v   83 (94)
T PRK10579         40 AEPEEMTVISGALNVLLPGAT----D--WQVYEAGEVFNVPGHSEFHLQV   83 (94)
T ss_pred             CCcEEEEEEeeEEEEECCCCc----c--cEEeCCCCEEEECCCCeEEEEE
Confidence            478999999999999886543    2  6899999999999998777654


No 88 
>PRK15131 mannose-6-phosphate isomerase; Provisional
Probab=90.12  E-value=1.8  Score=40.36  Aligned_cols=59  Identities=14%  Similarity=0.084  Sum_probs=41.8

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      .+.+.++++..+..   ++..+..++++|++|++++..  .    +.  +..|++|+++++|++......
T Consensus       320 ~F~~~~~~l~~~~~---~~~~~~~~Illv~~G~~~i~~--~----~~--~~~l~~G~~~fipa~~~~~~~  378 (389)
T PRK15131        320 DFAFSLHDLSDQPT---TLSQQSAAILFCVEGEAVLWK--G----EQ--QLTLKPGESAFIAANESPVTV  378 (389)
T ss_pred             CcEEEEEEECCceE---EecCCCcEEEEEEcceEEEEe--C----Ce--EEEECCCCEEEEeCCCccEEE
Confidence            46677777765422   222246799999999999852  2    22  378999999999998877665


No 89 
>PF09313 DUF1971:  Domain of unknown function (DUF1971);  InterPro: IPR015392 This uncharacterised domain is predominantly found in bacterial Tellurite resistance proteins. ; PDB: 3BB6_C 3M70_A 3DL3_I.
Probab=89.89  E-value=5.8  Score=28.88  Aligned_cols=63  Identities=17%  Similarity=0.052  Sum_probs=43.0

Q ss_pred             CCCcCCCccCCCC-cEEEEEEecEEEEEEEeCCCCCCe-eEEEEecCCCEEEEcCCCeeEEEeCCCC
Q 048097          104 PYGQNPPHTHPRA-TEILVVLEGTLYVGFVTSNQLNNT-LIAKVLNKGDVFVFPIGLIHFQVNIGKT  168 (224)
Q Consensus       104 pgg~~ppH~Hp~a-~Ei~~Vl~G~~~v~~v~~~~~~~k-~~~~~l~~GDv~v~P~G~~H~~~N~G~~  168 (224)
                      |.++...|.-..+ -..+.|++|++.+...++.+  +. .....+.+|+..++++...|.+.-.+++
T Consensus        12 P~~l~~~H~TK~GtWg~l~Vl~G~L~f~~~~~~~--~~~~~~~~~~~~~~~~i~Pq~wH~V~p~s~D   76 (82)
T PF09313_consen   12 PAALLERHNTKAGTWGKLRVLEGELKFYGLDEEG--EEPEEEVFIPAGQPPVIEPQQWHRVEPLSDD   76 (82)
T ss_dssp             -GGGGSSBCCSTTEEEEEEEEESEEEEEEESSTT---SESEEEEEETTEEEEE-TT-EEEEEESSTT
T ss_pred             cHHHHhhcCCCCCeEEEEEEEeeEEEEEEECCCC--CceeEEEEeCCCCCceeCCCceEEEEECCCC
Confidence            3455666644332 25677999999998887642  22 2246789999999999999999877664


No 90 
>KOG2757 consensus Mannose-6-phosphate isomerase [Carbohydrate transport and metabolism]
Probab=88.47  E-value=2.4  Score=39.16  Aligned_cols=75  Identities=17%  Similarity=0.201  Sum_probs=51.1

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      .+++.+++++.|..--.-.- +..-++.|++|++++.-.+.    .   ...+++|||++||+...-.+ +..+++...+
T Consensus       332 eF~v~~~~v~~g~~~~~~~~-~~~SIllv~~G~g~l~~~t~----~---~~~v~rG~V~fI~a~~~i~~-~~~sd~~~~y  402 (411)
T KOG2757|consen  332 EFAVLETKVPTGESYKFPGV-DGPSILLVLKGSGILKTDTD----S---KILVNRGDVLFIPANHPIHL-SSSSDPFLGY  402 (411)
T ss_pred             ceeEEEeecCCCceEEeecC-CCceEEEEEecceEEecCCC----C---ceeeccCcEEEEcCCCCcee-eccCcceeee
Confidence            56788888888664222222 36789999999999975421    2   37899999999999876644 3445555555


Q ss_pred             EEEe
Q 048097          174 AGFS  177 (224)
Q Consensus       174 ~~~~  177 (224)
                      -+|.
T Consensus       403 rAf~  406 (411)
T KOG2757|consen  403 RAFS  406 (411)
T ss_pred             eccc
Confidence            4443


No 91 
>COG3822 ABC-type sugar transport system, auxiliary component [General function prediction only]
Probab=88.34  E-value=2.3  Score=35.98  Aligned_cols=80  Identities=24%  Similarity=0.199  Sum_probs=48.3

Q ss_pred             EEEEcCCCcCCCccCCCCcEEEEEE-ecEEEEEEEeCC--C------------CCCeeE-----EEEecCCCEEEEcCCC
Q 048097           99 RIDYAPYGQNPPHTHPRATEILVVL-EGTLYVGFVTSN--Q------------LNNTLI-----AKVLNKGDVFVFPIGL  158 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp~a~Ei~~Vl-~G~~~v~~v~~~--~------------~~~k~~-----~~~l~~GDv~v~P~G~  158 (224)
                      .+.+.+|.+.|.|.|++-.|=++=- .|++.+.+....  .            .|.+..     ...|+||+.+-+|+|+
T Consensus        90 iM~vr~gQvtPmHrH~~k~eDiinrgggtlv~el~~~d~~~~~~~ks~vtv~~dg~r~~~~ag~~lkL~PGesitL~Pg~  169 (225)
T COG3822          90 IMHVRPGQVTPMHRHWRKPEDIINRGGGTLVVELWNVDLVEGQDEKSDVTVPVDGCRQTHTAGSQLKLSPGESITLPPGL  169 (225)
T ss_pred             eEEeccCCcCcccccccchhhhhhcCCceEEEEEeccccccCcCCCCCeEecCCCcEEEeccceeEEECCCCcEecCCCc
Confidence            3566789999999999755544322 233444332111  0            011110     2579999999999999


Q ss_pred             eeEEEeCCCCcEEEEEEEeCCC
Q 048097          159 IHFQVNIGKTSAVAFAGFSSQF  180 (224)
Q Consensus       159 ~H~~~N~G~~~a~~l~~~~s~~  180 (224)
                      .|++..-+..  +++.-.++-|
T Consensus       170 ~HsFwae~g~--vlvgEvSsvn  189 (225)
T COG3822         170 YHSFWAEEGG--VLVGEVSSVN  189 (225)
T ss_pred             eeeeeecCCc--EEEEEEeecc
Confidence            9999865443  4444444433


No 92 
>COG3257 GlxB Uncharacterized protein, possibly involved in glyoxylate utilization [General function prediction only]
Probab=88.09  E-value=2.2  Score=36.92  Aligned_cols=72  Identities=17%  Similarity=0.075  Sum_probs=54.5

Q ss_pred             ccceEEEEEEEcCCCcCCC-ccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcE
Q 048097           92 TLGTSAVRIDYAPYGQNPP-HTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSA  170 (224)
Q Consensus        92 ~lgis~~~v~l~pgg~~pp-H~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a  170 (224)
                      ..++-+..+.++||+.+|- -+|- -+-=+|||||++...+..      .  ...+++||.+..-+-.+.+.+.-|....
T Consensus       179 r~Dmhv~ivsFePGa~ip~aEtHv-mEHGlyvLeGk~vYrLn~------d--wv~V~aGD~mwm~A~cpQacyagG~g~f  249 (264)
T COG3257         179 RFDMHVHIVSFEPGASIPYAETHV-MEHGLYVLEGKGVYRLNN------N--WVPVEAGDYIWMGAYCPQACYAGGRGAF  249 (264)
T ss_pred             CcceEEEEEEecCCcccchhhhhh-hhcceEEEecceEEeecC------c--eEEeecccEEEeeccChhhhccCCCCce
Confidence            3478889999999998754 2332 233489999999887642      2  5799999999999999999888777644


Q ss_pred             EE
Q 048097          171 VA  172 (224)
Q Consensus       171 ~~  172 (224)
                      ..
T Consensus       250 rY  251 (264)
T COG3257         250 RY  251 (264)
T ss_pred             EE
Confidence            33


No 93 
>PLN02288 mannose-6-phosphate isomerase
Probab=87.40  E-value=2  Score=40.22  Aligned_cols=58  Identities=19%  Similarity=0.237  Sum_probs=40.1

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCC
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGL  158 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~  158 (224)
                      .+++.++++.++.......+ +..++++|++|++++...  +   +. ....|++|+++++|++.
T Consensus       333 eF~v~~~~l~~~~~~~~~~~-~gp~Illv~~G~~~i~~~--~---~~-~~~~l~~G~~~fv~a~~  390 (394)
T PLN02288        333 EFEVDHCDVPPGASVVFPAV-PGPSVFLVIEGEGVLSTG--S---SE-DGTAAKRGDVFFVPAGT  390 (394)
T ss_pred             ceEEEEEEeCCCCeEeecCC-CCCEEEEEEcCEEEEecC--C---cc-ceEEEeceeEEEEeCCC
Confidence            57888888887753222112 367999999999998532  1   11 12569999999999864


No 94 
>TIGR00218 manA mannose-6-phosphate isomerase, class I. The names phosphomannose isomerase and mannose-6-phosphate isomerase are synonomous. This family contains two rather deeply branched groups. One group contains an experimentally determined phosphomannose isomerase of Streptococcus mutans as well as three uncharacterized paralogous proteins of Bacillus subtilis, all at more than 50 % identity to each other, plus a more distant homolog from Archaeoglobus fulgidus. The other group contains members from E. coli, budding yeast, Borrelia burgdorferi, etc.
Probab=87.34  E-value=3.5  Score=36.79  Aligned_cols=60  Identities=25%  Similarity=0.266  Sum_probs=42.5

Q ss_pred             cceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097           93 LGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus        93 lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      -.+++.++++.......  .+ ....+++|++|++++..  .    +.  +..|++|+.+++|++.-....
T Consensus       233 ~~F~~~~~~~~~~~~~~--~~-~~~~il~v~~G~~~i~~--~----~~--~~~l~~G~~~~ipa~~~~~~i  292 (302)
T TIGR00218       233 EYFSVYKWDISGKAEFI--QQ-QSALILSVLEGSGRIKS--G----GK--TLPLKKGESFFIPAHLGPFTI  292 (302)
T ss_pred             CCeEEEEEEeCCceeec--cC-CCcEEEEEEcceEEEEE--C----CE--EEEEecccEEEEccCCccEEE
Confidence            35778888876442111  22 36789999999998853  2    22  478999999999999876654


No 95 
>PRK09391 fixK transcriptional regulator FixK; Provisional
Probab=86.25  E-value=8.2  Score=32.62  Aligned_cols=124  Identities=17%  Similarity=0.130  Sum_probs=74.5

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      +.......+++|..+-..=.+ ...+.+|++|.+.+...++++  ++.....+.+||++-+..+..+...-.-.++..++
T Consensus        35 ~~~~~~~~~~kge~l~~~Gd~-~~~ly~I~~G~vkl~~~~~~G--~e~i~~~~~~Gd~fG~~~~~~~~~~~~A~~ds~v~  111 (230)
T PRK09391         35 GLVASEFSYKKGEEIYGEGEP-ADYVYQVESGAVRTYRLLSDG--RRQIGAFHLPGDVFGLESGSTHRFTAEAIVDTTVR  111 (230)
T ss_pred             cceeeeEEECCCCEEECCCCC-CCeEEEEEeCEEEEEEECCCC--cEEEEEEecCCceecccCCCcCCeEEEEcCceEEE
Confidence            556677788888865433233 578999999999998877663  44455667999988766554433222223344443


Q ss_pred             EEEe--------CCCCceee----------------------------chhhhh------cC----CCCCCHHHHHhhcC
Q 048097          174 AGFS--------SQFPGVIT----------------------------IADTVF------GA----NPPINPDFLGKAFQ  207 (224)
Q Consensus       174 ~~~~--------s~~pg~~~----------------------------~~~~lf------~~----~p~~p~~vLa~af~  207 (224)
                       .+.        ..+|....                            ++..|.      +.    ..+++.+-||..+|
T Consensus       112 -~i~~~~f~~l~~~~p~l~~~l~~~l~~~l~~~~~~~~~l~~~~~~~Rla~~Ll~l~~~~g~~~~i~i~lt~~~IA~~lG  190 (230)
T PRK09391        112 -LIKRRSLEQAAATDVDVARALLSLTAGGLRHAQDHMLLLGRKTAMERVAAFLLEMDERLGGAGMMALPMSRRDIADYLG  190 (230)
T ss_pred             -EEEHHHHHHHHhhChHHHHHHHHHHHHHHHHHHHHHHHHcCCCHHHHHHHHHHHHHHHhCCCCEEEecCCHHHHHHHHC
Confidence             232        12343210                            111111      10    12367889999999


Q ss_pred             CCHHHHHHhhhhhc
Q 048097          208 LDPKIVKDLQDKFI  221 (224)
Q Consensus       208 ~~~~~v~~l~~~~~  221 (224)
                      +..+++.++.+++.
T Consensus       191 isretlsR~L~~L~  204 (230)
T PRK09391        191 LTIETVSRALSQLQ  204 (230)
T ss_pred             CCHHHHHHHHHHHH
Confidence            99999888766554


No 96 
>COG2850 Uncharacterized conserved protein [Function unknown]
Probab=85.98  E-value=2  Score=39.75  Aligned_cols=64  Identities=27%  Similarity=0.280  Sum_probs=41.9

Q ss_pred             EEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeC-CC-------------CCCeeEEEEecCCCEEEEcCCCeeEEEeC
Q 048097          101 DYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTS-NQ-------------LNNTLIAKVLNKGDVFVFPIGLIHFQVNI  165 (224)
Q Consensus       101 ~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~-~~-------------~~~k~~~~~l~~GDv~v~P~G~~H~~~N~  165 (224)
                      ..++||.+.+|+-+. +-+++-..|+=+..+... +.             ........++.|||+.++|+|..|+-...
T Consensus       125 ~a~~GGgvg~H~D~Y-DVfliQg~G~RRW~v~~~~~~~~~~~~~d~~~~~~f~~~~d~vlepGDiLYiPp~~~H~gvae  202 (383)
T COG2850         125 FAAPGGGVGPHFDQY-DVFLIQGQGRRRWRVGKKCNMSTLCPHPDLLILAPFEPDIDEVLEPGDILYIPPGFPHYGVAE  202 (383)
T ss_pred             EecCCCccCccccch-heeEEeecccceeecCCcccccCcCCCcchhhcCCCCchhhhhcCCCceeecCCCCCcCCccc
Confidence            457899999999985 555555555444443321 00             00112235799999999999999998655


No 97 
>PF14525 AraC_binding_2:  AraC-binding-like domain
Probab=84.99  E-value=11  Score=29.28  Aligned_cols=66  Identities=17%  Similarity=0.121  Sum_probs=40.9

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      ++.+.++.....-.+...-+.+.--+.+.++|+..+...      ++  ...+.+||+++++.+.++.+...+.
T Consensus        33 ~~~l~~~~~~~~~~vr~~~~~~~~~l~~~~~G~~~~~~~------g~--~~~~~pg~~~l~d~~~~~~~~~~~~   98 (172)
T PF14525_consen   33 GLRLSRISYGAQRRVRSDAPDDHYLLVLPLSGSARIEQG------GR--EVELAPGDVVLLDPGQPYRLEFSAG   98 (172)
T ss_pred             CEEEEEEEcCCCEEEECCCCCCEEEEEEEccCCEEEEEC------CE--EEEEcCCeEEEEcCCCCEEEEECCC
Confidence            356666665533322111122234455677777776642      33  5899999999999999988765543


No 98 
>PF00027 cNMP_binding:  Cyclic nucleotide-binding domain;  InterPro: IPR000595 Proteins that bind cyclic nucleotides (cAMP or cGMP) share a structural domain of about 120 residues [, , ]. The best studied of these proteins is the prokaryotic catabolite gene activator (also known as the cAMP receptor protein) (gene crp) where such a domain is known to be composed of three alpha-helices and a distinctive eight-stranded, antiparallel beta-barrel structure. There are six invariant amino acids in this domain, three of which are glycine residues that are thought to be essential for maintenance of the structural integrity of the beta-barrel. cAMP- and cGMP-dependent protein kinases (cAPK and cGPK) contain two tandem copies of the cyclic nucleotide-binding domain. The cAPK's are composed of two different subunits, a catalytic chain and a regulatory chain, which contains both copies of the domain. The cGPK's are single chain enzymes that include the two copies of the domain in their N-terminal section. Vertebrate cyclic nucleotide-gated ion-channels also contain this domain. Two such cations channels have been fully characterised, one is found in rod cells where it plays a role in visual signal transduction.; PDB: 1O7F_A 2BYV_E 3E97_A 3U10_A 2H6B_A 3SHR_A 2OZ6_A 1WGP_A 3LA2_A 3LA3_B ....
Probab=84.22  E-value=3.2  Score=28.57  Aligned_cols=48  Identities=21%  Similarity=0.320  Sum_probs=32.8

Q ss_pred             EEcCCCcC-CCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097          101 DYAPYGQN-PPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus       101 ~l~pgg~~-ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      .+.+|..+ ..+-+  ...+.+|++|.+.+...+.++  .+.....+.+||++
T Consensus         3 ~~~~g~~i~~~g~~--~~~~~~i~~G~v~~~~~~~~~--~~~~~~~~~~g~~~   51 (91)
T PF00027_consen    3 TYKKGEVIYRQGDP--CDHIYIILSGEVKVSSINEDG--KEQIIFFLGPGDIF   51 (91)
T ss_dssp             EESTTEEEEETTSB--ESEEEEEEESEEEEEEETTTS--EEEEEEEEETTEEE
T ss_pred             EECCCCEEEeCCCc--CCEEEEEEECceEEEeceecc--eeeeecceeeeccc
Confidence            45555533 33333  589999999999998877652  23335678888887


No 99 
>PRK11753 DNA-binding transcriptional dual regulator Crp; Provisional
Probab=84.18  E-value=11  Score=30.75  Aligned_cols=54  Identities=17%  Similarity=0.173  Sum_probs=38.2

Q ss_pred             EEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           98 VRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        98 ~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ....+++|..+-..=.+ ...+.+|++|.+.+...+.++  ++.....+.+||++-.
T Consensus        21 ~~~~~~kg~~l~~~g~~-~~~~y~V~~G~v~~~~~~~~g--~~~~~~~~~~g~~~g~   74 (211)
T PRK11753         21 HIHKYPAKSTLIHAGEK-AETLYYIVKGSVAVLIKDEEG--KEMILSYLNQGDFIGE   74 (211)
T ss_pred             eEEEeCCCCEEEeCCCC-CCeEEEEEeCEEEEEEECCCC--CEEEEEEcCCCCEEee
Confidence            45678888865433233 678999999999997766552  4445567899999844


No 100
>PF11142 DUF2917:  Protein of unknown function (DUF2917);  InterPro: IPR021317  This bacterial family of proteins appears to be restricted to Proteobacteria. 
Probab=83.84  E-value=4.9  Score=27.67  Aligned_cols=56  Identities=16%  Similarity=0.081  Sum_probs=40.2

Q ss_pred             EEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097          100 IDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      ..+.||.....+... ..+ +.|.+|++.++....      ...+.|++||.+.+++|.--++.
T Consensus         2 ~~L~~g~~~~lr~~~-~~~-l~v~~G~vWlT~~g~------~~D~~L~~G~~l~l~~g~~vvl~   57 (63)
T PF11142_consen    2 FELAPGETLSLRAAA-GQR-LRVESGRVWLTREGD------PDDYWLQAGDSLRLRRGGRVVLS   57 (63)
T ss_pred             EEeCCCceEEeEcCC-CcE-EEEccccEEEECCCC------CCCEEECCCCEEEeCCCCEEEEE
Confidence            356677776666443 344 889999998876432      22489999999999999766654


No 101
>PF04962 KduI:  KduI/IolB family;  InterPro: IPR021120 The KduI/IolB family of enzymes includes 5-keto 4-deoxyuronate isomerase (KduI) and 5-deoxy-glucuronate isomerase (IolB).  KduI is involved in pectin degradation by free-living soil bacteria that use pectin as a carbon source, breaking it down to 2-keto-3-deoxygluconate, which can ultimately be converted to pyruvate. KduI catalyses the fourth step in pectin degradation, namely the interconversion of 5-keto-4-deoxyuronate and 2,5-diketo-3-dexoygluconate []. KduI has a TIM-barrel fold [].  IolB is one of several bacterial proteins encoded by the inositol operon (iolABCDEFGHIJ) in Bacillus subtilis that are involved in myo-inositol catabolism. The enzyme is responsible for isomerization of 5-deoxy-D-glucuronic acid by IolB to produce 2-deoxy-5-keto-D-gluconic acid []. IolBs possess a cupin-like structure.; GO: 0016861 intramolecular oxidoreductase activity, interconverting aldoses and ketoses, 0008152 metabolic process; PDB: 1YWK_B 2QJV_B 1X8M_A 1XRU_A.
Probab=83.43  E-value=20  Score=31.54  Aligned_cols=96  Identities=23%  Similarity=0.270  Sum_probs=50.2

Q ss_pred             eEEEccccccCcccccceEEEEEEEcCCC---cCCCccCCCC--------cEEEEEE----ecEEEEEEEeCCCCCCeeE
Q 048097           78 NVTNANVEQIPGLNTLGTSAVRIDYAPYG---QNPPHTHPRA--------TEILVVL----EGTLYVGFVTSNQLNNTLI  142 (224)
Q Consensus        78 ~v~~~~~~~~p~L~~lgis~~~v~l~pgg---~~ppH~Hp~a--------~Ei~~Vl----~G~~~v~~v~~~~~~~k~~  142 (224)
                      .|......+.+.  .-.+-+..+. .|+|   .-|||.|++.        +|+.|-.    +|-+.-.+.+..+..++  
T Consensus       136 ~V~~~i~~~~~~--~~~Lv~get~-~~~G~WsSyPPH~Hd~~~~~~e~~leEiYyf~~~p~~Gfg~q~~y~~~~~~d~--  210 (261)
T PF04962_consen  136 TVRNIIDPNVPP--ASRLVVGETI-TPGGNWSSYPPHKHDRRMEPDETELEEIYYFRFNPPQGFGFQRVYTDDPQLDE--  210 (261)
T ss_dssp             EEEEEESTTT-----SS-EEEEEE-ETTT-EES-SEEE-CCEEEESEECTEEEEEEESSTTS-EEEEEEE-TTSSSEE--
T ss_pred             EEEEeeCCCCcc--cceEEEEEEE-eCCCccCCcCCccCCCcCCCccccceeEEEEEccCcccEEEEEEECCCCCCcE--
Confidence            355555555542  2245666655 6666   3699999863        5666542    24333223332221123  


Q ss_pred             EEEecCCCEEEEcCCCeeEEEe-CCCCcEEEEEEEeCCC
Q 048097          143 AKVLNKGDVFVFPIGLIHFQVN-IGKTSAVAFAGFSSQF  180 (224)
Q Consensus       143 ~~~l~~GDv~v~P~G~~H~~~N-~G~~~a~~l~~~~s~~  180 (224)
                      ...++-||++.+|+|. |-+.. .|.. ..++.+....+
T Consensus       211 ~~~V~~~d~V~iP~gy-Hp~~aapGy~-~Yylw~maG~~  247 (261)
T PF04962_consen  211 HYVVRNGDAVLIPSGY-HPVVAAPGYD-MYYLWVMAGEN  247 (261)
T ss_dssp             EEEEETTEEEEESTTB--SEEEEEESS-EEEEEEEESSS
T ss_pred             EEEEECCCEEEeCCCC-CCcCcCCCcC-cEEEEEEEcCC
Confidence            5789999999999993 33322 3444 44777776665


No 102
>COG3123 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=82.13  E-value=5.2  Score=29.47  Aligned_cols=41  Identities=29%  Similarity=0.285  Sum_probs=33.5

Q ss_pred             CcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEE
Q 048097          116 ATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQ  162 (224)
Q Consensus       116 a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~  162 (224)
                      +.|+..|+.|.+++.+.++.    .  +++..+|+.|.+|...-..+
T Consensus        41 ~~E~Mtvv~Gal~v~lpgs~----d--Wq~~~~Ge~F~VpgnS~F~l   81 (94)
T COG3123          41 APEEMTVVSGALTVLLPGSD----D--WQVYTAGEVFNVPGNSEFDL   81 (94)
T ss_pred             CceEEEEEeeEEEEEcCCCc----c--cEEecCCceEEcCCCCeEEE
Confidence            67999999999999886543    2  68999999999998765444


No 103
>PRK13918 CRP/FNR family transcriptional regulator; Provisional
Probab=81.05  E-value=7.7  Score=31.59  Aligned_cols=55  Identities=18%  Similarity=0.201  Sum_probs=36.9

Q ss_pred             EEEEcCCCcCCCccCC-CCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEc
Q 048097           99 RIDYAPYGQNPPHTHP-RATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFP  155 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp-~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P  155 (224)
                      .+.+++|..+-.-=-+ ....+++|++|.+.+...++++  .+.....+.+||++=.+
T Consensus         8 ~~~~~kg~~l~~~Gd~~~~~~~y~I~~G~vr~~~~~~~G--~e~~l~~~~~Gd~~G~~   63 (202)
T PRK13918          8 TVTYRPGAVILYPGVPGPSDMLYRVRSGLVRLHTVDDEG--NALTLRYVRPGEYFGEE   63 (202)
T ss_pred             eeEecCCCEEEcCCCCCCCCeEEEEEeeEEEEEEECCCC--CEEEEEEecCCCeechH
Confidence            3566777644222121 2478999999999998887663  45555677999988543


No 104
>smart00100 cNMP Cyclic nucleotide-monophosphate binding domain. Catabolite gene activator protein (CAP) is a prokaryotic homologue of eukaryotic cNMP-binding domains, present in ion channels, and  cNMP-dependent kinases.
Probab=80.35  E-value=11  Score=26.63  Aligned_cols=55  Identities=18%  Similarity=0.169  Sum_probs=37.3

Q ss_pred             EEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEc
Q 048097           98 VRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFP  155 (224)
Q Consensus        98 ~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P  155 (224)
                      ....+.+|..+ .+.......+.+|++|.+.+...+.++  +......+.+||.+-..
T Consensus        18 ~~~~~~~g~~l-~~~g~~~~~~y~v~~G~v~~~~~~~~g--~~~~~~~~~~g~~~g~~   72 (120)
T smart00100       18 EPVRYPAGEVI-IRQGDVGDSFYIILSGEVRVYKVLEDG--REQILGILGPGDFFGEL   72 (120)
T ss_pred             eEEEeCCCCEE-EeCCCcCCcEEEEEeeEEEEEEECCCC--ceEEEEeecCCceechh
Confidence            34567777754 233334678999999999987665442  45556788999987543


No 105
>PF06172 Cupin_5:  Cupin superfamily (DUF985);  InterPro: IPR009327 This is a family of uncharacterised proteins found in bacteria and eukaryotes.; PDB: 1ZNP_G 1XE8_B 1XE7_A 3M3I_F 3LOI_A 3LZZ_B 1YUD_D.
Probab=79.57  E-value=24  Score=28.18  Aligned_cols=78  Identities=15%  Similarity=0.133  Sum_probs=51.4

Q ss_pred             eEEEEEEEcCCCcCCCccCCCCcEEEEEEec-EEEEEEEeCCCCCCeeEEEEe----cCCC--EEEEcCCCeeEEEeCCC
Q 048097           95 TSAVRIDYAPYGQNPPHTHPRATEILVVLEG-TLYVGFVTSNQLNNTLIAKVL----NKGD--VFVFPIGLIHFQVNIGK  167 (224)
Q Consensus        95 is~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G-~~~v~~v~~~~~~~k~~~~~l----~~GD--v~v~P~G~~H~~~N~G~  167 (224)
                      .+....-+.++.....|.= +++|+.+...| .+++.+++++   ++..+..|    .+|+  .+++|+|.....+..+.
T Consensus        41 ~T~Iy~LL~~~~~S~~Hrv-~sdEiw~~~~G~pl~l~~i~~d---g~~~~~~LG~d~~~g~~~q~vVp~G~W~aa~l~~~  116 (139)
T PF06172_consen   41 STSIYYLLTPGEFSAWHRV-DSDEIWHFHAGDPLELHLIDPD---GSYETVVLGPDLAAGERPQVVVPAGTWQAAELEPE  116 (139)
T ss_dssp             -EEEEEEEETTBEEEEEEE-SSEEEEEEEEES-EEEEEECTT---STEEEEEESSTTCTTEBSEEEE-TTSEEEEEECES
T ss_pred             ceEEEEEEcCCCCCccEEc-CCCEEEEEEcCCCEEEEEEcCC---CCeEEEEECCCCCCCceEEEEECCCEEEEccccCC
Confidence            4444455777666666654 68999999999 6888888887   45445555    3443  68999999999865555


Q ss_pred             CcEEEEEEE
Q 048097          168 TSAVAFAGF  176 (224)
Q Consensus       168 ~~a~~l~~~  176 (224)
                      ..-.+++..
T Consensus       117 ~~y~Lvsc~  125 (139)
T PF06172_consen  117 GDYSLVSCT  125 (139)
T ss_dssp             SSEEEEEEE
T ss_pred             CCEEEEEEE
Confidence            555555443


No 106
>cd00038 CAP_ED effector domain of the CAP family of transcription factors; members include CAP (or cAMP receptor protein (CRP)), which binds cAMP, FNR (fumarate and nitrate reduction), which uses an iron-sulfur cluster to sense oxygen) and CooA, a heme containing CO sensor. In all cases binding of the effector leads to conformational changes and the ability to activate transcription. Cyclic nucleotide-binding domain similar to CAP are also present in cAMP- and cGMP-dependent protein kinases (cAPK and cGPK) and vertebrate cyclic nucleotide-gated ion-channels.  Cyclic nucleotide-monophosphate binding domain; proteins that bind cyclic nucleotides (cAMP or cGMP) share a structural domain of about 120 residues; the best studied is the prokaryotic catabolite gene activator, CAP, where such a domain is known to be composed of three alpha-helices and a distinctive eight-stranded, antiparallel beta-barrel structure; three conserved glycine residues are thought to be essential for maintenance of
Probab=75.51  E-value=13  Score=26.07  Aligned_cols=54  Identities=19%  Similarity=0.175  Sum_probs=35.7

Q ss_pred             EEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           98 VRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        98 ~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ....+++|..+-.. ......+.++++|.+.+...++++  .+.....+.+||++-.
T Consensus        18 ~~~~~~~g~~l~~~-~~~~~~~~~i~~G~v~~~~~~~~g--~~~~~~~~~~g~~~g~   71 (115)
T cd00038          18 EERRFPAGEVIIRQ-GDPADSLYIVLSGSVEVYKLDEDG--REQIVGFLGPGDLFGE   71 (115)
T ss_pred             eeeeeCCCCEEEcC-CCCCCeEEEEEeCEEEEEEECCCC--cEEEEEecCCccCcCh
Confidence            44567777755222 122478999999999998766542  3444567889988733


No 107
>COG1482 ManA Phosphomannose isomerase [Carbohydrate transport and metabolism]
Probab=73.01  E-value=22  Score=32.28  Aligned_cols=59  Identities=20%  Similarity=0.187  Sum_probs=42.2

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      .+++.++++..-....   +.+...+++|++|++++...      ++  +..|++|+.+++|+...-+..
T Consensus       241 ~F~l~~~~i~~~~~~~---~~~~~~il~v~eG~~~l~~~------~~--~~~l~~G~s~~ipa~~~~~~i  299 (312)
T COG1482         241 DFALYKWDISGTAEFI---KQESFSILLVLEGEGTLIGG------GQ--TLKLKKGESFFIPANDGPYTI  299 (312)
T ss_pred             ceEEEEEeccChhhhc---cCCCcEEEEEEcCeEEEecC------CE--EEEEcCCcEEEEEcCCCcEEE
Confidence            5778888777522111   12368999999999988643      22  589999999999998666554


No 108
>PRK10402 DNA-binding transcriptional activator YeiL; Provisional
Probab=72.93  E-value=13  Score=31.22  Aligned_cols=54  Identities=4%  Similarity=-0.068  Sum_probs=37.1

Q ss_pred             EEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEc
Q 048097           99 RIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFP  155 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P  155 (224)
                      ...+++|..+-.. ......+.+|++|.+.+...+.++  .+.....+.+||++-..
T Consensus        33 ~~~~~kge~l~~~-G~~~~~~y~V~~G~v~v~~~~~~G--~e~~~~~~~~g~~~G~~   86 (226)
T PRK10402         33 LFHFLAREYIVQE-GQQPSYLFYLTRGRAKLYATLANG--KVSLIDFFAAPCFIGEI   86 (226)
T ss_pred             heeeCCCCEEEcC-CCCCceEEEEEeCEEEEEEECCCC--CEeeeeecCCCCeEEee
Confidence            3466777654222 223578999999999998887663  44445678999988643


No 109
>PLN02868 acyl-CoA thioesterase family protein
Probab=69.11  E-value=18  Score=33.55  Aligned_cols=53  Identities=13%  Similarity=0.093  Sum_probs=37.5

Q ss_pred             EEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           98 VRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        98 ~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ....+++|.++-.-=. ....+++|++|++++...+.+   ++..-..+++||++-.
T Consensus        32 ~~~~~~~Ge~I~~~Gd-~~~~lyiI~~G~V~v~~~~~~---ge~~l~~l~~Gd~fG~   84 (413)
T PLN02868         32 VPKRYGKGEYVVREGE-PGDGLYFIWKGEAEVSGPAEE---ESRPEFLLKRYDYFGY   84 (413)
T ss_pred             eEEEECCCCEEEeCCC-cCceEEEEEeCEEEEEEECCC---CcEEEEEeCCCCEeeh
Confidence            3457777776533323 367899999999999776655   3444567899998874


No 110
>TIGR00218 manA mannose-6-phosphate isomerase, class I. The names phosphomannose isomerase and mannose-6-phosphate isomerase are synonomous. This family contains two rather deeply branched groups. One group contains an experimentally determined phosphomannose isomerase of Streptococcus mutans as well as three uncharacterized paralogous proteins of Bacillus subtilis, all at more than 50 % identity to each other, plus a more distant homolog from Archaeoglobus fulgidus. The other group contains members from E. coli, budding yeast, Borrelia burgdorferi, etc.
Probab=67.39  E-value=3  Score=37.29  Aligned_cols=19  Identities=37%  Similarity=0.516  Sum_probs=17.7

Q ss_pred             EEEecCCCEEEEcCCCeeE
Q 048097          143 AKVLNKGDVFVFPIGLIHF  161 (224)
Q Consensus       143 ~~~l~~GDv~v~P~G~~H~  161 (224)
                      ...+++||++++|+|.+|.
T Consensus       152 ~v~v~~Gd~i~ipaGt~HA  170 (302)
T TIGR00218       152 RIKLKPGDFFYVPSGTPHA  170 (302)
T ss_pred             ccccCCCCEEEeCCCCccc
Confidence            4689999999999999998


No 111
>PF07172 GRP:  Glycine rich protein family;  InterPro: IPR010800 This family consists of glycine rich proteins. Some of them may be involved in resistance to environmental stress [].
Probab=66.90  E-value=7.7  Score=29.03  Aligned_cols=9  Identities=33%  Similarity=0.449  Sum_probs=5.2

Q ss_pred             CchhHHHHH
Q 048097            1 MKAIQFLIG    9 (224)
Q Consensus         1 m~~~~~~~~    9 (224)
                      |++..|++|
T Consensus         1 MaSK~~llL    9 (95)
T PF07172_consen    1 MASKAFLLL    9 (95)
T ss_pred             CchhHHHHH
Confidence            786555444


No 112
>PF04115 Ureidogly_hydro:  Ureidoglycolate hydrolase ;  InterPro: IPR007247 Ureidoglycolate hydrolase (3.5.3.19 from EC) carries out the third step in the degradation of allantoin.; GO: 0004848 ureidoglycolate hydrolase activity, 0000256 allantoin catabolic process; PDB: 1YQC_B 1XSR_A 2BDR_B 1XSQ_A.
Probab=66.73  E-value=33  Score=27.98  Aligned_cols=66  Identities=20%  Similarity=0.226  Sum_probs=38.8

Q ss_pred             CccCCCCcEEEEEEecEE-EEEEEeCCCC---CCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEE
Q 048097          110 PHTHPRATEILVVLEGTL-YVGFVTSNQL---NNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAG  175 (224)
Q Consensus       110 pH~Hp~a~Ei~~Vl~G~~-~v~~v~~~~~---~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~  175 (224)
                      .=.||.++|.++-+.|+. .+-++.++.+   -+++..+.+.+|+.+.+-+|.+|.-.-.=+++..++.+
T Consensus        74 lERHp~tsQ~fiPl~~~~~~lvvVA~~~~~Pd~~~lrAF~~~~gqgV~~~~GvWH~~~~~l~~~~~f~vv  143 (165)
T PF04115_consen   74 LERHPLTSQAFIPLDGSPWYLVVVAPDDDGPDPETLRAFLAPGGQGVNYHRGVWHHPLLPLDEPADFLVV  143 (165)
T ss_dssp             EEE-TTB-EEEEESBS---EEEEEEESSSS-ECCCEEEEEE-SS-EEEE-TT-EE-S-EESSSEEEEEEE
T ss_pred             eccCCCeeEEEEECCCCccEEEEEcCCCCCCCccceEEEEEcCCEEEEECCCceeCCccccCCcceEEEE
Confidence            345777999999999988 5555543310   14467799999999999999999964333456666654


No 113
>PHA02984 hypothetical protein; Provisional
Probab=65.79  E-value=43  Score=29.83  Aligned_cols=51  Identities=14%  Similarity=0.257  Sum_probs=38.5

Q ss_pred             cEEEE--EEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEE
Q 048097          117 TEILV--VLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVA  172 (224)
Q Consensus       117 ~Ei~~--Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~  172 (224)
                      .|.+|  +++|+.++.....    ++..+..+++||.|.+.-+.-|...- ++..+.+
T Consensus        92 nEy~FvlCl~G~~~I~~~~~----~~~is~~I~kGeaf~md~~t~h~i~T-~~knl~L  144 (286)
T PHA02984         92 NEYMFVLCLNGKTSIECFNK----GSKITNTIKKGEAFTLNLKTKYVTTT-KDKNLHL  144 (286)
T ss_pred             ccEEEEEEcCCeEEEEEecC----CceeeeEEecCceEEEEccceEEEEe-CCCceEE
Confidence            45444  7899999987654    45568899999999999999999863 4444444


No 114
>KOG4281 consensus Uncharacterized conserved protein [Function unknown]
Probab=64.94  E-value=3  Score=35.88  Aligned_cols=42  Identities=26%  Similarity=0.183  Sum_probs=35.7

Q ss_pred             cccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEE
Q 048097           91 NTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFV  132 (224)
Q Consensus        91 ~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v  132 (224)
                      .+-++||....+.+++++|.|-||.-+-+.-++=|+..+.-.
T Consensus        71 EcD~FSigiFclp~ss~IPLHdHPgM~v~sKllyGtmhVksy  112 (236)
T KOG4281|consen   71 ECDRFSIGIFCLPPSSVIPLHDHPGMTVLSKLLYGTMHVKSY  112 (236)
T ss_pred             ecCceeEEEEEcCCCCeeecCCCcchHHHHHhhhceeEeeec
Confidence            344789999999999999999999888778888899988544


No 115
>KOG2130 consensus Phosphatidylserine-specific receptor PtdSerR, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=64.72  E-value=11  Score=34.42  Aligned_cols=46  Identities=20%  Similarity=0.188  Sum_probs=31.5

Q ss_pred             CeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCCCCcee
Q 048097          139 NTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQFPGVI  184 (224)
Q Consensus       139 ~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~~pg~~  184 (224)
                      .+-+.-..++|+++++|.|..|-+.|...+-|+---.-+..|.+.+
T Consensus       260 ~kPIEc~q~pGEt~fVP~GWWHvVlNle~TIAiTqNf~s~eNf~~V  305 (407)
T KOG2130|consen  260 YKPIECLQKPGETMFVPSGWWHVVLNLEPTIAITQNFASKENFPFV  305 (407)
T ss_pred             cCCceeeecCCceEEecCCeEEEEeccCceeeeeeccccccCCcee
Confidence            3444567899999999999999999976554433322234555544


No 116
>PRK03606 ureidoglycolate hydrolase; Provisional
Probab=64.31  E-value=46  Score=27.29  Aligned_cols=65  Identities=17%  Similarity=0.137  Sum_probs=47.1

Q ss_pred             CCccCCCCcEEEEEEecEEEEEEEeCCCC--CCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEE
Q 048097          109 PPHTHPRATEILVVLEGTLYVGFVTSNQL--NNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAF  173 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~--~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l  173 (224)
                      ..-.||..+|.++-+.|+-.+-++.+.+.  -.++..+..++|+.+.+-+|.+|.-.-.=+.+..++
T Consensus        72 ~mERHp~~sQafiPl~~~~~lvvVA~~~~~~~~~~raF~~~~~qgV~y~~G~WH~pl~~l~~~~dF~  138 (162)
T PRK03606         72 MLERHPLGSQAFIPLNGRPFLVVVAPDGDGDPGTPRAFVTNGRQGVNYHRGVWHHPLLALGEVSDFL  138 (162)
T ss_pred             eEEeCCCceEEEEECCCCEEEEEEeCCCCCCccceEEEEecCCcEEEeCCCcccccccccCCCceEE
Confidence            34457889999999999988877765421  134667899999999999999997643333344454


No 117
>COG1482 ManA Phosphomannose isomerase [Carbohydrate transport and metabolism]
Probab=63.43  E-value=6.2  Score=35.80  Aligned_cols=21  Identities=29%  Similarity=0.509  Sum_probs=19.1

Q ss_pred             EEEecCCCEEEEcCCCeeEEE
Q 048097          143 AKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus       143 ~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      ...|+|||.+++|+|.+|...
T Consensus       159 ~v~lkpGe~~fl~Agt~HA~~  179 (312)
T COG1482         159 RVKLKPGEAFFLPAGTPHAYL  179 (312)
T ss_pred             EEecCCCCEEEecCCCceeec
Confidence            478999999999999999884


No 118
>PHA02890 hypothetical protein; Provisional
Probab=63.11  E-value=64  Score=28.60  Aligned_cols=45  Identities=18%  Similarity=0.316  Sum_probs=36.4

Q ss_pred             CcEEEE--EEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097          116 ATEILV--VLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus       116 a~Ei~~--Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                      ..|.+|  +++|+.++.....    ++..+..+++||.|.+.-+.-|.+.-
T Consensus        90 SnEy~FVlCL~Gs~~In~~~~----d~~iS~~I~kGeaF~mdv~t~H~i~T  136 (278)
T PHA02890         90 KIECFFVACIEGSCKINVNIG----DREISDHIHENQGFIMDVGLDHAIDS  136 (278)
T ss_pred             eccEEEEEEeCCeEEEEEecC----CceeeeeeecCceEEEEccceEEEEc
Confidence            345555  7899999987643    56678899999999999999999975


No 119
>COG3717 KduI 5-keto 4-deoxyuronate isomerase [Carbohydrate transport and metabolism]
Probab=62.46  E-value=32  Score=30.18  Aligned_cols=86  Identities=17%  Similarity=0.167  Sum_probs=56.1

Q ss_pred             ccccceEEEEEEEcCCCc---CCCccCCCCcEEEEEE---ecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097           90 LNTLGTSAVRIDYAPYGQ---NPPHTHPRATEILVVL---EGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus        90 L~~lgis~~~v~l~pgg~---~ppH~Hp~a~Ei~~Vl---~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      +++-.+++....++||.+   .|.|.|.|..|..+..   +-+-.+.+..+.   .+....+++--+.++-|+-.+|.- 
T Consensus       172 ~~scQL~mG~T~L~pgsvWNTMP~H~HdRRmE~YlYF~m~e~srVfH~MGqP---~ETRHiv~~NEqAViSP~WSIHSG-  247 (278)
T COG3717         172 LESCQLSMGLTMLAPGSVWNTMPCHVHDRRMEVYLYFDMDEDSRVFHMMGQP---QETRHIVMHNEQAVISPPWSIHSG-  247 (278)
T ss_pred             hhhhhhhhcceeecCCCccccCCccccccceeEEEEecCCCcceEEEecCCC---CceeEEEEeccceeeCCCceeecC-
Confidence            334456778888999986   5999999988876532   112222333322   233345677788888899999976 


Q ss_pred             eCCCCcEEEEEEEeCCC
Q 048097          164 NIGKTSAVAFAGFSSQF  180 (224)
Q Consensus       164 N~G~~~a~~l~~~~s~~  180 (224)
                       .|...-.|+++...+|
T Consensus       248 -~GT~~YtFIWaMaGeN  263 (278)
T COG3717         248 -VGTANYTFIWAMAGEN  263 (278)
T ss_pred             -ccccceEEEEEecccc
Confidence             4555667777765444


No 120
>PRK00924 5-keto-4-deoxyuronate isomerase; Provisional
Probab=62.07  E-value=48  Score=29.61  Aligned_cols=51  Identities=14%  Similarity=0.119  Sum_probs=36.1

Q ss_pred             CCcEE-EEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe--CCCCcEEEE
Q 048097          115 RATEI-LVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN--IGKTSAVAF  173 (224)
Q Consensus       115 ~a~Ei-~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N--~G~~~a~~l  173 (224)
                      ...|+ ++.+.|++++.+.      ++  ++.+.+.|.+++|+|..-....  ....|+.+.
T Consensus        72 ~rrE~giV~lgG~~~V~vd------G~--~~~l~~~d~LYVp~G~~~v~~as~~a~~paef~  125 (276)
T PRK00924         72 ERRELGIINIGGAGTVTVD------GE--TYELGHRDALYVGKGAKEVVFASADAANPAKFY  125 (276)
T ss_pred             CCcEEEEEEccceEEEEEC------CE--EEecCCCcEEEECCCCcEEEEEecCCCCCcEEE
Confidence            34564 5578899999853      33  3669999999999998877664  224566665


No 121
>PRK15131 mannose-6-phosphate isomerase; Provisional
Probab=61.61  E-value=8.5  Score=35.89  Aligned_cols=22  Identities=18%  Similarity=0.134  Sum_probs=19.4

Q ss_pred             EEEEecCCCEEEEcCCCeeEEE
Q 048097          142 IAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus       142 ~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      ....|++||++++|+|.+|...
T Consensus       237 N~v~l~pGeaifipAg~~HAyl  258 (389)
T PRK15131        237 NVVKLNPGEAMFLFAETPHAYL  258 (389)
T ss_pred             eEEEeCCCCEEEeCCCCCeEEc
Confidence            3468999999999999999984


No 122
>COG0664 Crp cAMP-binding proteins - catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases [Signal transduction mechanisms]
Probab=59.90  E-value=38  Score=26.93  Aligned_cols=57  Identities=16%  Similarity=0.086  Sum_probs=39.0

Q ss_pred             EEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcC
Q 048097           97 AVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPI  156 (224)
Q Consensus        97 ~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~  156 (224)
                      .....+++|..+-..--+ +.-+.+|++|.+.+....+++  .+.....+.+||++-...
T Consensus        23 ~~~~~~~~g~~l~~~g~~-~~~~y~v~~G~v~~~~~~~~G--~~~~~~~~~~g~~fg~~~   79 (214)
T COG0664          23 LEVRKLPKGEVLFTEGEE-ADSLYIILSGIVKLYANTEDG--REIILGFLGPGDFFGELA   79 (214)
T ss_pred             ceeEeeCCCCEEEcCCCc-CceEEEEEEeEEEEEEECCCC--cEEEEEEecCCchhhhHH
Confidence            344566666554433333 455889999999999887762  444456789999997664


No 123
>PF04962 KduI:  KduI/IolB family;  InterPro: IPR021120 The KduI/IolB family of enzymes includes 5-keto 4-deoxyuronate isomerase (KduI) and 5-deoxy-glucuronate isomerase (IolB).  KduI is involved in pectin degradation by free-living soil bacteria that use pectin as a carbon source, breaking it down to 2-keto-3-deoxygluconate, which can ultimately be converted to pyruvate. KduI catalyses the fourth step in pectin degradation, namely the interconversion of 5-keto-4-deoxyuronate and 2,5-diketo-3-dexoygluconate []. KduI has a TIM-barrel fold [].  IolB is one of several bacterial proteins encoded by the inositol operon (iolABCDEFGHIJ) in Bacillus subtilis that are involved in myo-inositol catabolism. The enzyme is responsible for isomerization of 5-deoxy-D-glucuronic acid by IolB to produce 2-deoxy-5-keto-D-gluconic acid []. IolBs possess a cupin-like structure.; GO: 0016861 intramolecular oxidoreductase activity, interconverting aldoses and ketoses, 0008152 metabolic process; PDB: 1YWK_B 2QJV_B 1X8M_A 1XRU_A.
Probab=59.28  E-value=36  Score=29.97  Aligned_cols=78  Identities=15%  Similarity=-0.019  Sum_probs=46.6

Q ss_pred             EEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCC--------C
Q 048097           79 VTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKG--------D  150 (224)
Q Consensus        79 v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~G--------D  150 (224)
                      ++.++.+.- +..  -+.+..++|++|.....-.. +.+-.++.|+|++++...+.     +  ...+..-        |
T Consensus        14 ~~~i~~~~~-g~~--~~~~~~l~L~~g~~~~~~~~-~~E~~vv~l~G~~~v~~~g~-----~--~~~l~~R~~vF~~~~d   82 (261)
T PF04962_consen   14 VYSITPENA-GWM--YMGFGVLRLEAGESLEFELE-RRELGVVNLGGKATVTVDGE-----E--FYELGGRESVFDGPPD   82 (261)
T ss_dssp             EEECTCCCC-CCC--CBECCCEEEECCHCCCCCCC-SEEEEEEEESSSEEEEETTE-----E--EEEE-TTSSGGGS--E
T ss_pred             EEEECCCcc-Ccc--ccceEEEEecCCCEEeccCC-CcEEEEEEeCCEEEEEeCCc-----e--EEEecccccccCCCCc
Confidence            444544443 333  24455688888887655533 23445567899999987321     2  3556655        9


Q ss_pred             EEEEcCCCeeEEEeCCC
Q 048097          151 VFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       151 v~v~P~G~~H~~~N~G~  167 (224)
                      ++++|+|.---+...++
T Consensus        83 ~lYvp~g~~~~i~a~~~   99 (261)
T PF04962_consen   83 ALYVPRGTKVVIFASTD   99 (261)
T ss_dssp             EEEE-TT--EEEEESST
T ss_pred             EEEeCCCCeEEEEEcCC
Confidence            99999999988877544


No 124
>PRK15186 AraC family transcriptional regulator; Provisional
Probab=58.68  E-value=35  Score=30.43  Aligned_cols=46  Identities=2%  Similarity=-0.049  Sum_probs=36.4

Q ss_pred             cEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCc
Q 048097          117 TEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTS  169 (224)
Q Consensus       117 ~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~  169 (224)
                      .=++++.+|...+.-.+     +.  +..+.++.++++|++..|.+.|...+.
T Consensus        39 ~~li~v~~G~~~i~~~~-----g~--~l~i~~p~~~~~p~~~~~~~~~~~~~~   84 (291)
T PRK15186         39 SVLIKLTTGKISITTSS-----GE--YITASGPMLIFLAKDQTIHITMEETHE   84 (291)
T ss_pred             eEEEEeccceEEEEeCC-----Cc--eEEeCCCeEEEEeCCcEEEEEecccCC
Confidence            46889999999886422     22  368999999999999999998876543


No 125
>PF04622 ERG2_Sigma1R:  ERG2 and Sigma1 receptor like protein;  InterPro: IPR006716 This family consists of the fungal C-8 sterol isomerase and mammalian sigma1 receptor. C-8 sterol isomerase (delta-8--delta-7 sterol isomerase), catalyses a reaction in ergosterol biosynthesis, which results in unsaturation at C-7 in the B ring of sterols []. Sigma 1 receptor is a low molecular mass mammalian protein located in the endoplasmic reticulum [], which interacts with endogenous steroid hormones, such as progesterone and testosterone []. It also binds the sigma ligands, which are a set of chemically unrelated drugs including haloperidol, pentazocine, and ditolylguanidine []. Sigma1 effectors are not well understood, but sigma1 agonists have been observed to affect NMDA receptor function, the alpha-adrenergic system and opioid analgesia.; GO: 0000247 C-8 sterol isomerase activity, 0006696 ergosterol biosynthetic process, 0005783 endoplasmic reticulum
Probab=57.47  E-value=54  Score=28.23  Aligned_cols=93  Identities=19%  Similarity=0.276  Sum_probs=56.9

Q ss_pred             CCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEe-CCCCc
Q 048097          104 PYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFS-SQFPG  182 (224)
Q Consensus       104 pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~-s~~pg  182 (224)
                      -.|....||   ++...+|++|+.+....      ++....+.++||....|+|......-..+  ..++. +. .--|.
T Consensus       110 TeGhsGrh~---ad~y~tIL~G~~~~~~~------g~~~~evy~pGd~~~l~rg~a~~y~m~~~--tw~LE-Y~RG~IP~  177 (216)
T PF04622_consen  110 TEGHSGRHW---ADDYFTILSGEQWAWSP------GSLEPEVYKPGDSHHLPRGEAKQYQMPPG--TWALE-YGRGWIPS  177 (216)
T ss_pred             CCCCCcceE---eeeEEEEEEEEEEEEcC------CCCCceEeccCCEEEecCceEEEEEeCCC--eEEEE-ecCCchhh
Confidence            345556665   57889999999877543      23335789999999999999887765432  22322 21 11122


Q ss_pred             e--eechhhhhcCCCCCCHHHHHhhcCCCHH
Q 048097          183 V--ITIADTVFGANPPINPDFLGKAFQLDPK  211 (224)
Q Consensus       183 ~--~~~~~~lf~~~p~~p~~vLa~af~~~~~  211 (224)
                      .  +.+++.+|.+   ++-..+-++..+...
T Consensus       178 ~lpf~~~dt~~sT---lDf~t~~~T~~~~~~  205 (216)
T PF04622_consen  178 MLPFGFADTLFST---LDFPTLYRTVYITAR  205 (216)
T ss_pred             hhHHHHHHHHHhc---cchHHHHHHHHHHHH
Confidence            1  2334666664   666666666555443


No 126
>PRK11161 fumarate/nitrate reduction transcriptional regulator; Provisional
Probab=57.08  E-value=46  Score=27.74  Aligned_cols=52  Identities=13%  Similarity=0.052  Sum_probs=35.0

Q ss_pred             EEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097          100 IDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ..+++|..+-.- -.....+.+|++|.+.+...++++  ++.....+.+||++-.
T Consensus        40 ~~~~kge~l~~~-Gd~~~~ly~v~~G~v~~~~~~~~G--~e~i~~~~~~gd~~g~   91 (235)
T PRK11161         40 KPIQKGQTLFKA-GDELKSLYAIRSGTIKSYTITEQG--DEQITGFHLAGDLVGF   91 (235)
T ss_pred             eeecCCCEeECC-CCCcceEEEEeeceEEEEEECCCC--CEEEEEeccCCceecc
Confidence            356776644222 222578999999999998877663  4444456689999854


No 127
>TIGR03697 NtcA_cyano global nitrogen regulator NtcA, cyanobacterial. Members of this protein family, found in the cyanobacteria, are the global nitrogen regulator NtcA. This DNA-binding transcriptional regulator is required for expressing many different ammonia-repressible genes. The consensus NtcA-binding site is G T A N(8)T A C.
Probab=57.08  E-value=35  Score=27.27  Aligned_cols=37  Identities=16%  Similarity=0.293  Sum_probs=28.2

Q ss_pred             CcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097          116 ATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus       116 a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ...+.+|++|.+.+...++++  .+..-..+.+||++-.
T Consensus        11 ~~~~~~i~~G~v~~~~~~~~G--~e~~l~~~~~g~~~G~   47 (193)
T TIGR03697        11 AEKVYFLRRGAVKLSRVYESG--EEITVALLRENSVFGV   47 (193)
T ss_pred             CCcEEEEEecEEEEEEeCCCC--cEeeeEEccCCCEeee
Confidence            567899999999998877662  4444567899998743


No 128
>PRK10202 ebgC cryptic beta-D-galactosidase subunit beta; Reviewed
Probab=56.69  E-value=40  Score=27.03  Aligned_cols=54  Identities=13%  Similarity=0.109  Sum_probs=39.6

Q ss_pred             CCccCCCCcEEEEEEecEEEEEEEeCCC---------C-------CCeeEEEEecCCCEEEEcCCCeeEEE
Q 048097          109 PPHTHPRATEILVVLEGTLYVGFVTSNQ---------L-------NNTLIAKVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~---------~-------~~k~~~~~l~~GDv~v~P~G~~H~~~  163 (224)
                      .+=.|.+--.+.|+++|+=.+++.....         +       +.. ....|++|+..+|.++..|...
T Consensus        58 ~~E~Hr~YiDIq~~l~G~E~i~~~~~~~~~~~~~y~~e~D~~f~~~~~-~~v~l~~G~F~iffP~daH~P~  127 (149)
T PRK10202         58 LFTGHRRYFEVHYYLQGQQKIEYAPKETLQVVEYYRDETDREYLKGCG-ETVEVHEGQIVICDIHEAYRFI  127 (149)
T ss_pred             cccccccEEEEEEEEeCeEEEEEEEcccCccccccCcccCeeeccCCC-cEEEeCCCeEEEECCcccccCC
Confidence            4456778889999999998888754220         0       111 1468899999999999999864


No 129
>COG2731 EbgC Beta-galactosidase, beta subunit [Carbohydrate transport and metabolism]
Probab=54.49  E-value=51  Score=26.89  Aligned_cols=61  Identities=16%  Similarity=0.082  Sum_probs=43.4

Q ss_pred             cCCCccCCCCcEEEEEEecEEEEEEEeCCC-----------------CCCeeEEEEecCCCEEEEcCCCeeEEEeCCC
Q 048097          107 QNPPHTHPRATEILVVLEGTLYVGFVTSNQ-----------------LNNTLIAKVLNKGDVFVFPIGLIHFQVNIGK  167 (224)
Q Consensus       107 ~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~-----------------~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~  167 (224)
                      ..-+-+|.+--++-++++|+=.+++....+                 ........+|.+|+..+|=+|.+|.-.....
T Consensus        60 ~~~~E~HrkYiDiqill~G~E~i~~s~~~~~~~~e~y~~e~Di~~~~~~~~e~~v~L~~G~faiFfP~e~H~P~c~~~  137 (154)
T COG2731          60 EKKFELHRKYIDIQILLKGQEGIEYSPKETAQVKEDYDEEKDIIFYKGIEDESTVELNPGMFAIFFPGEPHRPGCNVG  137 (154)
T ss_pred             hcchhhhhheEEEEEEEeceeeeEEccCcCCccccccccccCEEeecCCccceEEEeCCCCEEEECCCCccccccccC
Confidence            445556777899999999998887764331                 0101224689999999999999998765544


No 130
>TIGR00022 uncharacterized protein, YhcH/YjgK/YiaL family. This family consists of conserved hypothetical proteins, about 150 amino acids in length. Members with limited information include YhcH, a possible sugar isomerase of sialic acid catabolism, and YjgK.
Probab=53.76  E-value=83  Score=24.79  Aligned_cols=56  Identities=21%  Similarity=0.188  Sum_probs=35.4

Q ss_pred             cCCCccCCCCcEEEEEEecEEEEEEEeCCC----------C--------CCeeEEEEecCCCEEEEcCCCeeEE
Q 048097          107 QNPPHTHPRATEILVVLEGTLYVGFVTSNQ----------L--------NNTLIAKVLNKGDVFVFPIGLIHFQ  162 (224)
Q Consensus       107 ~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~----------~--------~~k~~~~~l~~GDv~v~P~G~~H~~  162 (224)
                      -..+=.|.+--.+-|+++|+=++++.....          .        +.......|++|+..+|-++-+|.-
T Consensus        60 ~~~~E~Hr~YiDIq~~l~G~E~i~~~~~~~~~~~~~~y~~~~D~~f~~~~~~~~~i~l~~G~faiffP~D~H~P  133 (142)
T TIGR00022        60 SKKAELHHRYLDIQLLLRGEENIEVGTTPPNLSVYEDYLEEDDIQLCADIDDEQTVILKPGMFAVFYPGEPHKP  133 (142)
T ss_pred             hcchhhhhheEEEEEeecceEEEEEecCccccccccCCCcCCCEEeccCCCCceEEEeCCCcEEEECCCCcccc
Confidence            345556777889999999998888853210          0        0111234667777777777777754


No 131
>PF04074 DUF386:  Domain of unknown function (DUF386);  InterPro: IPR004375 This family consists of conserved hypothetical proteins, about 150 amino acids in length, with no known function. The family is restricted to the bacteria. It includes three members in Escherichia coli (strain K12) and three in Streptococcus pneumoniae.; PDB: 1S4C_B 1JOP_B.
Probab=53.65  E-value=44  Score=26.61  Aligned_cols=69  Identities=20%  Similarity=0.156  Sum_probs=36.5

Q ss_pred             eEEEEEEEcCCC--cCCCccCCCCcEEEEEEecEEEEEEE-eCCC-----------------CCCeeEEEEecCCCEEEE
Q 048097           95 TSAVRIDYAPYG--QNPPHTHPRATEILVVLEGTLYVGFV-TSNQ-----------------LNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        95 is~~~v~l~pgg--~~ppH~Hp~a~Ei~~Vl~G~~~v~~v-~~~~-----------------~~~k~~~~~l~~GDv~v~  154 (224)
                      +.+...+.....  -..+=.|.+--.+-|+++|+=++++. ....                 .+.......|++|+.++|
T Consensus        46 ~~~~v~~~~t~~~~~~~~E~HrkyiDiq~~l~G~E~i~~~~~~~~~~~~~~yd~~~D~~f~~~~~~~~~i~l~~g~f~if  125 (153)
T PF04074_consen   46 LFANVQEYETKPEEERRFESHRKYIDIQYVLEGEERIGWSADIEDLEVVQPYDEEKDIAFYEDGKNESFITLKPGDFAIF  125 (153)
T ss_dssp             -EEEEE--B-B-GGGS-EEE-SSEEEEEEEEES-EEEEEE-S---GGGS---BTTTTBEEES--TTEEEEEE-TTEEEEE
T ss_pred             EEEEeeccccccccccceeeeccEEEEEeeccccEEEEEEcCcccCcccccCCCCCCEEEecCCCCceEEEEcCCEEEEE
Confidence            444444443332  34556788888999999999988883 2210                 011112357999999999


Q ss_pred             cCCCeeEEE
Q 048097          155 PIGLIHFQV  163 (224)
Q Consensus       155 P~G~~H~~~  163 (224)
                      -++.+|.-.
T Consensus       126 fP~d~H~p~  134 (153)
T PF04074_consen  126 FPEDAHRPG  134 (153)
T ss_dssp             -TT--EEEE
T ss_pred             CCCcccccc
Confidence            999999954


No 132
>PF13640 2OG-FeII_Oxy_3:  2OG-Fe(II) oxygenase superfamily; PDB: 3DKQ_B 3GZE_D 3HQR_A 2Y34_A 2G1M_A 2G19_A 3OUI_A 3OUJ_A 2HBU_A 2Y33_A ....
Probab=52.17  E-value=33  Score=24.62  Aligned_cols=64  Identities=20%  Similarity=0.273  Sum_probs=37.1

Q ss_pred             EEEcCCCcCCCccCC---CCcEEEEE--Ee-c-----EEEEEEEeC--CCCCCeeEEEE-----ecCCCEEEEcC-CCee
Q 048097          100 IDYAPYGQNPPHTHP---RATEILVV--LE-G-----TLYVGFVTS--NQLNNTLIAKV-----LNKGDVFVFPI-GLIH  160 (224)
Q Consensus       100 v~l~pgg~~ppH~Hp---~a~Ei~~V--l~-G-----~~~v~~v~~--~~~~~k~~~~~-----l~~GDv~v~P~-G~~H  160 (224)
                      ..+.+|+...||+..   ....+.++  +. -     -+...+...  ..  .......     .++|++++|+. ...|
T Consensus         4 ~~y~~G~~~~~H~D~~~~~~~~~t~llyL~~~~~~~~GG~l~~~~~~~~~--~~~~~~~~~~~~p~~g~~v~F~~~~~~H   81 (100)
T PF13640_consen    4 NRYPPGGFFGPHTDNSYDPHRRVTLLLYLNDPEWEFEGGELEFYPSKDSD--DVSREVEDFDIVPKPGRLVIFPSDNSLH   81 (100)
T ss_dssp             EEEETTEEEEEEESSSCCCSEEEEEEEESS-CS-HCEE--EEETTTS-TS--STCEEEGGGSEE-BTTEEEEEESCTCEE
T ss_pred             EEECcCCEEeeeECCCCCCcceEEEEEEECCCCcccCCCEEEEeccccCC--CcceEEEeccccCCCCEEEEEeCCCCee
Confidence            456889999999876   33343333  33 1     133333321  10  1111222     88999999999 9999


Q ss_pred             EEEeC
Q 048097          161 FQVNI  165 (224)
Q Consensus       161 ~~~N~  165 (224)
                      ...-.
T Consensus        82 ~v~~v   86 (100)
T PF13640_consen   82 GVTPV   86 (100)
T ss_dssp             EEEEE
T ss_pred             cCccc
Confidence            98766


No 133
>KOG1417 consensus Homogentisate 1,2-dioxygenase [Amino acid transport and metabolism]
Probab=50.07  E-value=1.8e+02  Score=26.65  Aligned_cols=62  Identities=13%  Similarity=0.213  Sum_probs=45.8

Q ss_pred             CCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEe
Q 048097          108 NPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFS  177 (224)
Q Consensus       108 ~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~  177 (224)
                      ...-+..+.+-+++-.+|.+.+.-  +-   +|   ..++++++.+||+|.-..+--.|...-.++.++.
T Consensus       147 ~safyNsDGDFLiVPQ~G~L~I~T--Ef---Gr---llV~P~EI~VIpqG~RFsi~v~~~sRGYilEvYg  208 (446)
T KOG1417|consen  147 NSAFYNSDGDFLIVPQQGRLWITT--EF---GR---LLVTPNEIAVIPQGIRFSIDVPGPSRGYILEVYG  208 (446)
T ss_pred             cceeecCCCCEEEecccCcEEEEe--ec---cc---eeecccceEEeecccEEEEecCCCCcceEEEEec
Confidence            455667777777777778776653  22   44   6789999999999999888777777777776665


No 134
>COG3718 IolB Uncharacterized enzyme involved in inositol metabolism [Carbohydrate transport and metabolism]
Probab=46.61  E-value=1.8e+02  Score=25.61  Aligned_cols=86  Identities=15%  Similarity=0.092  Sum_probs=54.1

Q ss_pred             EEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCC-C-CCCeeEEEEecCCCEEEEcC
Q 048097           79 VTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSN-Q-LNNTLIAKVLNKGDVFVFPI  156 (224)
Q Consensus        79 v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~-~-~~~k~~~~~l~~GDv~v~P~  156 (224)
                      +..++.++ +++.-  +.+...+|++|.....-.-. -+-++++++|++++.-.+.. + -|.|.--++=++=|++++|.
T Consensus        16 v~~vtp~s-agw~Y--VGF~~~~L~~Ges~~~~~~~-~E~clV~v~Gk~~vs~~g~~f~~iG~R~SvFe~~p~~~vYvp~   91 (270)
T COG3718          16 VQDVTPES-AGWEY--VGFRLLRLAAGESATEETGD-RERCLVLVTGKATVSAHGSTFGEIGTRMSVFERKPPDSVYVPA   91 (270)
T ss_pred             eEEecCCC-CCcee--EEEEEEEccCCCcccccCCC-ceEEEEEEeeeEEEeeccchHhhcccccccccCCCCCeEEecC
Confidence            55454332 34432  45556778999887766654 35667789999999754332 0 02332223446779999999


Q ss_pred             CCeeEEEeCCCC
Q 048097          157 GLIHFQVNIGKT  168 (224)
Q Consensus       157 G~~H~~~N~G~~  168 (224)
                      |..-.+...++-
T Consensus        92 g~~~~vtA~t~~  103 (270)
T COG3718          92 GSAFSVTATTDL  103 (270)
T ss_pred             CceEEEEeecce
Confidence            999888765543


No 135
>PRK13395 ureidoglycolate hydrolase; Provisional
Probab=43.96  E-value=1.4e+02  Score=24.68  Aligned_cols=67  Identities=12%  Similarity=0.087  Sum_probs=47.7

Q ss_pred             CCccCCCCcEEEEEEec-EEEEEEEeCCC--CCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEE
Q 048097          109 PPHTHPRATEILVVLEG-TLYVGFVTSNQ--LNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAG  175 (224)
Q Consensus       109 ppH~Hp~a~Ei~~Vl~G-~~~v~~v~~~~--~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~  175 (224)
                      ..-.||..++-+.-+.| ..++-++.+.+  .-+.+..+....|+.+.+-+|.+|...-.=+.+..++.+
T Consensus        72 ~mERHp~~sQafiPl~~~~~~lvVvap~~~~~pd~~~aF~~~g~qgV~y~~GtWH~pl~~L~~~~dF~vv  141 (171)
T PRK13395         72 MMERHPLGSQAFIPLAAVSRYAVVVAPAGEFRPDEMRAFLAEGWQGVNYAKGVWHHPLLALDAVSDFVVV  141 (171)
T ss_pred             eEEECCCceEEEEECCCCCCEEEEEccCCCCCCCceEEEEecCCcEEEeCCCcccccccccCCCccEEEE
Confidence            33457888999999999 77776665431  113467789999999999999999975444445555544


No 136
>PRK14585 pgaD putative PGA biosynthesis protein; Provisional
Probab=43.35  E-value=26  Score=28.02  Aligned_cols=25  Identities=12%  Similarity=0.264  Sum_probs=22.8

Q ss_pred             CCCCHHHHHhhcCCCHHHHHHhhhh
Q 048097          195 PPINPDFLGKAFQLDPKIVKDLQDK  219 (224)
Q Consensus       195 p~~p~~vLa~af~~~~~~v~~l~~~  219 (224)
                      |.++++-+|++|+++++.+++|++.
T Consensus        88 ~~~~~~eLA~Sf~is~el~~qL~~~  112 (137)
T PRK14585         88 YQYTPQEYAESLAIPDELYQQLQKS  112 (137)
T ss_pred             CCCChHHHHHHcCCCHHHHHHHhcC
Confidence            4699999999999999999999875


No 137
>PF13464 DUF4115:  Domain of unknown function (DUF4115)
Probab=42.77  E-value=1.1e+02  Score=21.17  Aligned_cols=51  Identities=20%  Similarity=0.309  Sum_probs=34.8

Q ss_pred             EecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEe
Q 048097          123 LEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFS  177 (224)
Q Consensus       123 l~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~  177 (224)
                      ..|...+.+.+.++  ..+++..+++||..-++.+..- ....|+-.++-+ .++
T Consensus         5 a~~~sWv~V~d~dG--~~~~~~~l~~G~~~~~~~~~~~-~i~iGna~~v~v-~~n   55 (77)
T PF13464_consen    5 ATGDSWVEVTDADG--KVLFSGTLKAGETKTFEGKEPF-RIRIGNAGAVEV-TVN   55 (77)
T ss_pred             EeCCeEEEEEeCCC--cEeeeeeeCCCcEEEEeCCCCE-EEEEeCCCcEEE-EEC
Confidence            45777777776553  6788999999999999544443 345677666554 344


No 138
>KOG2131 consensus Uncharacterized conserved protein, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=42.65  E-value=28  Score=32.44  Aligned_cols=72  Identities=22%  Similarity=0.261  Sum_probs=48.3

Q ss_pred             eEEEEE-EEcC-CCcCCCc---cCCCCcEEEEEEecEEEEEEEeCCCC----------------------CCeeEEEEec
Q 048097           95 TSAVRI-DYAP-YGQNPPH---THPRATEILVVLEGTLYVGFVTSNQL----------------------NNTLIAKVLN  147 (224)
Q Consensus        95 is~~~v-~l~p-gg~~ppH---~Hp~a~Ei~~Vl~G~~~v~~v~~~~~----------------------~~k~~~~~l~  147 (224)
                      ..-+|. .+.| |.-.|.|   +|.  .-+...+-|+=+--+..+..+                      ..+..+..=+
T Consensus       196 ~ddyrFvy~Gp~gSwtp~HaDVf~s--~swS~nicG~KrWl~~pP~qe~~l~dr~gnlp~~~~~~~ld~~~~~~lei~Qe  273 (427)
T KOG2131|consen  196 SDDYRFVYAGPAGSWTPFHADVFHS--PSWSVNICGRKRWLLYPPEQEQTLADRYGNLPLPSWITKLDLFRGPLLEIFQE  273 (427)
T ss_pred             CCceeEEEeccCCCCCccchhhhcC--CcceeeeecceeEEEeChHHhhhhhhhccCcCCccccccccccccchhhhhcc
Confidence            344454 3443 4467889   773  567778888877766655410                      0112223348


Q ss_pred             CCCEEEEcCCCeeEEEeCCCC
Q 048097          148 KGDVFVFPIGLIHFQVNIGKT  168 (224)
Q Consensus       148 ~GDv~v~P~G~~H~~~N~G~~  168 (224)
                      +|+++++|.|..|...|.|++
T Consensus       274 pge~VFvPsGW~hQV~NL~dT  294 (427)
T KOG2131|consen  274 PGETVFVPSGWHHQVLNLGDT  294 (427)
T ss_pred             CCceeeccCccccccccccce
Confidence            999999999999999999986


No 139
>PRK09392 ftrB transcriptional activator FtrB; Provisional
Probab=42.62  E-value=55  Score=27.30  Aligned_cols=52  Identities=15%  Similarity=0.197  Sum_probs=35.0

Q ss_pred             EEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEE
Q 048097           99 RIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVF  154 (224)
Q Consensus        99 ~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~  154 (224)
                      ...+++|..+- +-......+.+|++|.+.+.....+   ++..-..+.+||++-.
T Consensus        32 ~~~~~~ge~l~-~~g~~~~~~~~v~~G~v~~~~~~~~---~~~~i~~~~~g~~~g~   83 (236)
T PRK09392         32 LQRFPPGTMLI-TEGEPADFLFVVLDGLVELSASSQD---RETTLAILRPVSTFIL   83 (236)
T ss_pred             eeecCCCCEEE-eCCCccceEEEEEeCEEEEEEcCCC---ceEEEEEeCCCchhhh
Confidence            45677776543 3344467999999999999765432   4444567899998643


No 140
>PF13994 PgaD:  PgaD-like protein
Probab=41.61  E-value=31  Score=27.24  Aligned_cols=24  Identities=25%  Similarity=0.634  Sum_probs=22.0

Q ss_pred             CCCHHHHHhhcCCCHHHHHHhhhh
Q 048097          196 PINPDFLGKAFQLDPKIVKDLQDK  219 (224)
Q Consensus       196 ~~p~~vLa~af~~~~~~v~~l~~~  219 (224)
                      +++++-+|+.|++++++++++++.
T Consensus       100 ~~~~~elA~~f~l~~~~l~~lr~~  123 (138)
T PF13994_consen  100 PVSDEELARSFGLSPEQLQQLRQA  123 (138)
T ss_pred             CCCHHHHHHHcCCCHHHHHHHHhC
Confidence            389999999999999999999875


No 141
>KOG3416 consensus Predicted nucleic acid binding protein [General function prediction only]
Probab=40.02  E-value=1.2e+02  Score=24.11  Aligned_cols=66  Identities=14%  Similarity=0.179  Sum_probs=44.2

Q ss_pred             cCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEe----cEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEE
Q 048097           87 IPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLE----GTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQ  162 (224)
Q Consensus        87 ~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~----G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~  162 (224)
                      -|+++  ++...++.+++|.....-   +..|+..++-    |++.+.+-++.   +    ..++|||++-+-.|..-.+
T Consensus        11 ~P~~k--N~~v~fIvl~~g~~tkTk---dg~~v~~~kVaD~TgsI~isvW~e~---~----~~~~PGDIirLt~Gy~Si~   78 (134)
T KOG3416|consen   11 KPGLK--NINVTFIVLEYGRATKTK---DGHEVRSCKVADETGSINISVWDEE---G----CLIQPGDIIRLTGGYASIF   78 (134)
T ss_pred             Chhhh--cceEEEEEEeeceeeecc---CCCEEEEEEEecccceEEEEEecCc---C----cccCCccEEEecccchhhh
Confidence            36666  566677777777654433   3457666653    56666666543   2    4689999999999988777


Q ss_pred             Ee
Q 048097          163 VN  164 (224)
Q Consensus       163 ~N  164 (224)
                      ++
T Consensus        79 qg   80 (134)
T KOG3416|consen   79 QG   80 (134)
T ss_pred             cC
Confidence            65


No 142
>PRK14584 hmsS hemin storage system protein; Provisional
Probab=39.45  E-value=35  Score=27.86  Aligned_cols=25  Identities=28%  Similarity=0.655  Sum_probs=22.8

Q ss_pred             CCCCHHHHHhhcCCCHHHHHHhhhh
Q 048097          195 PPINPDFLGKAFQLDPKIVKDLQDK  219 (224)
Q Consensus       195 p~~p~~vLa~af~~~~~~v~~l~~~  219 (224)
                      |.++++-+|+.|+++++.++++++.
T Consensus        97 ~~l~~dElA~sF~l~~e~i~qLr~~  121 (153)
T PRK14584         97 PDLDDDELASSFALSPELIAQLKSG  121 (153)
T ss_pred             CCCChHHHHHHcCCCHHHHHHHHhC
Confidence            4699999999999999999999875


No 143
>PF02787 CPSase_L_D3:  Carbamoyl-phosphate synthetase large chain, oligomerisation domain;  InterPro: IPR005480 Carbamoyl phosphate synthase (CPSase) is a heterodimeric enzyme composed of a small and a large subunit (with the exception of CPSase III, see below). CPSase catalyses the synthesis of carbamoyl phosphate from biocarbonate, ATP and glutamine (6.3.5.5 from EC) or ammonia (6.3.4.16 from EC), and represents the first committed step in pyrimidine and arginine biosynthesis in prokaryotes and eukaryotes, and in the urea cycle in most terrestrial vertebrates [, ]. CPSase has three active sites, one in the small subunit and two in the large subunit. The small subunit contains the glutamine binding site and catalyses the hydrolysis of glutamine to glutamate and ammonia. The large subunit has two homologous carboxy phosphate domains, both of which have ATP-binding sites; however, the N-terminal carboxy phosphate domain catalyses the phosphorylation of biocarbonate, while the C-terminal domain catalyses the phosphorylation of the carbamate intermediate []. The carboxy phosphate domain found duplicated in the large subunit of CPSase is also present as a single copy in the biotin-dependent enzymes acetyl-CoA carboxylase (6.4.1.2 from EC) (ACC), propionyl-CoA carboxylase (6.4.1.3 from EC) (PCCase), pyruvate carboxylase (6.4.1.1 from EC) (PC) and urea carboxylase (6.3.4.6 from EC). Most prokaryotes carry one form of CPSase that participates in both arginine and pyrimidine biosynthesis, however certain bacteria can have separate forms. The large subunit in bacterial CPSase has four structural domains: the carboxy phosphate domain 1, the oligomerisation domain, the carbamoyl phosphate domain 2 and the allosteric domain []. CPSase heterodimers from Escherichia coli contain two molecular tunnels: an ammonia tunnel and a carbamate tunnel. These inter-domain tunnels connect the three distinct active sites, and function as conduits for the transport of unstable reaction intermediates (ammonia and carbamate) between successive active sites []. The catalytic mechanism of CPSase involves the diffusion of carbamate through the interior of the enzyme from the site of synthesis within the N-terminal domain of the large subunit to the site of phosphorylation within the C-terminal domain. Eukaryotes have two distinct forms of CPSase: a mitochondrial enzyme (CPSase I) that participates in both arginine biosynthesis and the urea cycle; and a cytosolic enzyme (CPSase II) involved in pyrimidine biosynthesis. CPSase II occurs as part of a multi-enzyme complex along with aspartate transcarbamoylase and dihydroorotase; this complex is referred to as the CAD protein []. The hepatic expression of CPSase is transcriptionally regulated by glucocorticoids and/or cAMP []. There is a third form of the enzyme, CPSase III, found in fish, which uses glutamine as a nitrogen source instead of ammonia []. CPSase III is closely related to CPSase I, and is composed of a single polypeptide that may have arisen from gene fusion of the glutaminase and synthetase domains [].  This entry represents the oligomerisation domain found in the large subunit of carbamoyl phosphate synthases as well as in certain other carboxy phsophate domain-containing enzymes.; GO: 0006807 nitrogen compound metabolic process; PDB: 1M6V_C 1CS0_C 1C30_E 1C3O_G 1BXR_A 1T36_E 1A9X_A 1KEE_G 1CE8_A 1JDB_H ....
Probab=38.23  E-value=32  Score=26.77  Aligned_cols=26  Identities=8%  Similarity=0.204  Sum_probs=20.8

Q ss_pred             CCCHHHHHhhcCCCHHHHHHhhhhhc
Q 048097          196 PINPDFLGKAFQLDPKIVKDLQDKFI  221 (224)
Q Consensus       196 ~~p~~vLa~af~~~~~~v~~l~~~~~  221 (224)
                      |+++..+|+..++++++|+++++..+
T Consensus        72 GFsD~~IA~l~~~~e~~vr~~R~~~~   97 (123)
T PF02787_consen   72 GFSDRQIARLWGVSEEEVRELRKEHG   97 (123)
T ss_dssp             T--HHHHHHHHTS-HHHHHHHHHHHT
T ss_pred             CCCHHHHHhccCCCHHHHHHHHHHcC
Confidence            59999999999999999999998754


No 144
>PF13348 Y_phosphatase3C:  Tyrosine phosphatase family C-terminal region; PDB: 1YWF_A 2OZ5_B.
Probab=37.30  E-value=34  Score=23.17  Aligned_cols=24  Identities=13%  Similarity=0.367  Sum_probs=17.8

Q ss_pred             CCHHHHHhhcCCCHHHHHHhhhhh
Q 048097          197 INPDFLGKAFQLDPKIVKDLQDKF  220 (224)
Q Consensus       197 ~p~~vLa~af~~~~~~v~~l~~~~  220 (224)
                      =.+.-|.+.+|++++++++||+++
T Consensus        44 s~e~Yl~~~lgl~~~~i~~Lr~~l   67 (68)
T PF13348_consen   44 SVENYLREELGLSEEDIERLRERL   67 (68)
T ss_dssp             SHHHHHHHT-T--HHHHHHHHHHH
T ss_pred             CHHHHHHHcCCCCHHHHHHHHHHc
Confidence            456788899999999999999875


No 145
>PF10365 DUF2436:  Domain of unknown function (DUF2436);  InterPro: IPR018832  Gingipains R and K are endopeptidases with specificity for arginyl and lysyl bonds, respectively. Like other cysteine peptidases, they require reducing conditions for activity. They are maximally active at approximately neutral pH. Gingipains R and K are secreted by the bacterium Porphyromonas gingivalis (Bacteroides gingivalis). The bacterium is a major pathogen in periodontal disease, and the many ways in which the activities of the gingipains may contribute to the disease processes have been reviewed []. These enzymes are also involved in the hemagglutinating activity of the organisms.  This entry represents a central region found in gingipain K peptidases, active on lysyl bonds; they belong to the MEROPS peptidase family C25 (gingipain family, clan CD).  
Probab=35.71  E-value=49  Score=26.77  Aligned_cols=38  Identities=16%  Similarity=0.406  Sum_probs=25.7

Q ss_pred             CCCCcceEeeccCCCCcceecCcccCCCCCCCCCCeeeec
Q 048097           25 PSPLQDICVAIIDHKDGVFVNGKFCKDPKLAKAEDFFLSG   64 (224)
Q Consensus        25 ~~~~~dfcv~~~~~~~~~~~~g~~ck~p~~~~~~df~f~~   64 (224)
                      |.-..|||++.|.....+.+-|.--..  ....+||+|..
T Consensus       105 PaG~YDy~I~~P~~~~kiwIaGd~g~~--~tr~dDy~fEA  142 (161)
T PF10365_consen  105 PAGTYDYCIAAPQPGGKIWIAGDGGDG--PTRGDDYVFEA  142 (161)
T ss_pred             cCceeEEEEecCCCCCeEEEecCCCCC--CccccceEEec
Confidence            566789999966555567777753222  23579999973


No 146
>PLN03192 Voltage-dependent potassium channel; Provisional
Probab=34.37  E-value=90  Score=31.78  Aligned_cols=53  Identities=13%  Similarity=0.194  Sum_probs=34.1

Q ss_pred             EEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097           96 SAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus        96 s~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      .+....+.||..+-.-=. .++++.+|++|++.+... ..+  ++..-..+++||+|
T Consensus       396 ~~~~~~~~pge~I~~qge-~~~~lY~I~~G~V~i~~~-~~~--~e~~l~~l~~Gd~F  448 (823)
T PLN03192        396 KMKAEYIPPREDVIMQNE-APDDVYIVVSGEVEIIDS-EGE--KERVVGTLGCGDIF  448 (823)
T ss_pred             hhheeeeCCCCEEEECCC-CCceEEEEEecEEEEEEe-cCC--cceeeEEccCCCEe
Confidence            344456778875432222 357899999999988532 221  33344679999988


No 147
>COG1741 Pirin-related protein [General function prediction only]
Probab=34.37  E-value=3.4e+02  Score=24.19  Aligned_cols=43  Identities=21%  Similarity=0.128  Sum_probs=30.7

Q ss_pred             ccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEE
Q 048097           86 QIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVG  130 (224)
Q Consensus        86 ~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~  130 (224)
                      ..|.-... +.+..+.+++|+..+.+ =+.-.-++||++|++.+.
T Consensus       165 ~~pv~~~~-~~~~dl~l~~g~~~~l~-~~~~~~~l~v~~G~l~v~  207 (276)
T COG1741         165 SSPVRQDS-LHYVDLRLEAGARLQLP-PAGRRAYLYVIEGTLEVN  207 (276)
T ss_pred             ccccccce-eEEEEEEeCCCceEecC-CCCceEEEEEEEeEEEEc
Confidence            44544444 77888899999987776 222357899999988773


No 148
>PF06719 AraC_N:  AraC-type transcriptional regulator N-terminus;  InterPro: IPR009594 This entry represents the N terminus of bacterial ARAC-type transcriptional regulators. In Escherichia coli these regulate the L-arabinose operon through sensing the presence of arabinose, and when the sugar is present, transmitting this information from the arabinose-binding domains to the protein s DNA-binding domains []. This family might represent the N-terminal arm of the protein, which binds to the C-terminal DNA binding domains to hold them in a state where the protein prefers to loop and remain non-activating []. This domain is associated with the IPR000005 from INTERPRO domain.
Probab=33.53  E-value=1.9e+02  Score=22.94  Aligned_cols=70  Identities=19%  Similarity=0.138  Sum_probs=45.5

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEe---CCCCcE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVN---IGKTSA  170 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N---~G~~~a  170 (224)
                      |+++.|.+-.- ... +...  ..=+.+|++|+=++.+.+      +  .+.+.+|+.++.+..++-...-   ..++|.
T Consensus         5 gl~i~r~~~~~-~~~-~~~y--~p~i~~vlQG~K~~~~g~------~--~~~Y~~g~~lv~~~~lPv~~~v~~AS~~~P~   72 (155)
T PF06719_consen    5 GLSIFRSSRPT-PPM-PCVY--EPSICIVLQGSKRVHLGD------Q--VFEYDAGQYLVSSVDLPVESEVVEASPEEPY   72 (155)
T ss_pred             CEEEEEECCCC-CCc-ceec--CCeEEEEEeeeEEEEECC------c--eEEecCCcEEEecCCCcEEEEEeeccCCCCE
Confidence            45666644332 222 2222  256899999999888752      2  4889999999999998876644   335565


Q ss_pred             EEEEE
Q 048097          171 VAFAG  175 (224)
Q Consensus       171 ~~l~~  175 (224)
                      ..+..
T Consensus        73 l~l~l   77 (155)
T PF06719_consen   73 LALSL   77 (155)
T ss_pred             EEEEE
Confidence            55543


No 149
>PF14801 GCD14_N:  tRNA methyltransferase complex GCD14 subunit N-term; PDB: 1I9G_A.
Probab=32.34  E-value=1e+02  Score=20.73  Aligned_cols=36  Identities=22%  Similarity=0.206  Sum_probs=22.2

Q ss_pred             EEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCC
Q 048097          128 YVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIG  166 (224)
Q Consensus       128 ~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G  166 (224)
                      +|.+-++.   +|.++.+|++|..|.--+|.++.-.-.|
T Consensus        11 rVQlTD~K---gr~~Ti~L~~G~~fhThrG~i~HDdlIG   46 (54)
T PF14801_consen   11 RVQLTDPK---GRKHTITLEPGGEFHTHRGAIRHDDLIG   46 (54)
T ss_dssp             EEEEEETT-----EEEEE--TT-EEEETTEEEEHHHHTT
T ss_pred             EEEEccCC---CCeeeEEECCCCeEEcCccccchhheec
Confidence            35566766   7888999999999998888776543334


No 150
>PLN02288 mannose-6-phosphate isomerase
Probab=32.32  E-value=34  Score=32.02  Aligned_cols=20  Identities=20%  Similarity=0.210  Sum_probs=18.6

Q ss_pred             EEecCCCEEEEcCCCeeEEE
Q 048097          144 KVLNKGDVFVFPIGLIHFQV  163 (224)
Q Consensus       144 ~~l~~GDv~v~P~G~~H~~~  163 (224)
                      ..|++||.+++|+|.+|...
T Consensus       253 v~L~PGeaifl~ag~~HAYl  272 (394)
T PLN02288        253 VKLNPGEALYLGANEPHAYL  272 (394)
T ss_pred             EecCCCCEEEecCCCCceec
Confidence            68999999999999999874


No 151
>PF04202 Mfp-3:  Foot protein 3;  InterPro: IPR007328 Mytilus foot protein-3 (Mfp-3) is a highly polymorphic protein family located in the byssal adhesive plaques of blue mussels.
Probab=30.84  E-value=47  Score=23.30  Aligned_cols=25  Identities=24%  Similarity=0.344  Sum_probs=13.5

Q ss_pred             CchhHHHHHHHHHHHHhhhhhccCCC
Q 048097            1 MKAIQFLIGFALFALASSLASAYDPS   26 (224)
Q Consensus         1 m~~~~~~~~~~~~~~~~~~~~~~d~~   26 (224)
                      |..+++.+|++|+++ -++|.-||++
T Consensus         1 mnn~Si~VLlaLvLI-g~fAVqSdag   25 (71)
T PF04202_consen    1 MNNLSIAVLLALVLI-GSFAVQSDAG   25 (71)
T ss_pred             CCchhHHHHHHHHHH-hhheeeecCc
Confidence            555555554444433 3555667775


No 152
>PRK02290 3-dehydroquinate synthase; Provisional
Probab=30.49  E-value=1.5e+02  Score=27.36  Aligned_cols=82  Identities=18%  Similarity=0.163  Sum_probs=60.2

Q ss_pred             CCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCe-eEEEEecCCCEE
Q 048097           74 RLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNT-LIAKVLNKGDVF  152 (224)
Q Consensus        74 ~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k-~~~~~l~~GDv~  152 (224)
                      ..|..|..++.+-    ++.-+.+.|+.++..-++.-+..-+...+-.+++..-++.++.++   ++ +-...|++||-+
T Consensus       250 ~sG~eVlvVd~~G----~tR~~~VGRvKIE~RPL~lIeAe~~g~~~~viLQnaetIrlv~~d---G~~vsVt~Lk~GD~V  322 (344)
T PRK02290        250 RSGDEVLVVDADG----NTREAIVGRVKIEKRPLLLIEAEYGGKRIRTILQNAETIRLVTPD---GKPVSVVDLKPGDEV  322 (344)
T ss_pred             cCCCEEEEEeCCC----CEEEEEeeEEEEeeccEEEEEEEeCCeEEEEEEecCcEEEEECCC---CCEeeeeecCCCCEE
Confidence            4577777776432    233578889999998887666665788999999999999999887   44 334789999977


Q ss_pred             E--EcCCCeeEE
Q 048097          153 V--FPIGLIHFQ  162 (224)
Q Consensus       153 v--~P~G~~H~~  162 (224)
                      .  ++.+-=||-
T Consensus       323 L~~~~~~~RHfG  334 (344)
T PRK02290        323 LGYLEEAARHFG  334 (344)
T ss_pred             EEEecCCccccc
Confidence            4  455555654


No 153
>PF05721 PhyH:  Phytanoyl-CoA dioxygenase (PhyH);  InterPro: IPR008775 This family is made up of several eukaryotic phytanoyl-CoA dioxygenase (PhyH) proteins as well as a number of bacterial deoxygenases. PhyH is a peroxisomal enzyme catalysing the first step of phytanic acid alpha-oxidation. PhyH deficiency causes Refsum's disease (RD) which is an inherited neurological syndrome biochemically characterised by the accumulation of phytanic acid in plasma and tissues [].; PDB: 3GJA_A 3EMR_A 3OBZ_A 2OPW_A 3NNL_B 3NNF_A 3NNM_B 3NNJ_A 2FCV_B 2FCU_A ....
Probab=29.91  E-value=94  Score=24.49  Aligned_cols=30  Identities=27%  Similarity=0.378  Sum_probs=21.6

Q ss_pred             eeEEEEecCCCEEEEcCCCeeEE-EeCCCCc
Q 048097          140 TLIAKVLNKGDVFVFPIGLIHFQ-VNIGKTS  169 (224)
Q Consensus       140 k~~~~~l~~GDv~v~P~G~~H~~-~N~G~~~  169 (224)
                      ......+++||++++..-++|.- .|.+..+
T Consensus       178 ~~~~~~~~~Gdvl~~~~~~~H~s~~N~s~~~  208 (211)
T PF05721_consen  178 EWVPVPMKAGDVLFFHSRLIHGSGPNTSDDP  208 (211)
T ss_dssp             GCEEE-BSTTEEEEEETTSEEEEE-B-SSST
T ss_pred             ceEEeecCCCeEEEEcCCccccCCCCCCcCc
Confidence            34467899999999999999996 4555543


No 154
>KOG2132 consensus Uncharacterized conserved protein, contains JmjC domain [Chromatin structure and dynamics; Signal transduction mechanisms]
Probab=29.29  E-value=23  Score=32.51  Aligned_cols=82  Identities=13%  Similarity=0.165  Sum_probs=58.4

Q ss_pred             ccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCC------------------------
Q 048097           82 ANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQL------------------------  137 (224)
Q Consensus        82 ~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~------------------------  137 (224)
                      =+.-.+|+.+..++.+...-.+.|.+.|.|.-|. .-++.-+.|+.++.+.-+...                        
T Consensus       237 PDyc~~~~f~~~~v~~~~w~GpaGtV~pih~dp~-hNi~~qv~G~k~i~l~~p~~s~~lyP~d~~~~~tsqvdvenPdlk  315 (355)
T KOG2132|consen  237 PDYCSFPNFENEVVDINAWIGPAGTVLPIHMDPW-HNILSQVFGRKRIRLYPPEDSGALYPTDTYLLETSQVDVENPDLK  315 (355)
T ss_pred             CceeecCCCCccccceeEEeccCCceeccccccc-cceeeeeecceEEEEecCcccCCCCCccchhhcccccccCCCChh
Confidence            3445667777666777777777799999997775 678888889988887643210                        


Q ss_pred             ------CCeeEEEEecCCCEEEEcCCCeeEEEe
Q 048097          138 ------NNTLIAKVLNKGDVFVFPIGLIHFQVN  164 (224)
Q Consensus       138 ------~~k~~~~~l~~GDv~v~P~G~~H~~~N  164 (224)
                            ..+.....|.+||++++|+-..|+..-
T Consensus       316 ~fp~~~k~~~l~~lL~pGe~L~iP~kwwhyvrs  348 (355)
T KOG2132|consen  316 AFPKFAKARFLDCLLEPGEALFIPPKWWHYVRS  348 (355)
T ss_pred             hhhHHHHHHHHHHhcCCchhccccHHHhhhhhh
Confidence                  111223468999999999999998753


No 155
>KOG0500 consensus Cyclic nucleotide-gated cation channel CNGA1-3 and related proteins [Inorganic ion transport and metabolism; Signal transduction mechanisms]
Probab=28.46  E-value=1.1e+02  Score=29.67  Aligned_cols=32  Identities=34%  Similarity=0.557  Sum_probs=24.8

Q ss_pred             CcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097          116 ATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus       116 a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      +.|+++|.+|.+.+  ++++   +...-.+|++|++|
T Consensus       348 gkEMyIVk~G~L~V--v~dD---g~t~~~~L~~G~~F  379 (536)
T KOG0500|consen  348 GKEMYIVKEGKLAV--VADD---GVTVFVTLKAGSVF  379 (536)
T ss_pred             cceEEEEEccEEEE--EecC---CcEEEEEecCCcee
Confidence            78999999999987  3444   44345789999987


No 156
>PF01959 DHQS:  3-dehydroquinate synthase (EC 4.6.1.3);  InterPro: IPR002812 3-Dehydroquinate synthase (4.2.3.4 from EC) is an enzyme in the common pathway of aromatic amino acid biosynthesis that catalyses the conversion of 3-deoxy-D-arabino-heptulosonic acid 7-phosphate (DAHP) into 3-dehydroquinic acid []. This synthesis of aromatic amino acids is an essential metabolic function for most prokaryotic as well as lower eukaryotic cells, including plants. The pathway is absent in humans; therefore, DHQS represents a potential target for the development of novel and selective antimicrobial agents. Owing to the threat posed by the spread of pathogenic bacteria resistant to many currently used antimicrobial drugs, there is clearly a need to develop new anti-infective drugs acting at novel targets. A further potential use for DHQS inhibitors is as herbicides [].; GO: 0016491 oxidoreductase activity, 0055114 oxidation-reduction process
Probab=26.96  E-value=1.8e+02  Score=26.92  Aligned_cols=83  Identities=17%  Similarity=0.165  Sum_probs=60.3

Q ss_pred             CCCeeEEEccccccCcccccceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCe-eEEEEecCCCEE
Q 048097           74 RLGFNVTNANVEQIPGLNTLGTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNT-LIAKVLNKGDVF  152 (224)
Q Consensus        74 ~~g~~v~~~~~~~~p~L~~lgis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k-~~~~~l~~GDv~  152 (224)
                      ..|..|..++.+-    ++.-+.+.|+.++..-++.-+-..+..++..+++..-++.++.++   ++ +-...|++||-+
T Consensus       260 ~sG~~VlvVd~~G----~tR~~~VGRvKIE~RPLllIeA~~~g~~~svilQnaetIRlv~p~---G~~vsVt~Lk~GD~v  332 (354)
T PF01959_consen  260 RSGDEVLVVDADG----RTRTAIVGRVKIERRPLLLIEAEADGKRISVILQNAETIRLVGPD---GEPVSVTELKPGDEV  332 (354)
T ss_pred             cCCCEEEEEeCCC----CEEEEEeeEEEEeecceEEEEEEeCCeEEEEEEecCcEEEEECCC---CCEeeeeecCCCCEE
Confidence            4577777776432    233578889999988877666555789999999999999999887   44 334789999977


Q ss_pred             E--EcCCCeeEEE
Q 048097          153 V--FPIGLIHFQV  163 (224)
Q Consensus       153 v--~P~G~~H~~~  163 (224)
                      .  ++.+-=||-.
T Consensus       333 L~~~~~~~RHfG~  345 (354)
T PF01959_consen  333 LVYLEEAGRHFGM  345 (354)
T ss_pred             EEEecCCCcccce
Confidence            4  4555666543


No 157
>PF13384 HTH_23:  Homeodomain-like domain; PDB: 2X48_C.
Probab=26.78  E-value=69  Score=19.94  Aligned_cols=26  Identities=8%  Similarity=0.038  Sum_probs=18.8

Q ss_pred             CCCHHHHHhhcCCCHHHHHHhhhhhc
Q 048097          196 PINPDFLGKAFQLDPKIVKDLQDKFI  221 (224)
Q Consensus       196 ~~p~~vLa~af~~~~~~v~~l~~~~~  221 (224)
                      +.+..-+++.++++..+|.+..++|.
T Consensus        17 G~s~~~ia~~lgvs~~Tv~~w~kr~~   42 (50)
T PF13384_consen   17 GWSIREIAKRLGVSRSTVYRWIKRYR   42 (50)
T ss_dssp             T--HHHHHHHHTS-HHHHHHHHT---
T ss_pred             CCCHHHHHHHHCcCHHHHHHHHHHcc
Confidence            48889999999999999999998875


No 158
>PHA00672 hypothetical protein
Probab=24.72  E-value=3.6e+02  Score=21.49  Aligned_cols=67  Identities=16%  Similarity=-0.004  Sum_probs=50.3

Q ss_pred             ceEEEEEEEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCCCCcE
Q 048097           94 GTSAVRIDYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSA  170 (224)
Q Consensus        94 gis~~~v~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a  170 (224)
                      |+....+.++.|-++.=-.|.  -|-+++.+|.+++....      .  .+.|+.=.++.-|+|.-...+...+...
T Consensus        46 GvYARei~IPkGt~LtG~~hk--f~~~ii~sG~itV~tdg------e--~~rl~g~~~i~~~aG~KragyAHeDT~w  112 (152)
T PHA00672         46 GVYARTIRIPAGVALTGALIK--VSTVLIFSGHATVFIGG------E--AVELRGYHVIPASAGRKQAFVAHADTDL  112 (152)
T ss_pred             ceeEEEEeccCceeeeeeeeE--eeEEEEecccEEEEeCC------c--EEEEecceeeecCCCcccceeeeccceE
Confidence            788888999999988777774  34459999999996542      2  3678888888888888777766555443


No 159
>TIGR02408 ectoine_ThpD ectoine hydroxylase. Both ectoine and hydroxyectoine are compatible solvents that serve as protectants against osmotic and thermal stresses. A number of genomes synthesize ectoine. This enzyme allows conversion of ectoine to hydroxyectoine, which may be more effective for some purposes, and is found in a subset of ectoine-producing organisms.
Probab=24.21  E-value=98  Score=27.07  Aligned_cols=38  Identities=21%  Similarity=0.129  Sum_probs=28.3

Q ss_pred             EEEecCCCEEEEcCCCeeEE-EeCCCCc-EEEEEEEeCCC
Q 048097          143 AKVLNKGDVFVFPIGLIHFQ-VNIGKTS-AVAFAGFSSQF  180 (224)
Q Consensus       143 ~~~l~~GDv~v~P~G~~H~~-~N~G~~~-a~~l~~~~s~~  180 (224)
                      ...+++||+++|-.-++|.- .|.++.+ ..++..|++.+
T Consensus       212 ~~~~~aGDvl~f~~~~~H~S~~N~s~~~R~~l~l~y~~~~  251 (277)
T TIGR02408       212 TFTGKAGSAVWFDCNTMHGSGSNITPWPRSNVFMVFNSVE  251 (277)
T ss_pred             eeccCCceEEEEccccccCCCCCCCCCcceeEEEEEecCC
Confidence            45689999999999999996 5666554 45555676543


No 160
>KOG0498 consensus K+-channel ERG and related proteins, contain PAS/PAC sensor domain [Inorganic ion transport and metabolism; Signal transduction mechanisms]
Probab=24.06  E-value=1.3e+02  Score=30.49  Aligned_cols=48  Identities=19%  Similarity=0.358  Sum_probs=32.2

Q ss_pred             EEcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEE
Q 048097          101 DYAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVF  152 (224)
Q Consensus       101 ~l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~  152 (224)
                      -+.||..+-..=.+ -+|+.+|++|.+.+.-  .++ |+......|++||.+
T Consensus       446 ~f~pge~iireGd~-v~~myFI~rG~le~~~--~~~-g~~~~~~~L~~Gd~~  493 (727)
T KOG0498|consen  446 YFTPGEYIIREGDP-VTDMYFIVRGSLESIT--TDG-GGFFVVAILGPGDFF  493 (727)
T ss_pred             ccCCCCeEEecCCc-cceeEEEEeeeEEEEE--ccC-CceEEEEEecCCCcc
Confidence            34566655545455 5899999999997743  221 133446789999998


No 161
>KOG1633 consensus F-box protein JEMMA and related proteins with JmjC, PHD, F-box and LRR domains [Chromatin structure and dynamics]
Probab=24.01  E-value=86  Score=32.07  Aligned_cols=41  Identities=17%  Similarity=0.195  Sum_probs=28.9

Q ss_pred             CeeEEEEecCCCEEEEcCCCeeEEEeCCCCcEEEEEEEeCC
Q 048097          139 NTLIAKVLNKGDVFVFPIGLIHFQVNIGKTSAVAFAGFSSQ  179 (224)
Q Consensus       139 ~k~~~~~l~~GDv~v~P~G~~H~~~N~G~~~a~~l~~~~s~  179 (224)
                      .+.+.-.|++|+.++||.|.+|..+-.-+.-+...-.+.++
T Consensus       193 dkC~~~~l~~g~T~~iPsGwIhAV~Tp~d~l~fgGnflhsl  233 (776)
T KOG1633|consen  193 DKCYKCILKQGQTLFIPSGWIHAVLTPTDCLVFGGNFLHSL  233 (776)
T ss_pred             ceeEEEEeccCceEecccceeEeeecCcchheeccchhhhh
Confidence            34566789999999999999999986655444433333333


No 162
>KOG1356 consensus Putative transcription factor 5qNCA, contains JmjC domain [Transcription]
Probab=23.39  E-value=31  Score=35.37  Aligned_cols=62  Identities=16%  Similarity=0.043  Sum_probs=36.4

Q ss_pred             EcCCCcCCCccCCCCcEEEEEEecEEEEEEEeCCCCCCeeEEEEecCCCEEEEcCCCeeEEEeCC
Q 048097          102 YAPYGQNPPHTHPRATEILVVLEGTLYVGFVTSNQLNNTLIAKVLNKGDVFVFPIGLIHFQVNIG  166 (224)
Q Consensus       102 l~pgg~~ppH~Hp~a~Ei~~Vl~G~~~v~~v~~~~~~~k~~~~~l~~GDv~v~P~G~~H~~~N~G  166 (224)
                      .+-|.-+++-.||-.+.-.|.-.+- +..+..+-  |-+-.+++=..||.++||+|.+|.++|.-
T Consensus       762 ~E~~~~~~~v~hPIhDQS~YLd~~l-r~RLkeEy--GVe~WtfvQ~LGdAVfIPAGaPHQVrNLk  823 (889)
T KOG1356|consen  762 KEQGHEVPKVHHPIHDQSWYLDRYL-RRRLKEEY--GVEPWTFVQFLGDAVFIPAGAPHQVRNLK  823 (889)
T ss_pred             HHhcCCCCcccCCCcccceeccHHH-HHHHHHHh--CCCccchhhcccceEEecCCCcHHhhhhh
Confidence            3445566666788666655543331 00000000  01223456688999999999999999864


No 163
>PF08194 DIM:  DIM protein;  InterPro: IPR013172 Drosophila immune-induced molecules (DIMs) are short proteins induced during the immune response of Drosophila []. This entry includes DIMs 1 to 4 and DIM23.
Probab=22.28  E-value=78  Score=19.49  Aligned_cols=10  Identities=50%  Similarity=1.032  Sum_probs=6.5

Q ss_pred             CcceecCcccC
Q 048097           40 DGVFVNGKFCK   50 (224)
Q Consensus        40 ~~~~~~g~~ck   50 (224)
                      ..+.+||. |+
T Consensus        24 G~ViING~-C~   33 (36)
T PF08194_consen   24 GNVIINGK-CI   33 (36)
T ss_pred             CeEEECce-ee
Confidence            45788885 44


No 164
>PF00325 Crp:  Bacterial regulatory proteins, crp family;  InterPro: IPR001808 Numerous bacterial transcription regulatory proteins bind DNA via a helix-turn-helix (HTH) motif. These proteins are very diverse, but for convenience may be grouped into subfamilies on the basis of sequence similarity. This family groups together a range of proteins, including anr, crp, clp, cysR, fixK, flp, fnr, fnrN, hlyX and ntcA [, ]. Within this family, the HTH motif is situated towards the C terminus.; GO: 0003700 sequence-specific DNA binding transcription factor activity, 0006355 regulation of transcription, DNA-dependent, 0005622 intracellular; PDB: 2OZ6_A 1CGP_B 2GZW_C 1O3T_B 3ROU_A 2CGP_A 3RDI_A 1I5Z_A 3IYD_H 3FWE_B ....
Probab=20.97  E-value=1e+02  Score=18.34  Aligned_cols=25  Identities=12%  Similarity=0.165  Sum_probs=19.1

Q ss_pred             CCHHHHHhhcCCCHHHHHHhhhhhc
Q 048097          197 INPDFLGKAFQLDPKIVKDLQDKFI  221 (224)
Q Consensus       197 ~p~~vLa~af~~~~~~v~~l~~~~~  221 (224)
                      ++.+-+|...|+..++|.++-+++.
T Consensus         3 mtr~diA~~lG~t~ETVSR~l~~l~   27 (32)
T PF00325_consen    3 MTRQDIADYLGLTRETVSRILKKLE   27 (32)
T ss_dssp             --HHHHHHHHTS-HHHHHHHHHHHH
T ss_pred             cCHHHHHHHhCCcHHHHHHHHHHHH
Confidence            6778899999999999998887764


Done!