Query         026827
Match_columns 232
No_of_seqs    80 out of 82
Neff          3.1 
Searched_HMMs 46136
Date          Fri Mar 29 13:16:43 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/026827.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/026827hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PF00595 PDZ:  PDZ domain (Also  98.8 2.2E-08 4.7E-13   71.9   7.1   74   88-166     1-81  (81)
  2 cd00992 PDZ_signaling PDZ doma  98.3 4.7E-06   1E-10   58.5   8.3   67   92-165    11-81  (82)
  3 cd00136 PDZ PDZ domain, also c  98.2   7E-06 1.5E-10   56.5   7.0   66   93-165     1-69  (70)
  4 PF13180 PDZ_2:  PDZ domain; PD  98.1 1.8E-05 3.9E-10   57.3   7.1   67   95-168     3-72  (82)
  5 smart00228 PDZ Domain present   98.1   4E-05 8.7E-10   53.4   8.5   74   88-168     4-84  (85)
  6 KOG3571 Dishevelled 3 and rela  97.8 0.00013 2.7E-09   72.5   9.4   89   81-171   245-342 (626)
  7 cd00990 PDZ_glycyl_aminopeptid  97.7 0.00014 3.1E-09   51.4   6.6   64   95-167     3-66  (80)
  8 cd00988 PDZ_CTP_protease PDZ d  97.5 0.00057 1.2E-08   48.6   7.7   66   95-168     4-72  (85)
  9 cd00987 PDZ_serine_protease PD  97.4 0.00059 1.3E-08   48.6   6.2   58  104-168    23-82  (90)
 10 cd00991 PDZ_archaeal_metallopr  97.1   0.002 4.3E-08   46.7   6.8   57  104-167     9-67  (79)
 11 cd00989 PDZ_metalloprotease PD  97.0  0.0041 8.8E-08   43.5   7.0   55  106-167    13-68  (79)
 12 KOG0609 Calcium/calmodulin-dep  96.5  0.0095 2.1E-07   59.3   8.2   73   92-168   133-205 (542)
 13 cd00986 PDZ_LON_protease PDZ d  96.5   0.014   3E-07   41.7   6.6   55  106-168     9-65  (79)
 14 TIGR00225 prc C-terminal pepti  96.4   0.012 2.5E-07   53.3   7.4   68   95-168    53-121 (334)
 15 TIGR02037 degP_htrA_DO peripla  96.3   0.013 2.8E-07   54.6   7.3   67   95-168   236-315 (428)
 16 COG0793 Prc Periplasmic protea  96.2   0.015 3.3E-07   55.2   7.4   82   85-171    89-174 (406)
 17 PRK11186 carboxy-terminal prot  96.1   0.015 3.3E-07   58.8   7.3   72   95-168   246-320 (667)
 18 TIGR02037 degP_htrA_DO peripla  96.1   0.017 3.7E-07   53.8   7.1   57  105-168   362-420 (428)
 19 PLN00049 carboxyl-terminal pro  95.8   0.036 7.9E-07   51.7   7.6   69   95-168    87-161 (389)
 20 PRK10139 serine endoprotease;   95.8   0.022 4.7E-07   54.6   6.2   57  105-168   390-446 (455)
 21 TIGR02038 protease_degS peripl  95.5   0.027 5.8E-07   51.8   5.5   57  105-168   278-336 (351)
 22 PRK10139 serine endoprotease;   95.4   0.036 7.8E-07   53.1   6.4   57  104-167   289-347 (455)
 23 PRK10942 serine endoprotease;   95.2    0.07 1.5E-06   51.4   7.5   58  104-168   310-369 (473)
 24 PRK10898 serine endoprotease;   95.2   0.049 1.1E-06   50.3   6.2   57  105-168   279-337 (353)
 25 PRK10942 serine endoprotease;   95.1   0.049 1.1E-06   52.4   6.2   58  105-169   408-465 (473)
 26 KOG1892 Actin filament-binding  95.0   0.038 8.3E-07   59.1   5.5   52   84-135   932-990 (1629)
 27 KOG3553 Tax interaction protei  94.8   0.019 4.1E-07   47.5   2.2   32  103-135    57-88  (124)
 28 PRK10779 zinc metallopeptidase  94.7    0.12 2.6E-06   49.0   7.7   57  106-169   222-279 (449)
 29 KOG3209 WW domain-containing p  94.4    0.17 3.6E-06   53.0   8.3   86   80-169   893-983 (984)
 30 KOG3550 Receptor targeting pro  94.3    0.16 3.4E-06   44.8   6.8   76   87-166    92-172 (207)
 31 TIGR01713 typeII_sec_gspC gene  94.1    0.12 2.7E-06   46.4   6.1   67   95-168   179-249 (259)
 32 TIGR00054 RIP metalloprotease   94.1    0.11 2.4E-06   49.0   6.0   58  105-169   203-261 (420)
 33 KOG3580 Tight junction protein  93.7   0.061 1.3E-06   55.4   3.5   43   93-136   417-459 (1027)
 34 KOG3532 Predicted protein kina  93.6    0.15 3.3E-06   53.2   6.3   73   91-170   384-456 (1051)
 35 COG3975 Predicted protease wit  92.8    0.14   3E-06   51.5   4.4   40   95-136   453-492 (558)
 36 KOG3938 RGS-GAIP interacting p  92.7     0.4 8.7E-06   45.3   7.1   76   89-168   133-210 (334)
 37 TIGR00054 RIP metalloprotease   92.3     0.2 4.4E-06   47.3   4.8   56  105-167   128-183 (420)
 38 PRK10779 zinc metallopeptidase  92.2    0.18 3.9E-06   47.8   4.3   56  106-168   127-184 (449)
 39 KOG3606 Cell polarity protein   92.1    0.44 9.5E-06   45.3   6.5   69   92-164   170-249 (358)
 40 KOG3580 Tight junction protein  91.9    0.27 5.7E-06   51.0   5.2   76   92-171   197-281 (1027)
 41 KOG3605 Beta amyloid precursor  91.3    0.12 2.6E-06   53.3   2.2   56   81-136   643-704 (829)
 42 KOG3209 WW domain-containing p  90.8    0.63 1.4E-05   48.9   6.7   79   85-169   649-736 (984)
 43 KOG3542 cAMP-regulated guanine  90.5    0.17 3.8E-06   52.9   2.4   48   87-135   537-591 (1283)
 44 COG0265 DegQ Trypsin-like seri  90.0    0.83 1.8E-05   41.3   6.2   58  106-171   271-330 (347)
 45 KOG3129 26S proteasome regulat  90.0     0.4 8.7E-06   43.7   4.0   69  106-181   140-210 (231)
 46 TIGR03279 cyano_FeS_chp putati  86.7    0.91   2E-05   44.4   4.4   50  109-167     2-51  (433)
 47 TIGR02860 spore_IV_B stage IV   85.0     1.6 3.5E-05   42.3   5.1   65   94-168    97-170 (402)
 48 PF14685 Tricorn_PDZ:  Tricorn   83.7     5.9 0.00013   30.8   6.8   69   95-170     3-81  (88)
 49 KOG3651 Protein kinase C, alph  83.4     9.4  0.0002   37.1   9.4  124   95-224    18-152 (429)
 50 KOG3552 FERM domain protein FR  82.9       3 6.4E-05   45.2   6.4   74   87-168    59-132 (1298)
 51 PF04495 GRASP55_65:  GRASP55/6  75.7      13 0.00029   30.8   6.9   69   93-168    26-101 (138)
 52 PF11874 DUF3394:  Domain of un  71.2     5.3 0.00011   35.2   3.7   40   95-136   113-152 (183)
 53 COG3031 PulC Type II secretory  62.7      10 0.00023   35.5   4.0   62   92-168   204-265 (275)
 54 COG3480 SdrC Predicted secrete  61.4      23 0.00049   34.2   6.1   69   91-172   121-191 (342)
 55 PF01436 NHL:  NHL repeat;  Int  59.5      10 0.00022   23.1   2.4   19   91-111     1-19  (28)
 56 PLN00207 polyribonucleotide nu  58.1      54  0.0012   35.2   8.7   50  124-184   108-165 (891)
 57 PRK09681 putative type II secr  57.7      31 0.00068   32.1   6.2   65   97-167   196-264 (276)
 58 cd03701 IF2_IF5B_II IF2_IF5B_I  57.5      17 0.00036   28.1   3.8   35   95-135     2-38  (95)
 59 KOG3551 Syntrophins (type beta  53.0      19 0.00042   36.0   4.2   66   87-156    86-157 (506)
 60 KOG3549 Syntrophins (type gamm  52.4      36 0.00077   33.9   5.9   80   81-164    50-135 (505)
 61 smart00652 eIF1a eukaryotic tr  48.5      55  0.0012   25.1   5.3   46   85-132     5-52  (83)
 62 PRK03760 hypothetical protein;  46.8      39 0.00085   27.3   4.5   36   92-131    78-113 (117)
 63 cd03702 IF2_mtIF2_II This fami  46.3      29 0.00063   27.1   3.6   44   95-145     2-49  (95)
 64 COG0361 InfA Translation initi  45.4      42 0.00092   25.9   4.2   57   85-150     7-67  (75)
 65 PRK04012 translation initiatio  45.0      66  0.0014   25.7   5.5   52   85-145    21-74  (100)
 66 KOG1320 Serine protease [Postt  43.6      65  0.0014   32.3   6.3   59  106-171   399-458 (473)
 67 KOG1738 Membrane-associated gu  43.4      24 0.00051   36.6   3.3   85   82-170   199-286 (638)
 68 cd04456 S1_IF1A_like S1_IF1A_l  42.9      36 0.00078   25.9   3.5   46   90-144     5-52  (78)
 69 PRK14533 groES co-chaperonin G  40.4      48   0.001   26.0   3.9   27  107-134    38-64  (91)
 70 cd05793 S1_IF1A S1_IF1A: Trans  40.0      81  0.0018   23.9   5.0   36  101-145    18-53  (77)
 71 PTZ00414 10 kDa heat shock pro  38.6      49  0.0011   26.6   3.8   24  108-132    48-71  (100)
 72 PF01176 eIF-1a:  Translation i  37.1      55  0.0012   23.6   3.6   45   86-132     4-50  (65)
 73 PRK00364 groES co-chaperonin G  37.0      54  0.0012   25.5   3.8   11  123-133    58-68  (95)
 74 cd03703 aeIF5B_II aeIF5B_II: T  33.9      63  0.0014   26.4   3.8   33   96-134     3-37  (110)
 75 PF02643 DUF192:  Uncharacteriz  32.8      25 0.00055   27.5   1.4   27  103-131    79-105 (108)
 76 cd00320 cpn10 Chaperonin 10 Kd  32.4      81  0.0017   24.4   4.1   29  106-134    36-68  (93)
 77 TIGR00739 yajC preprotein tran  32.4      31 0.00067   26.5   1.7   41  123-168    37-77  (84)
 78 COG1430 Uncharacterized conser  31.5      69  0.0015   26.7   3.7   40   93-134    82-121 (126)
 79 PF03829 PTSIIA_gutA:  PTS syst  28.4      98  0.0021   25.3   4.1   51  106-167    39-90  (117)
 80 KOG1421 Predicted signaling-as  27.7      81  0.0018   33.9   4.3   32  103-136   301-332 (955)
 81 PRK05896 DNA polymerase III su  27.7      47   0.001   34.0   2.6   88  123-223   497-598 (605)
 82 PRK06531 yajC preprotein trans  25.7      50  0.0011   27.1   1.9   41  123-168    36-77  (113)
 83 CHL00113 rps4 ribosomal protei  25.4      38 0.00082   29.9   1.3   31  174-211    44-74  (201)
 84 cd05706 S1_Rrp5_repeat_sc10 S1  25.0      50  0.0011   22.9   1.6   42   93-134    15-58  (73)
 85 TIGR02604 Piru_Ver_Nterm putat  24.8 1.4E+02  0.0031   27.4   4.9   45   91-138    13-57  (367)
 86 cd05696 S1_Rrp5_repeat_hs4 S1_  24.6      48   0.001   23.6   1.5   43   91-133    12-56  (71)
 87 TIGR03095 rusti_cyanin rusticy  24.1 1.1E+02  0.0023   25.6   3.6   43   91-133     6-65  (148)
 88 PF07197 DUF1409:  Protein of u  23.5      38 0.00083   24.6   0.8   17  188-204    12-28  (51)
 89 TIGR00523 eIF-1A eukaryotic/ar  23.3 2.2E+02  0.0047   22.7   5.1   46   85-132    19-66  (99)
 90 cd05704 S1_Rrp5_repeat_hs13 S1  22.2      40 0.00086   24.1   0.7   46   89-134    12-59  (72)
 91 COG4043 Preprotein translocase  21.6      83  0.0018   26.2   2.5   37  119-155    29-65  (111)
 92 COG4810 EutS Ethanolamine util  21.4      97  0.0021   25.9   2.8   64   91-157    38-103 (121)

No 1  
>PF00595 PDZ:  PDZ domain (Also known as DHR or GLGF) Coordinates are not yet available;  InterPro: IPR001478 PDZ domains are found in diverse signalling proteins in bacteria, yeasts, plants, insects and vertebrates [, ]. PDZ domains can occur in one or multiple copies and are nearly always found in cytoplasmic proteins. They bind either the carboxyl-terminal sequences of proteins or internal peptide sequences []. In most cases, interaction between a PDZ domain and its target is constitutive, with a binding affinity of 1 to 10 microns. However, agonist-dependent activation of cell surface receptors is sometimes required to promote interaction with a PDZ protein. PDZ domain proteins are frequently associated with the plasma membrane, a compartment where high concentrations of phosphatidylinositol 4,5-bisphosphate (PIP2) are found. Direct interaction between PIP2 and a subset of class II PDZ domains (syntenin, CASK, Tiam-1) has been demonstrated.  PDZ domains consist of 80 to 90 amino acids comprising six beta-strands (beta-A to beta-F) and two alpha-helices, A and B, compactly arranged in a globular structure. Peptide binding of the ligand takes place in an elongated surface groove as an anti-parallel beta-strand interacts with the beta-B strand and the B helix. The structure of PDZ domains allows binding to a free carboxylate group at the end of a peptide through a carboxylate-binding loop between the beta-A and beta-B strands.; GO: 0005515 protein binding; PDB: 3AXA_A 1WF8_A 1QAV_B 1QAU_A 1B8Q_A 1MC7_A 2KAW_A 1I16_A 1VB7_A 1WI4_A ....
Probab=98.79  E-value=2.2e-08  Score=71.86  Aligned_cols=74  Identities=23%  Similarity=0.618  Sum_probs=60.0

Q ss_pred             EEEecC----cceeEEeeeCCC---CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCc
Q 026827           88 EVEIEQ----PYGLKFAKGRDG---GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGP  160 (232)
Q Consensus        88 eVeL~K----PLGL~Fee~~dG---gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGp  160 (232)
                      +|+|.|    |+|+.+..+.+.   ++||.+|.|+|.|+++| |++||+|+.+...   .+ .....-+++.+|+...++
T Consensus         1 ~v~l~k~~~~~lG~~l~~~~~~~~~~~~V~~v~~~~~a~~~g-l~~GD~Il~INg~---~v-~~~~~~~~~~~l~~~~~~   75 (81)
T PF00595_consen    1 QVTLEKSGNGPLGFTLRGGSDNDEKGVFVSSVVPGSPAERAG-LKVGDRILEINGQ---SV-RGMSHDEVVQLLKSASNP   75 (81)
T ss_dssp             EEEEEESTTSBSSEEEEEESTSSSEEEEEEEECTTSHHHHHT-SSTTEEEEEETTE---ES-TTSBHHHHHHHHHHSTSE
T ss_pred             CEEEEeCCCCCcCEEEEecCCCCcCCEEEEEEeCCChHHhcc-cchhhhhheeCCE---eC-CCCCHHHHHHHHHCCCCc
Confidence            355555    999999998775   99999999999999999 9999999998763   22 222455788899988889


Q ss_pred             eEEEEe
Q 026827          161 LLMKMQ  166 (232)
Q Consensus       161 v~LkLe  166 (232)
                      |.|+++
T Consensus        76 v~L~V~   81 (81)
T PF00595_consen   76 VTLTVQ   81 (81)
T ss_dssp             EEEEEE
T ss_pred             EEEEEC
Confidence            999875


No 2  
>cd00992 PDZ_signaling PDZ domain found in a variety of Eumetazoan signaling molecules, often in tandem arrangements. May be responsible for specific protein-protein interactions, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of PDZ domains an N-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in proteases.
Probab=98.32  E-value=4.7e-06  Score=58.49  Aligned_cols=67  Identities=22%  Similarity=0.568  Sum_probs=54.2

Q ss_pred             cCcceeEEeeeCC--CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeecc--chhhHHHHhhcccCceEEEE
Q 026827           92 EQPYGLKFAKGRD--GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAA--EYGRTMYTIRQRVGPLLMKM  165 (232)
Q Consensus        92 ~KPLGL~Fee~~d--GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~--~~G~t~~AIr~RsGpv~LkL  165 (232)
                      .+|+|+.+....+  .+++|..|.+++.|+++| |++||+|+.+-..      +..  .+.++..+++...+++.|.+
T Consensus        11 ~~~~G~~~~~~~~~~~~~~V~~v~~~s~a~~~g-l~~GD~I~~ing~------~i~~~~~~~~~~~l~~~~~~v~l~v   81 (82)
T cd00992          11 GGGLGFSLRGGKDSGGGIFVSRVEPGGPAERGG-LRVGDRILEVNGV------SVEGLTHEEAVELLKNSGDEVTLTV   81 (82)
T ss_pred             CCCcCEEEeCcccCCCCeEEEEECCCChHHhCC-CCCCCEEEEECCE------EcCccCHHHHHHHHHhCCCeEEEEE
Confidence            4679999988754  699999999999999988 9999999997652      444  66778888887666777765


No 3  
>cd00136 PDZ PDZ domain, also called DHR (Dlg homologous region) or GLGF (after a conserved sequence motif). Many PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. Heterodimerization through PDZ-PDZ domain interactions adds to the domain's versatility, and PDZ domain-mediated interactions may be modulated dynamically through target phosphorylation. Some PDZ domains play a role in scaffolding supramolecular complexes. PDZ domains are found in diverse signaling proteins in bacteria, archebacteria, and eurkayotes. This CD contains two distinct structural subgroups with either a N- or C-terminal beta-strand forming the peptide-binding groove base. The circular permutation placing the strand on the N-terminus appears to be found in Eumetazoa only, while the C-terminal variant is found in all three kingdoms of life, and seems to co-occur with protease domains. PDZ domains have been named after PSD95(pos
Probab=98.21  E-value=7e-06  Score=56.55  Aligned_cols=66  Identities=21%  Similarity=0.474  Sum_probs=51.9

Q ss_pred             CcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccch--hhHHHHhhccc-CceEEEE
Q 026827           93 QPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEY--GRTMYTIRQRV-GPLLMKM  165 (232)
Q Consensus        93 KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~--G~t~~AIr~Rs-Gpv~LkL  165 (232)
                      .|+|+.+....+++++|..|.+++.|+++| |++||+|+.+-..      +..+.  .++...|+... .++.|++
T Consensus         1 ~~~G~~~~~~~~~~~~V~~v~~~s~a~~~g-l~~GD~I~~Ing~------~v~~~~~~~~~~~l~~~~g~~v~l~v   69 (70)
T cd00136           1 GGLGFSIRGGTEGGVVVLSVEPGSPAERAG-LQAGDVILAVNGT------DVKNLTLEDVAELLKKEVGEKVTLTV   69 (70)
T ss_pred             CCccEEEecCCCCCEEEEEeCCCCHHHHcC-CCCCCEEEEECCE------ECCCCCHHHHHHHHhhCCCCeEEEEE
Confidence            478999998777799999999999999988 9999999998542      33333  56777888655 5667665


No 4  
>PF13180 PDZ_2:  PDZ domain; PDB: 2L97_A 1Y8T_A 2Z9I_A 1LCY_A 2PZD_B 2P3W_A 1VCW_C 1TE0_B 1SOZ_C 1SOT_C ....
Probab=98.06  E-value=1.8e-05  Score=57.30  Aligned_cols=67  Identities=22%  Similarity=0.409  Sum_probs=51.1

Q ss_pred             ceeEEeeeCC-CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhh--cccCceEEEEeec
Q 026827           95 YGLKFAKGRD-GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIR--QRVGPLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~d-GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr--~RsGpv~LkLeR~  168 (232)
                      ||+.|....+ ++++|.+|.+++.|+++| |++||+|+++-..      +..+..+....|.  ..-.++.|++.|.
T Consensus         3 lGv~~~~~~~~~g~~V~~V~~~spA~~aG-l~~GD~I~~ing~------~v~~~~~~~~~l~~~~~g~~v~l~v~R~   72 (82)
T PF13180_consen    3 LGVTVQNLSDTGGVVVVSVIPGSPAAKAG-LQPGDIILAINGK------PVNSSEDLVNILSKGKPGDTVTLTVLRD   72 (82)
T ss_dssp             -SEEEEECSCSSSEEEEEESTTSHHHHTT-S-TTEEEEEETTE------ESSSHHHHHHHHHCSSTTSEEEEEEEET
T ss_pred             ECeEEEEccCCCeEEEEEeCCCCcHHHCC-CCCCcEEEEECCE------EcCCHHHHHHHHHhCCCCCEEEEEEEEC
Confidence            6889998765 699999999999999999 9999999997653      2345556666664  2236789999994


No 5  
>smart00228 PDZ Domain present in PSD-95, Dlg, and ZO-1/2. Also called DHR (Dlg homologous region) or GLGF (relatively well conserved tetrapeptide in these domains). Some PDZs have been shown to bind C-terminal polypeptides; others appear to bind internal (non-C-terminal) polypeptides. Different PDZs possess different binding specificities.
Probab=98.06  E-value=4e-05  Score=53.44  Aligned_cols=74  Identities=24%  Similarity=0.532  Sum_probs=51.7

Q ss_pred             EEEecCc---ceeEEeeeCC--CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchh--hHHHHhhcccCc
Q 026827           88 EVEIEQP---YGLKFAKGRD--GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYG--RTMYTIRQRVGP  160 (232)
Q Consensus        88 eVeL~KP---LGL~Fee~~d--GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G--~t~~AIr~RsGp  160 (232)
                      .+++.|+   +|+.+.....  .+++|..|.+++.|+++| |++||+|+.+-..      +..+.-  .....++....+
T Consensus         4 ~~~~~~~~~~~G~~~~~~~~~~~~~~i~~v~~~s~a~~~g-l~~GD~I~~In~~------~v~~~~~~~~~~~~~~~~~~   76 (85)
T smart00228        4 LVELEKGGGGLGFSLVGGKDEGGGVVVSSVVPGSPAAKAG-LKVGDVILEVNGT------SVEGLTHLEAVDLLKKAGGK   76 (85)
T ss_pred             EEEEEECCCcccEEEECCCCCCCCEEEEEECCCCHHHHcC-CCCCCEEEEECCE------ECCCCCHHHHHHHHHhCCCe
Confidence            4444444   8888887644  689999999999999999 9999999998642      222222  223333333348


Q ss_pred             eEEEEeec
Q 026827          161 LLMKMQKR  168 (232)
Q Consensus       161 v~LkLeR~  168 (232)
                      +.|.+.|+
T Consensus        77 ~~l~i~r~   84 (85)
T smart00228       77 VTLTVLRG   84 (85)
T ss_pred             EEEEEEeC
Confidence            88888874


No 6  
>KOG3571 consensus Dishevelled 3 and related proteins [General function prediction only]
Probab=97.77  E-value=0.00013  Score=72.50  Aligned_cols=89  Identities=22%  Similarity=0.413  Sum_probs=70.0

Q ss_pred             hccccEEEEEecC---c-ceeEEee----eCCCCeEEEEeCCCCCcccccccccCcEEEEeecc-cCCceeeccchhhHH
Q 026827           81 EEKYEEYEVEIEQ---P-YGLKFAK----GRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAV-FGTEIWPAAEYGRTM  151 (232)
Q Consensus        81 ~~~~eeyeVeL~K---P-LGL~Fee----~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~-FGdElWpA~~~G~t~  151 (232)
                      -|..+-++|+|.=   | |||.+--    .-||||||.+|.+||.-++.|.|.+||.|+.|-.+ |+. |=.. +-=+++
T Consensus       245 smslnIITV~LnMe~vnfLGiSivgqsn~rgDggIYVgsImkgGAVA~DGRIe~GDMiLQVNevsFEN-mSNd-~AVrvL  322 (626)
T KOG3571|consen  245 SMSLNIITVTLNMETVNFLGISIVGQSNARGDGGIYVGSIMKGGAVALDGRIEPGDMILQVNEVSFEN-MSND-QAVRVL  322 (626)
T ss_pred             ccceeEEEEEecccccccceeEeecccCcCCCCceEEeeeccCceeeccCccCccceEEEeeecchhh-cCch-HHHHHH
Confidence            3778889998863   5 9987763    35889999999999999999999999999999875 542 2222 222566


Q ss_pred             HHhhcccCceEEEEeecCCc
Q 026827          152 YTIRQRVGPLLMKMQKRYGK  171 (232)
Q Consensus       152 ~AIr~RsGpv~LkLeR~~~~  171 (232)
                      --|-+|.||+.|...+++-+
T Consensus       323 REaV~~~gPi~ltvAk~~DP  342 (626)
T KOG3571|consen  323 REAVSRPGPIKLTVAKCWDP  342 (626)
T ss_pred             HHHhccCCCeEEEEeeccCC
Confidence            66668999999999988764


No 7  
>cd00990 PDZ_glycyl_aminopeptidase PDZ domain associated with archaeal and bacterial M61 glycyl-aminopeptidases. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand is presumed to form the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=97.72  E-value=0.00014  Score=51.36  Aligned_cols=64  Identities=19%  Similarity=0.331  Sum_probs=46.9

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEee
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQK  167 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR  167 (232)
                      +|+.|.. .++++.|.+|.+++.|+++| |++||+|+.+-..      +..++...+...+. ...+.|.+.|
T Consensus         3 ~G~~~~~-~~~~~~V~~V~~~s~a~~aG-l~~GD~I~~Ing~------~v~~~~~~l~~~~~-~~~v~l~v~r   66 (80)
T cd00990           3 LGLTLDK-EEGLGKVTFVRDDSPADKAG-LVAGDELVAVNGW------RVDALQDRLKEYQA-GDPVELTVFR   66 (80)
T ss_pred             ccEEEEc-cCCcEEEEEECCCChHHHhC-CCCCCEEEEECCE------EhHHHHHHHHhcCC-CCEEEEEEEE
Confidence            6888865 46789999999999999999 9999999998642      33334333433322 2467888877


No 8  
>cd00988 PDZ_CTP_protease PDZ domain of C-terminal processing-, tail-specific-, and tricorn proteases, which function in posttranslational protein processing, maturation, and disassembly or degradation, in Bacteria, Archaea, and plant chloroplasts. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=97.54  E-value=0.00057  Score=48.64  Aligned_cols=66  Identities=24%  Similarity=0.477  Sum_probs=49.5

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccch--hhHHHHhhcc-cCceEEEEeec
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEY--GRTMYTIRQR-VGPLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~--G~t~~AIr~R-sGpv~LkLeR~  168 (232)
                      ||+.|.. ++.+++|..|.+++-|+++| +++||+|+.+-..      +..+.  .++...++.. ..++.|.+.|.
T Consensus         4 lG~~~~~-~~~~~~V~~v~~~s~a~~~g-l~~GD~I~~vng~------~i~~~~~~~~~~~l~~~~~~~i~l~v~r~   72 (85)
T cd00988           4 IGLELKY-DDGGLVITSVLPGSPAAKAG-IKAGDIIVAIDGE------PVDGLSLEDVVKLLRGKAGTKVRLTLKRG   72 (85)
T ss_pred             EEEEEEE-cCCeEEEEEecCCCCHHHcC-CCCCCEEEEECCE------EcCCCCHHHHHHHhcCCCCCEEEEEEEcC
Confidence            7888876 46789999999999999998 9999999998642      23333  4455566543 34678888885


No 9  
>cd00987 PDZ_serine_protease PDZ domain of tryspin-like serine proteases, such as DegP/HtrA, which are oligomeric proteins involved in heat-shock response, chaperone function, and apoptosis. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=97.39  E-value=0.00059  Score=48.60  Aligned_cols=58  Identities=19%  Similarity=0.368  Sum_probs=45.4

Q ss_pred             CCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcc--cCceEEEEeec
Q 026827          104 DGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR--VGPLLMKMQKR  168 (232)
Q Consensus       104 dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R--sGpv~LkLeR~  168 (232)
                      .++++|.+|.+++.|+++| |+.||+|+.+..      +++.+...+..++...  ..++.|++.|.
T Consensus        23 ~~g~~V~~v~~~s~a~~~g-l~~GD~I~~Ing------~~i~~~~~~~~~l~~~~~~~~i~l~v~r~   82 (90)
T cd00987          23 TKGVLVASVDPGSPAAKAG-LKPGDVILAVNG------KPVKSVADLRRALAELKPGDKVTLTVLRG   82 (90)
T ss_pred             CCEEEEEEECCCCHHHHcC-CCcCCEEEEECC------EECCCHHHHHHHHHhcCCCCEEEEEEEEC
Confidence            4589999999999999999 999999999864      3455555666666644  46788888873


No 10 
>cd00991 PDZ_archaeal_metalloprotease PDZ domain of archaeal zinc metalloprotases, presumably membrane-associated or integral membrane proteases, which may be involved in signalling and regulatory mechanisms. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=97.15  E-value=0.002  Score=46.70  Aligned_cols=57  Identities=14%  Similarity=0.225  Sum_probs=45.1

Q ss_pred             CCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcc--cCceEEEEee
Q 026827          104 DGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR--VGPLLMKMQK  167 (232)
Q Consensus       104 dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R--sGpv~LkLeR  167 (232)
                      ..|++|..|.+++.|+++| |++||+|+++-.      ++..++.++..++...  ..++.|.+.|
T Consensus         9 ~~Gv~V~~V~~~spa~~aG-L~~GDiI~~Ing------~~v~~~~d~~~~l~~~~~g~~v~l~v~r   67 (79)
T cd00991           9 VAGVVIVGVIVGSPAENAV-LHTGDVIYSING------TPITTLEDFMEALKPTKPGEVITVTVLP   67 (79)
T ss_pred             CCcEEEEEECCCChHHhcC-CCCCCEEEEECC------EEcCCHHHHHHHHhcCCCCCEEEEEEEE
Confidence            4579999999999999999 999999999853      4556666677777653  3567888887


No 11 
>cd00989 PDZ_metalloprotease PDZ domain of bacterial and plant zinc metalloprotases, presumably membrane-associated or integral membrane proteases, which may be involved in signalling and regulatory mechanisms. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=96.99  E-value=0.0041  Score=43.54  Aligned_cols=55  Identities=22%  Similarity=0.480  Sum_probs=43.9

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcc-cCceEEEEee
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR-VGPLLMKMQK  167 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R-sGpv~LkLeR  167 (232)
                      .+.|.+|.+++.|+++| |++||+|+.+-.      ++..++.++.+.+... ...+.|.+.|
T Consensus        13 ~~~V~~v~~~s~a~~~g-l~~GD~I~~ing------~~i~~~~~~~~~l~~~~~~~~~l~v~r   68 (79)
T cd00989          13 EPVIGEVVPGSPAAKAG-LKAGDRILAING------QKIKSWEDLVDAVQENPGKPLTLTVER   68 (79)
T ss_pred             CcEEEeECCCCHHHHcC-CCCCCEEEEECC------EECCCHHHHHHHHHHCCCceEEEEEEE
Confidence            58999999999999999 999999999865      3555666667777654 3467888876


No 12 
>KOG0609 consensus Calcium/calmodulin-dependent serine protein kinase/membrane-associated guanylate kinase [Signal transduction mechanisms]
Probab=96.54  E-value=0.0095  Score=59.31  Aligned_cols=73  Identities=22%  Similarity=0.396  Sum_probs=58.0

Q ss_pred             cCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeec
Q 026827           92 EQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKR  168 (232)
Q Consensus        92 ~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~  168 (232)
                      .-|||+.+....++.+||+.|..||.|+++|.+.+||.|..+-.+   . .-....-++...++.-.|++++++-=.
T Consensus       133 ~eplG~Tik~~e~~~~~vARI~~GG~~~r~glL~~GD~i~EvNGi---~-v~~~~~~e~q~~l~~~~G~itfkiiP~  205 (542)
T KOG0609|consen  133 GEPLGATIRVEEDTKVVVARIMHGGMADRQGLLHVGDEILEVNGI---S-VANKSPEELQELLRNSRGSITFKIIPS  205 (542)
T ss_pred             CCccceEEEeccCCccEEeeeccCCcchhccceeeccchheecCe---e-cccCCHHHHHHHHHhCCCcEEEEEccc
Confidence            448999999877779999999999999999999999999998753   1 122245567778886669998876444


No 13 
>cd00986 PDZ_LON_protease PDZ domain of ATP-dependent LON serine proteases. Most PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this bacterial subfamily of protease-associated PDZ domains a C-terminal beta-strand  is thought to form the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=96.45  E-value=0.014  Score=41.67  Aligned_cols=55  Identities=20%  Similarity=0.399  Sum_probs=42.2

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-c-cCceEEEEeec
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-R-VGPLLMKMQKR  168 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-R-sGpv~LkLeR~  168 (232)
                      |+.|..|.+++.|++ | |++||+|+++-.      ++..++..+..++.. + ...+.|.+.|.
T Consensus         9 Gv~V~~V~~~s~A~~-g-L~~GD~I~~Ing------~~v~~~~~~~~~l~~~~~~~~v~l~v~r~   65 (79)
T cd00986           9 GVYVTSVVEGMPAAG-K-LKAGDHIIAVDG------KPFKEAEELIDYIQSKKEGDTVKLKVKRE   65 (79)
T ss_pred             CEEEEEECCCCchhh-C-CCCCCEEEEECC------EECCCHHHHHHHHHhCCCCCEEEEEEEEC
Confidence            699999999998885 7 999999999853      455566667777763 3 34678888874


No 14 
>TIGR00225 prc C-terminal peptidase (prc). A C-terminal peptidase with different substrates in different species including processing of D1 protein of the photosystem II reaction center in higher plants and cleavage of a peptide of 11 residues from the precursor form of penicillin-binding protein in E.coli E.coli and H influenza have the most distal branch of the tree and their proteins have an N-terminal 200 amino acids that show no homology to other proteins in the database.
Probab=96.41  E-value=0.012  Score=53.29  Aligned_cols=68  Identities=19%  Similarity=0.331  Sum_probs=48.0

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc-CceEEEEeec
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV-GPLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs-Gpv~LkLeR~  168 (232)
                      +|+.+.. .+++++|..|.+++.|+++| |++||+|+++-..   .+-.. .+.++...++... .++.|++.|.
T Consensus        53 lG~~~~~-~~~~~~V~~V~~~spA~~aG-L~~GD~I~~Ing~---~v~~~-~~~~~~~~l~~~~g~~v~l~v~R~  121 (334)
T TIGR00225        53 IGIQVGM-DDGEIVIVSPFEGSPAEKAG-IKPGDKIIKINGK---SVAGM-SLDDAVALIRGKKGTKVSLEILRA  121 (334)
T ss_pred             EEEEEEE-ECCEEEEEEeCCCChHHHcC-CCCCCEEEEECCE---ECCCC-CHHHHHHhccCCCCCEEEEEEEeC
Confidence            7888866 36799999999999999999 9999999998653   22111 1234445554333 3577777774


No 15 
>TIGR02037 degP_htrA_DO periplasmic serine protease, Do/DeqQ family. This family consists of a set proteins various designated DegP, heat shock protein HtrA, and protease DO. The ortholog in Pseudomonas aeruginosa is designated MucD and is found in an operon that controls mucoid phenotype. This family also includes the DegQ (HhoA) paralog in E. coli which can rescue a DegP mutant, but not the smaller DegS paralog, which cannot. Members of this family are located in the periplasm and have separable functions as both protease and chaperone. Members have a trypsin domain and two copies of a PDZ domain. This protein protects bacteria from thermal and other stresses and may be important for the survival of bacterial pathogens.// The chaperone function is dominant at low temperatures, whereas the proteolytic activity is turned on at elevated temperatures.
Probab=96.31  E-value=0.013  Score=54.60  Aligned_cols=67  Identities=18%  Similarity=0.416  Sum_probs=49.1

Q ss_pred             ceeEEeeeC-----------CCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcc-c-Cce
Q 026827           95 YGLKFAKGR-----------DGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR-V-GPL  161 (232)
Q Consensus        95 LGL~Fee~~-----------dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R-s-Gpv  161 (232)
                      |||.+..-.           ..|++|.+|.+++.|+++| |++||+|+++-.      ++..++.+...++... . ..+
T Consensus       236 lGi~~~~~~~~~~~~lgl~~~~Gv~V~~V~~~spA~~aG-L~~GDvI~~Vng------~~i~~~~~~~~~l~~~~~g~~v  308 (428)
T TIGR02037       236 LGVTIQEVTSDLAKSLGLEKQRGALVAQVLPGSPAEKAG-LKAGDVILSVNG------KPISSFADLRRAIGTLKPGKKV  308 (428)
T ss_pred             CceEeecCCHHHHHHcCCCCCCceEEEEccCCCChHHcC-CCCCCEEEEECC------EEcCCHHHHHHHHHhcCCCCEE
Confidence            788877532           3589999999999999999 999999999864      2444555555555532 2 357


Q ss_pred             EEEEeec
Q 026827          162 LMKMQKR  168 (232)
Q Consensus       162 ~LkLeR~  168 (232)
                      .|++.|.
T Consensus       309 ~l~v~R~  315 (428)
T TIGR02037       309 TLGILRK  315 (428)
T ss_pred             EEEEEEC
Confidence            7777763


No 16 
>COG0793 Prc Periplasmic protease [Cell envelope biogenesis, outer membrane]
Probab=96.22  E-value=0.015  Score=55.17  Aligned_cols=82  Identities=18%  Similarity=0.373  Sum_probs=60.5

Q ss_pred             cEEEEEecCcc---eeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccC-c
Q 026827           85 EEYEVEIEQPY---GLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVG-P  160 (232)
Q Consensus        85 eeyeVeL~KPL---GL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsG-p  160 (232)
                      .++..++...+   |+.+...+++++.|.++.+++-|+|+| |++||.|+.|-   |..+-.. .+..+...||-+.| +
T Consensus        89 ~~~~~~~~~~~~GiG~~i~~~~~~~~~V~s~~~~~PA~kag-i~~GD~I~~Id---G~~~~~~-~~~~av~~irG~~Gt~  163 (406)
T COG0793          89 AEFRTDTSGEFGGIGIELQMEDIGGVKVVSPIDGSPAAKAG-IKPGDVIIKID---GKSVGGV-SLDEAVKLIRGKPGTK  163 (406)
T ss_pred             HHhhhhccccccceeEEEEEecCCCcEEEecCCCChHHHcC-CCCCCEEEEEC---CEEccCC-CHHHHHHHhCCCCCCe
Confidence            34445555544   478877666999999999999999999 99999999998   3333322 23556778887665 6


Q ss_pred             eEEEEeecCCc
Q 026827          161 LLMKMQKRYGK  171 (232)
Q Consensus       161 v~LkLeR~~~~  171 (232)
                      |.|++.|.-+.
T Consensus       164 V~L~i~r~~~~  174 (406)
T COG0793         164 VTLTILRAGGG  174 (406)
T ss_pred             EEEEEEEcCCC
Confidence            79999998433


No 17 
>PRK11186 carboxy-terminal protease; Provisional
Probab=96.14  E-value=0.015  Score=58.77  Aligned_cols=72  Identities=22%  Similarity=0.328  Sum_probs=52.0

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccc--hhhHHHHhhcccC-ceEEEEeec
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAE--YGRTMYTIRQRVG-PLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~--~G~t~~AIr~RsG-pv~LkLeR~  168 (232)
                      +|+.+.. .+|+++|..|.|||.|++++.|++||+|++|.. =|.++.+..+  +..+...|+...| .|.|++.|.
T Consensus       246 IGa~l~~-~~~~~~V~~vipGsPA~ka~gLk~GD~IlaVn~-~g~~~~dv~g~~~~~vv~lirG~~Gt~V~LtV~r~  320 (667)
T PRK11186        246 IGAVLQM-DDDYTVINSLVAGGPAAKSKKLSVGDKIVGVGQ-DGKPIVDVIGWRLDDVVALIKGPKGSKVRLEILPA  320 (667)
T ss_pred             EEEEEEE-eCCeEEEEEccCCChHHHhCCCCCCCEEEEECC-CCCcccccccCCHHHHHHHhcCCCCCEEEEEEEeC
Confidence            4777766 467899999999999999955999999999972 1233444332  2367778885554 468888773


No 18 
>TIGR02037 degP_htrA_DO periplasmic serine protease, Do/DeqQ family. This family consists of a set proteins various designated DegP, heat shock protein HtrA, and protease DO. The ortholog in Pseudomonas aeruginosa is designated MucD and is found in an operon that controls mucoid phenotype. This family also includes the DegQ (HhoA) paralog in E. coli which can rescue a DegP mutant, but not the smaller DegS paralog, which cannot. Members of this family are located in the periplasm and have separable functions as both protease and chaperone. Members have a trypsin domain and two copies of a PDZ domain. This protein protects bacteria from thermal and other stresses and may be important for the survival of bacterial pathogens.// The chaperone function is dominant at low temperatures, whereas the proteolytic activity is turned on at elevated temperatures.
Probab=96.13  E-value=0.017  Score=53.80  Aligned_cols=57  Identities=18%  Similarity=0.384  Sum_probs=45.3

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc--ccCceEEEEeec
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ--RVGPLLMKMQKR  168 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~--RsGpv~LkLeR~  168 (232)
                      .|++|.+|.+++.|+++| +++||+|+++..      ++..++.+...+|+.  ...++.|.+.|.
T Consensus       362 ~Gv~V~~V~~~SpA~~aG-L~~GDvI~~Ing------~~V~s~~d~~~~l~~~~~g~~v~l~v~R~  420 (428)
T TIGR02037       362 KGVVVTKVVSGSPAARAG-LQPGDVILSVNQ------QPVSSVAELRKVLDRAKKGGRVALLILRG  420 (428)
T ss_pred             CceEEEEeCCCCHHHHcC-CCCCCEEEEECC------EEcCCHHHHHHHHHhcCCCCEEEEEEEEC
Confidence            589999999999999999 999999999864      345555556666663  246789999884


No 19 
>PLN00049 carboxyl-terminal processing protease; Provisional
Probab=95.78  E-value=0.036  Score=51.72  Aligned_cols=69  Identities=23%  Similarity=0.358  Sum_probs=45.4

Q ss_pred             ceeEEeeeC--CC---CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc-CceEEEEeec
Q 026827           95 YGLKFAKGR--DG---GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV-GPLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~--dG---gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs-Gpv~LkLeR~  168 (232)
                      +|+.+....  +|   ++.|..|.+++-|+++| |++||+|++|-..   .+=. .....+...++... .++.|.+.|.
T Consensus        87 iG~~~~~~~~~~~~~~g~~V~~V~~~SPA~~aG-l~~GD~Iv~InG~---~v~~-~~~~~~~~~l~g~~g~~v~ltv~r~  161 (389)
T PLN00049         87 VGLEVGYPTGSDGPPAGLVVVAPAPGGPAARAG-IRPGDVILAIDGT---STEG-LSLYEAADRLQGPEGSSVELTLRRG  161 (389)
T ss_pred             EEEEEEEccCCCCccCcEEEEEeCCCChHHHcC-CCCCCEEEEECCE---ECCC-CCHHHHHHHHhcCCCCEEEEEEEEC
Confidence            566665432  22   89999999999999999 9999999998753   2210 11233445555323 4577777763


No 20 
>PRK10139 serine endoprotease; Provisional
Probab=95.76  E-value=0.022  Score=54.57  Aligned_cols=57  Identities=14%  Similarity=0.260  Sum_probs=46.2

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeec
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKR  168 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~  168 (232)
                      .+++|..|.+++.|+++| +++||+|+.+-.      +++..+.+.+.+|+.+..++.|.+.|.
T Consensus       390 ~Gv~V~~V~~~spA~~aG-L~~GD~I~~Ing------~~v~~~~~~~~~l~~~~~~v~l~v~R~  446 (455)
T PRK10139        390 KGIKIDEVVKGSPAAQAG-LQKDDVIIGVNR------DRVNSIAEMRKVLAAKPAIIALQIVRG  446 (455)
T ss_pred             CceEEEEeCCCChHHHcC-CCCCCEEEEECC------EEcCCHHHHHHHHHhCCCeEEEEEEEC
Confidence            389999999999999999 999999999863      355555666667765557889998874


No 21 
>TIGR02038 protease_degS periplasmic serine pepetdase DegS. This family consists of the periplasmic serine protease DegS (HhoB), a shorter paralog of protease DO (HtrA, DegP) and DegQ (HhoA). It is found in E. coli and several other Proteobacteria of the gamma subdivision. It contains a trypsin domain and a single copy of PDZ domain (in contrast to DegP with two copies). A critical role of this DegS is to sense stress in the periplasm and partially degrade an inhibitor of sigma(E).
Probab=95.48  E-value=0.027  Score=51.82  Aligned_cols=57  Identities=21%  Similarity=0.337  Sum_probs=43.7

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-c-cCceEEEEeec
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-R-VGPLLMKMQKR  168 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-R-sGpv~LkLeR~  168 (232)
                      .|++|..|.+++.|+++| |++||+|+.+-.      ++..+..+...++.. + -.++.|++.|.
T Consensus       278 ~Gv~V~~V~~~spA~~aG-L~~GDvI~~Ing------~~V~s~~dl~~~l~~~~~g~~v~l~v~R~  336 (351)
T TIGR02038       278 RGIVITGVDPNGPAARAG-ILVRDVILKYDG------KDVIGAEELMDRIAETRPGSKVMVTVLRQ  336 (351)
T ss_pred             ccceEeecCCCChHHHCC-CCCCCEEEEECC------EEcCCHHHHHHHHHhcCCCCEEEEEEEEC
Confidence            589999999999999999 999999999854      344555555566653 2 34678888874


No 22 
>PRK10139 serine endoprotease; Provisional
Probab=95.43  E-value=0.036  Score=53.09  Aligned_cols=57  Identities=12%  Similarity=0.321  Sum_probs=41.3

Q ss_pred             CCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-cc-CceEEEEee
Q 026827          104 DGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-RV-GPLLMKMQK  167 (232)
Q Consensus       104 dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-Rs-Gpv~LkLeR  167 (232)
                      ..|++|.+|.+++.|+++| |++||+|+.+-..   .   ..++.++..+|.. +. ..+.|++.|
T Consensus       289 ~~Gv~V~~V~~~SpA~~AG-L~~GDvIl~InG~---~---V~s~~dl~~~l~~~~~g~~v~l~V~R  347 (455)
T PRK10139        289 QRGAFVSEVLPNSGSAKAG-VKAGDIITSLNGK---P---LNSFAELRSRIATTEPGTKVKLGLLR  347 (455)
T ss_pred             CCceEEEEECCCChHHHCC-CCCCCEEEEECCE---E---CCCHHHHHHHHHhcCCCCEEEEEEEE
Confidence            3589999999999999999 9999999998642   3   3344455555543 33 346777766


No 23 
>PRK10942 serine endoprotease; Provisional
Probab=95.19  E-value=0.07  Score=51.40  Aligned_cols=58  Identities=17%  Similarity=0.375  Sum_probs=42.5

Q ss_pred             CCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcc--cCceEEEEeec
Q 026827          104 DGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR--VGPLLMKMQKR  168 (232)
Q Consensus       104 dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R--sGpv~LkLeR~  168 (232)
                      ..|++|..|.+++.|+++| |+.||+|+.+..      .++.++.+...++...  -..+.|.+.|.
T Consensus       310 ~~GvlV~~V~~~SpA~~AG-L~~GDvIl~InG------~~V~s~~dl~~~l~~~~~g~~v~l~v~R~  369 (473)
T PRK10942        310 QRGAFVSQVLPNSSAAKAG-IKAGDVITSLNG------KPISSFAALRAQVGTMPVGSKLTLGLLRD  369 (473)
T ss_pred             CCceEEEEECCCChHHHcC-CCCCCEEEEECC------EECCCHHHHHHHHHhcCCCCEEEEEEEEC
Confidence            3599999999999999999 999999999864      2444555555555432  23567777763


No 24 
>PRK10898 serine endoprotease; Provisional
Probab=95.17  E-value=0.049  Score=50.35  Aligned_cols=57  Identities=25%  Similarity=0.427  Sum_probs=41.9

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-cc-CceEEEEeec
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-RV-GPLLMKMQKR  168 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-Rs-Gpv~LkLeR~  168 (232)
                      .|++|.+|.+++.|+++| |++||+|+.+-..      +..+..+.+.++.. +. ..+.|++.|.
T Consensus       279 ~Gv~V~~V~~~spA~~aG-L~~GDvI~~Ing~------~V~s~~~l~~~l~~~~~g~~v~l~v~R~  337 (353)
T PRK10898        279 QGIVVNEVSPDGPAAKAG-IQVNDLIISVNNK------PAISALETMDQVAEIRPGSVIPVVVMRD  337 (353)
T ss_pred             CeEEEEEECCCChHHHcC-CCCCCEEEEECCE------EcCCHHHHHHHHHhcCCCCEEEEEEEEC
Confidence            599999999999999999 9999999997542      33344444455543 33 3578888773


No 25 
>PRK10942 serine endoprotease; Provisional
Probab=95.08  E-value=0.049  Score=52.40  Aligned_cols=58  Identities=19%  Similarity=0.401  Sum_probs=46.0

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeecC
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKRY  169 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~~  169 (232)
                      .+++|.+|.+++.|+++| +++||+|+++-.      +++.++.+...+++....++.|.+.|.-
T Consensus       408 ~gvvV~~V~~~S~A~~aG-L~~GDvIv~VNg------~~V~s~~dl~~~l~~~~~~v~l~V~R~g  465 (473)
T PRK10942        408 KGVVVDNVKPGTPAAQIG-LKKGDVIIGANQ------QPVKNIAELRKILDSKPSVLALNIQRGD  465 (473)
T ss_pred             CCeEEEEeCCCChHHHcC-CCCCCEEEEECC------EEcCCHHHHHHHHHhCCCeEEEEEEECC
Confidence            379999999999999999 999999999864      3455555556666655578889888844


No 26 
>KOG1892 consensus Actin filament-binding protein Afadin [Cytoskeleton]
Probab=94.99  E-value=0.038  Score=59.15  Aligned_cols=52  Identities=31%  Similarity=0.592  Sum_probs=42.4

Q ss_pred             ccEEEEEecCcce----eEEeeeCCC---CeEEEEeCCCCCcccccccccCcEEEEeec
Q 026827           84 YEEYEVEIEQPYG----LKFAKGRDG---GTYIDAIAPGGSADKTGMFQVGDKVLATSA  135 (232)
Q Consensus        84 ~eeyeVeL~KPLG----L~Fee~~dG---gvyV~eV~pGGNAaKaG~I~VGD~LvatSA  135 (232)
                      -+-..|+|+|==|    |+-+++..-   ||||..|++||.|+..|.++.||+|+.|-.
T Consensus       932 pei~~vtL~KnnGmGLSIVAAkGaGq~klGIYvKsVV~GgaAd~DGRL~aGDQLLsVdG  990 (1629)
T KOG1892|consen  932 PEIITVTLKKNNGMGLSIVAAKGAGQRKLGIYVKSVVEGGAADHDGRLEAGDQLLSVDG  990 (1629)
T ss_pred             CceEEEEEeccCCceEEEEeeccCCccccceEEEEeccCCccccccccccCceeeeecC
Confidence            3568899999866    444454221   999999999999999999999999998865


No 27 
>KOG3553 consensus Tax interaction protein TIP1 [Cell wall/membrane/envelope biogenesis]
Probab=94.79  E-value=0.019  Score=47.45  Aligned_cols=32  Identities=28%  Similarity=0.650  Sum_probs=29.2

Q ss_pred             CCCCeEEEEeCCCCCcccccccccCcEEEEeec
Q 026827          103 RDGGTYIDAIAPGGSADKTGMFQVGDKVLATSA  135 (232)
Q Consensus       103 ~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA  135 (232)
                      .|-||||+.|..|+-|+.+| ++.+|+|+-|..
T Consensus        57 tD~GiYvT~V~eGsPA~~AG-LrihDKIlQvNG   88 (124)
T KOG3553|consen   57 TDKGIYVTRVSEGSPAEIAG-LRIHDKILQVNG   88 (124)
T ss_pred             CCccEEEEEeccCChhhhhc-ceecceEEEecC
Confidence            35599999999999999999 999999999874


No 28 
>PRK10779 zinc metallopeptidase RseP; Provisional
Probab=94.72  E-value=0.12  Score=48.98  Aligned_cols=57  Identities=19%  Similarity=0.473  Sum_probs=45.0

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc-CceEEEEeecC
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV-GPLLMKMQKRY  169 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs-Gpv~LkLeR~~  169 (232)
                      ++.|.+|.+++.|+++| +++||+|+++..      +++.++.+...+++.+. .++.|.++|.-
T Consensus       222 ~~vV~~V~~~SpA~~AG-L~~GDvIl~Ing------~~V~s~~dl~~~l~~~~~~~v~l~v~R~g  279 (449)
T PRK10779        222 EPVLAEVQPNSAASKAG-LQAGDRIVKVDG------QPLTQWQTFVTLVRDNPGKPLALEIERQG  279 (449)
T ss_pred             CcEEEeeCCCCHHHHcC-CCCCCEEEEECC------EEcCCHHHHHHHHHhCCCCEEEEEEEECC
Confidence            58999999999999999 999999999853      45666666666776544 46788887743


No 29 
>KOG3209 consensus WW domain-containing protein [General function prediction only]
Probab=94.41  E-value=0.17  Score=52.95  Aligned_cols=86  Identities=22%  Similarity=0.356  Sum_probs=61.8

Q ss_pred             hhccccEEEEEecC-cce--eEEeeeCCC--CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHh
Q 026827           80 QEEKYEEYEVEIEQ-PYG--LKFAKGRDG--GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTI  154 (232)
Q Consensus        80 ~~~~~eeyeVeL~K-PLG--L~Fee~~dG--gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AI  154 (232)
                      -.++..-|.|+|+| +-|  ..+--++.+  ..||-.++++|-|.+.|.++|||+|+-+..    |--.-..-.+.+-.|
T Consensus       893 ~~qn~~~~~VelErG~kGFGFSiRGGreynM~LfVLRlAeDGPA~rdGrm~VGDqi~eING----esTkgmtH~rAIelI  968 (984)
T KOG3209|consen  893 MSQNGDLYTVELERGAKGFGFSIRGGREYNMDLFVLRLAEDGPAIRDGRMRVGDQITEING----ESTKGMTHDRAIELI  968 (984)
T ss_pred             ccccCCeeEEEeeccccccceEeecccccccceEEEEeccCCCccccCceeecceEEEecC----cccCCCcHHHHHHHH
Confidence            34677889999986 334  444334433  899999999999999999999999999764    211122334677788


Q ss_pred             hcccCceEEEEeecC
Q 026827          155 RQRVGPLLMKMQKRY  169 (232)
Q Consensus       155 r~RsGpv~LkLeR~~  169 (232)
                      ++.-.-|.|.|.|..
T Consensus       969 k~gg~~vll~Lr~g~  983 (984)
T KOG3209|consen  969 KQGGRRVLLLLRRGT  983 (984)
T ss_pred             HhCCeEEEEEeccCC
Confidence            876666777777653


No 30 
>KOG3550 consensus Receptor targeting protein Lin-7 [Extracellular structures]
Probab=94.26  E-value=0.16  Score=44.85  Aligned_cols=76  Identities=25%  Similarity=0.477  Sum_probs=54.1

Q ss_pred             EEEEecCc---ceeEEeee--CCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCce
Q 026827           87 YEVEIEQP---YGLKFAKG--RDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPL  161 (232)
Q Consensus        87 yeVeL~KP---LGL~Fee~--~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv  161 (232)
                      -.|+|+|-   ||..+--+  -+--|||..|-|||-|++-|.++-||+|+.|..+-    +....--.....++.-.|+|
T Consensus        92 rvvelpktdeglgfnvmggkeqnspiyisriipggvadrhgglkrgdqllsvngvs----vege~hekavellkaa~gsv  167 (207)
T KOG3550|consen   92 RVVELPKTDEGLGFNVMGGKEQNSPIYISRIIPGGVADRHGGLKRGDQLLSVNGVS----VEGEHHEKAVELLKAAVGSV  167 (207)
T ss_pred             ceeecCccccccceeeccCcccCCceEEEeecCCccccccCcccccceeEeeccee----ecchhhHHHHHHHHHhcCcE
Confidence            56888875   44444333  23389999999999999999999999999988641    11112223456777878999


Q ss_pred             EEEEe
Q 026827          162 LMKMQ  166 (232)
Q Consensus       162 ~LkLe  166 (232)
                      .|++.
T Consensus       168 klvvr  172 (207)
T KOG3550|consen  168 KLVVR  172 (207)
T ss_pred             EEEEe
Confidence            88764


No 31 
>TIGR01713 typeII_sec_gspC general secretion pathway protein C. This model represents GspC, protein C of the main terminal branch of the general secretion pathway, also called type II secretion. This system transports folded proteins across the bacterial outer membrane and is widely distributed in Gram-negative pathogens.
Probab=94.15  E-value=0.12  Score=46.35  Aligned_cols=67  Identities=16%  Similarity=0.188  Sum_probs=47.7

Q ss_pred             ceeEEeeeCC--CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-cc-CceEEEEeec
Q 026827           95 YGLKFAKGRD--GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-RV-GPLLMKMQKR  168 (232)
Q Consensus        95 LGL~Fee~~d--GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-Rs-Gpv~LkLeR~  168 (232)
                      +|+.-....+  -|+.|..+.+++-|+++| |+.||+|+++-..      +..+..+.+.++.. +. ..+.|.++|.
T Consensus       179 lgi~p~~~~g~~~G~~v~~v~~~s~a~~aG-Lr~GDvIv~ING~------~i~~~~~~~~~l~~~~~~~~v~l~V~R~  249 (259)
T TIGR01713       179 IRLSPVMKNDKLEGYRLNPGKDPSLFYKSG-LQDGDIAVALNGL------DLRDPEQAFQALQMLREETNLTLTVERD  249 (259)
T ss_pred             EeEEEEEeCCceeEEEEEecCCCCHHHHcC-CCCCCEEEEECCE------EcCCHHHHHHHHHhcCCCCeEEEEEEEC
Confidence            4555443222  299999999999999999 9999999998753      44455555555553 23 4689999983


No 32 
>TIGR00054 RIP metalloprotease RseP. A model that detects fragments as well matches a number of members of the PEPTIDASE FAMILY S2C. The region of match appears not to overlap the active site domain.
Probab=94.14  E-value=0.11  Score=49.04  Aligned_cols=58  Identities=12%  Similarity=0.276  Sum_probs=45.1

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc-CceEEEEeecC
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV-GPLLMKMQKRY  169 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs-Gpv~LkLeR~~  169 (232)
                      -++.|.+|.+++.|+++| +++||+|+++...      ++.++.++..+++... .++.+.++|.-
T Consensus       203 ~g~vV~~V~~~SpA~~aG-L~~GD~Iv~Vng~------~V~s~~dl~~~l~~~~~~~v~l~v~R~g  261 (420)
T TIGR00054       203 IEPVLSDVTPNSPAEKAG-LKEGDYIQSINGE------KLRSWTDFVSAVKENPGKSMDIKVERNG  261 (420)
T ss_pred             cCcEEEEECCCCHHHHcC-CCCCCEEEEECCE------ECCCHHHHHHHHHhCCCCceEEEEEECC
Confidence            378999999999999999 9999999998642      4556666667776533 46888888743


No 33 
>KOG3580 consensus Tight junction proteins [Signal transduction mechanisms]
Probab=93.66  E-value=0.061  Score=55.44  Aligned_cols=43  Identities=33%  Similarity=0.695  Sum_probs=40.3

Q ss_pred             CcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecc
Q 026827           93 QPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAV  136 (232)
Q Consensus        93 KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~  136 (232)
                      +-.||.|+-++|=||||..|-.|..|++.| |+.||+|+.|.-+
T Consensus       417 dSvGLRLAGGNDVGIFVaGvqegspA~~eG-lqEGDQIL~VN~v  459 (1027)
T KOG3580|consen  417 DSVGLRLAGGNDVGIFVAGVQEGSPAEQEG-LQEGDQILKVNTV  459 (1027)
T ss_pred             CeeeeEeccCCceeEEEeecccCCchhhcc-ccccceeEEeccc
Confidence            468999999999999999999999999999 9999999999875


No 34 
>KOG3532 consensus Predicted protein kinase [General function prediction only]
Probab=93.63  E-value=0.15  Score=53.17  Aligned_cols=73  Identities=21%  Similarity=0.367  Sum_probs=60.8

Q ss_pred             ecCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeecCC
Q 026827           91 IEQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKRYG  170 (232)
Q Consensus        91 L~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~~~  170 (232)
                      ..-|.||+|.++.+--|-|..|.|..-|+|+. +++||+|+|+-.      .|+...-++-..++.-.++|+.-.+|..-
T Consensus       384 ~s~~ig~vf~~~~~~~v~v~tv~~ns~a~k~~-~~~gdvlvai~~------~pi~s~~q~~~~~~s~~~~~~~l~~~~~~  456 (1051)
T KOG3532|consen  384 VSSPIGLVFDKNTNRAVKVCTVEDNSLADKAA-FKPGDVLVAINN------VPIRSERQATRFLQSTTGDLTVLVERSLD  456 (1051)
T ss_pred             ccCceeEEEecCCceEEEEEEecCCChhhHhc-CCCcceEEEecC------ccchhHHHHHHHHHhcccceEEEEeeccc
Confidence            35699999999888899999999999999998 999999999864      47777777777888778888766666333


No 35 
>COG3975 Predicted protease with the C-terminal PDZ domain [General function prediction only]
Probab=92.81  E-value=0.14  Score=51.50  Aligned_cols=40  Identities=38%  Similarity=0.641  Sum_probs=36.1

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecc
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAV  136 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~  136 (232)
                      ||+++.. ..|+..|..|.++|.|.++| |.+||+|+++...
T Consensus       453 LGl~v~~-~~g~~~i~~V~~~gPA~~AG-l~~Gd~ivai~G~  492 (558)
T COG3975         453 LGLKVKS-EGGHEKITFVFPGGPAYKAG-LSPGDKIVAINGI  492 (558)
T ss_pred             cceEecc-cCCeeEEEecCCCChhHhcc-CCCccEEEEEcCc
Confidence            7888877 57799999999999999999 9999999999875


No 36 
>KOG3938 consensus RGS-GAIP interacting protein GIPC, contains PDZ domain [Signal transduction mechanisms; Intracellular trafficking, secretion, and vesicular transport]
Probab=92.69  E-value=0.4  Score=45.32  Aligned_cols=76  Identities=22%  Similarity=0.381  Sum_probs=59.8

Q ss_pred             EEecCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhh--cccCceEEEEe
Q 026827           89 VEIEQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIR--QRVGPLLMKMQ  166 (232)
Q Consensus        89 VeL~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr--~RsGpv~LkLe  166 (232)
                      |.-.+-|||.+..+.-|++||..|.+|+=-++-..|+|||.|-++.   |..|.--+-| +|...++  .|..+++|+|-
T Consensus       133 ~KsedalGlTITDNG~GyAFIKrIkegsvidri~~i~VGd~IEaiN---ge~ivG~RHY-eVArmLKel~rge~ftlrLi  208 (334)
T KOG3938|consen  133 VKSEDALGLTITDNGAGYAFIKRIKEGSVIDRIEAICVGDHIEAIN---GESIVGKRHY-EVARMLKELPRGETFTLRLI  208 (334)
T ss_pred             EecccccceEEeeCCcceeeeEeecCCchhhhhhheeHHhHHHhhc---CccccchhHH-HHHHHHHhcccCCeeEEEee
Confidence            3445679999999888999999999999999988999999998876   4455555555 4555555  45778899987


Q ss_pred             ec
Q 026827          167 KR  168 (232)
Q Consensus       167 R~  168 (232)
                      -|
T Consensus       209 eP  210 (334)
T KOG3938|consen  209 EP  210 (334)
T ss_pred             cc
Confidence            66


No 37 
>TIGR00054 RIP metalloprotease RseP. A model that detects fragments as well matches a number of members of the PEPTIDASE FAMILY S2C. The region of match appears not to overlap the active site domain.
Probab=92.35  E-value=0.2  Score=47.26  Aligned_cols=56  Identities=16%  Similarity=0.279  Sum_probs=40.1

Q ss_pred             CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEee
Q 026827          105 GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQK  167 (232)
Q Consensus       105 GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR  167 (232)
                      -+++|.+|.+++-|+++| +++||+|+.+-..      ++.+..+....|....+++.+.+.|
T Consensus       128 ~g~~V~~V~~~SpA~~AG-L~~GDvI~~vng~------~v~~~~dl~~~ia~~~~~v~~~I~r  183 (420)
T TIGR00054       128 VGPVIELLDKNSIALEAG-IEPGDEILSVNGN------KIPGFKDVRQQIADIAGEPMVEILA  183 (420)
T ss_pred             CCceeeccCCCCHHHHcC-CCCCCEEEEECCE------EcCCHHHHHHHHHhhcccceEEEEE
Confidence            478899999999999999 9999999998653      2333333333333333777777766


No 38 
>PRK10779 zinc metallopeptidase RseP; Provisional
Probab=92.24  E-value=0.18  Score=47.81  Aligned_cols=56  Identities=11%  Similarity=0.240  Sum_probs=40.1

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc--CceEEEEeec
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV--GPLLMKMQKR  168 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs--Gpv~LkLeR~  168 (232)
                      ..+|.+|.|++-|+++| +++||+|+++-..      +.++..+....+..+.  ..+.+++.|.
T Consensus       127 ~~lV~~V~~~SpA~kAG-Lk~GDvI~~vnG~------~V~~~~~l~~~v~~~~~g~~v~v~v~R~  184 (449)
T PRK10779        127 RPVVGEIAPNSIAAQAQ-IAPGTELKAVDGI------ETPDWDAVRLALVSKIGDESTTITVAPF  184 (449)
T ss_pred             CccccccCCCCHHHHcC-CCCCCEEEEECCE------EcCCHHHHHHHHHhhccCCceEEEEEeC
Confidence            45799999999999999 9999999998653      4455555444444322  3477777763


No 39 
>KOG3606 consensus Cell polarity protein PAR6 [Signal transduction mechanisms]
Probab=92.07  E-value=0.44  Score=45.27  Aligned_cols=69  Identities=28%  Similarity=0.571  Sum_probs=50.3

Q ss_pred             cCcceeEEeeeC------CC-----CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCc
Q 026827           92 EQPYGLKFAKGR------DG-----GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGP  160 (232)
Q Consensus        92 ~KPLGL~Fee~~------dG-----gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGp  160 (232)
                      +||||..+-.+.      .|     ||||..++|||=|+-+|.+.|-|.|+.|..+   ||- -+.+++|-.++-.-+-.
T Consensus       170 ekPLGFYIRDG~SVRVtp~GlekvpGIFISRlVpGGLAeSTGLLaVnDEVlEVNGI---EVa-GKTLDQVTDMMvANshN  245 (358)
T KOG3606|consen  170 EKPLGFYIRDGTSVRVTPHGLEKVPGIFISRLVPGGLAESTGLLAVNDEVLEVNGI---EVA-GKTLDQVTDMMVANSHN  245 (358)
T ss_pred             CCCceEEEecCceEEeccccccccCceEEEeecCCccccccceeeecceeEEEcCE---Eec-cccHHHHHHHHhhcccc
Confidence            799997765442      23     9999999999999999999999999998864   332 23677766655544444


Q ss_pred             eEEE
Q 026827          161 LLMK  164 (232)
Q Consensus       161 v~Lk  164 (232)
                      +-+.
T Consensus       246 LIiT  249 (358)
T KOG3606|consen  246 LIIT  249 (358)
T ss_pred             eEEE
Confidence            4443


No 40 
>KOG3580 consensus Tight junction proteins [Signal transduction mechanisms]
Probab=91.88  E-value=0.27  Score=50.97  Aligned_cols=76  Identities=20%  Similarity=0.309  Sum_probs=62.0

Q ss_pred             cCcceeEEeeeCC--------C-CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceE
Q 026827           92 EQPYGLKFAKGRD--------G-GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLL  162 (232)
Q Consensus        92 ~KPLGL~Fee~~d--------G-gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~  162 (232)
                      ++|.++.|-..++        | .|||.+|...|=|++.|.|+.||+|+.+..+.-.    -..+-++...|...-|.+.
T Consensus       197 ~~p~kv~LvKsR~nEEyGlrLgSqIFvKeit~~gLAardgnlqEGDiiLkINGtvte----NmSLtDar~LIEkS~GKL~  272 (1027)
T KOG3580|consen  197 PGPIKVLLVKSRANEEYGLRLGSQIFVKEITRTGLAARDGNLQEGDIILKINGTVTE----NMSLTDARKLIEKSRGKLQ  272 (1027)
T ss_pred             CCcceEEEEeeccchhhcccccchhhhhhhcccchhhccCCcccccEEEEECcEeec----cccchhHHHHHHhccCceE
Confidence            4677777776544        2 7999999999999999999999999998876443    3366678888998889999


Q ss_pred             EEEeecCCc
Q 026827          163 MKMQKRYGK  171 (232)
Q Consensus       163 LkLeR~~~~  171 (232)
                      |.+.|--++
T Consensus       273 lvVlRD~~q  281 (1027)
T KOG3580|consen  273 LVVLRDSQQ  281 (1027)
T ss_pred             EEEEecCCc
Confidence            999997665


No 41 
>KOG3605 consensus Beta amyloid precursor-binding protein [General function prediction only]
Probab=91.31  E-value=0.12  Score=53.31  Aligned_cols=56  Identities=21%  Similarity=0.427  Sum_probs=43.3

Q ss_pred             hccccEEEEEecC--cceeEEeeeCCC----CeEEEEeCCCCCcccccccccCcEEEEeecc
Q 026827           81 EEKYEEYEVEIEQ--PYGLKFAKGRDG----GTYIDAIAPGGSADKTGMFQVGDKVLATSAV  136 (232)
Q Consensus        81 ~~~~eeyeVeL~K--PLGL~Fee~~dG----gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~  136 (232)
                      +++|.|..|+=.|  +||+++-|+.=|    -|.|+-+..+|-|+++|++.+||+|+++..+
T Consensus       643 kE~qKEVvv~K~kGEiLGVViVESGWGSmLPTVViAnmm~~GpAarsgkLnIGDQiiaING~  704 (829)
T KOG3605|consen  643 KENQKEVVLEKHKGEILGVVIVESGWGSILPTVVIANMMHGGPAARSGKLNIGDQIMSINGT  704 (829)
T ss_pred             hcccceeeeecccCceeeEEEEecCccccchHHHHHhcccCChhhhcCCccccceeEeecCc
Confidence            4455544444433  789888886444    7889999999999999999999999998763


No 42 
>KOG3209 consensus WW domain-containing protein [General function prediction only]
Probab=90.76  E-value=0.63  Score=48.85  Aligned_cols=79  Identities=25%  Similarity=0.515  Sum_probs=58.4

Q ss_pred             cEEEEEe-cCcceeEEee-eCC--C-CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeecc--chhhHHHHhh--
Q 026827           85 EEYEVEI-EQPYGLKFAK-GRD--G-GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAA--EYGRTMYTIR--  155 (232)
Q Consensus        85 eeyeVeL-~KPLGL~Fee-~~d--G-gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~--~~G~t~~AIr--  155 (232)
                      .+..|.| .||.|.-|-- +.|  | -+||-.|.+.|.|++.|.++.||.|+.+-..      |+.  .--.+...+.  
T Consensus       649 k~ldV~L~rkesGFGFRiLGG~ep~qpi~iG~Iv~lGaAe~DGRL~~gDElv~iDG~------pV~GksH~~vv~Lm~~A  722 (984)
T KOG3209|consen  649 KELDVFLRRKESGFGFRILGGDEPGQPIYIGAIVPLGAAEEDGRLREGDELVCIDGI------PVEGKSHSEVVDLMEAA  722 (984)
T ss_pred             cceeEEEEeeccccceEEecCCCCCCeeEEeeeeecccccccCcccCCCeEEEecCe------eccCccHHHHHHHHHHH
Confidence            5677766 5788877664 223  2 8999999999999999999999999998763      222  2224444444  


Q ss_pred             cccCceEEEEeecC
Q 026827          156 QRVGPLLMKMQKRY  169 (232)
Q Consensus       156 ~RsGpv~LkLeR~~  169 (232)
                      .|+|-|.|.+.|+.
T Consensus       723 ArnghV~LtVRRkv  736 (984)
T KOG3209|consen  723 ARNGHVNLTVRRKV  736 (984)
T ss_pred             HhcCceEEEEeeee
Confidence            67899999998863


No 43 
>KOG3542 consensus cAMP-regulated guanine nucleotide exchange factor [Signal transduction mechanisms]
Probab=90.46  E-value=0.17  Score=52.95  Aligned_cols=48  Identities=25%  Similarity=0.641  Sum_probs=39.1

Q ss_pred             EEEEecC-----cceeEEeee-CCC-CeEEEEeCCCCCcccccccccCcEEEEeec
Q 026827           87 YEVEIEQ-----PYGLKFAKG-RDG-GTYIDAIAPGGSADKTGMFQVGDKVLATSA  135 (232)
Q Consensus        87 yeVeL~K-----PLGL~Fee~-~dG-gvyV~eV~pGGNAaKaG~I~VGD~LvatSA  135 (232)
                      -+|.|.|     ||=+.+--+ ..| ||||++|.||..|++.| ++-||+++.|..
T Consensus       537 RqviLtk~sre~pl~f~L~GGsEkGfgifV~~V~pgskAa~~G-lKRgDqilEVNg  591 (1283)
T KOG3542|consen  537 RQVILTKASREDPLMFRLVGGSEKGFGIFVAEVFPGSKAAREG-LKRGDQILEVNG  591 (1283)
T ss_pred             eeEEEecccccCCceeEeccCccccceeEEeeecCCchHHHhh-hhhhhhhhhccc
Confidence            4566666     566666654 456 99999999999999999 999999998865


No 44 
>COG0265 DegQ Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain [Posttranslational modification, protein turnover, chaperones]
Probab=90.02  E-value=0.83  Score=41.28  Aligned_cols=58  Identities=28%  Similarity=0.516  Sum_probs=43.8

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhh-cccC-ceEEEEeecCCc
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIR-QRVG-PLLMKMQKRYGK  171 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr-~RsG-pv~LkLeR~~~~  171 (232)
                      |++|..|.+++.|+++| ++.||+|+++..      +++....+.+..+. .+.| .+.+++.|. |+
T Consensus       271 G~~V~~v~~~spa~~ag-i~~Gdii~~vng------~~v~~~~~l~~~v~~~~~g~~v~~~~~r~-g~  330 (347)
T COG0265         271 GAVVLGVLPGSPAAKAG-IKAGDIITAVNG------KPVASLSDLVAAVASNRPGDEVALKLLRG-GK  330 (347)
T ss_pred             ceEEEecCCCChHHHcC-CCCCCEEEEECC------EEccCHHHHHHHHhccCCCCEEEEEEEEC-CE
Confidence            59999999999999999 999999999875      34444544444444 2234 678999987 54


No 45 
>KOG3129 consensus 26S proteasome regulatory complex, subunit PSMD9 [Posttranslational modification, protein turnover, chaperones]
Probab=89.97  E-value=0.4  Score=43.66  Aligned_cols=69  Identities=23%  Similarity=0.357  Sum_probs=42.9

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc--ccCceEEEEeecCCccccccccchH
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ--RVGPLLMKMQKRYGKMEQTGELSEK  181 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~--RsGpv~LkLeR~~~~~~~~~~ltek  181 (232)
                      -++|.+|+|++-|+++| +++||.|+....+-+..--+   +-.+- ++.+  ..-++.+++-|.-.+++.  .||.+
T Consensus       140 Fa~V~sV~~~SPA~~aG-l~~gD~il~fGnV~sgn~~~---lq~i~-~~v~~~e~~~v~v~v~R~g~~v~L--~ltP~  210 (231)
T KOG3129|consen  140 FAVVDSVVPGSPADEAG-LCVGDEILKFGNVHSGNFLP---LQNIA-AVVQSNEDQIVSVTVIREGQKVVL--SLTPK  210 (231)
T ss_pred             eEEEeecCCCChhhhhC-cccCceEEEecccccccchh---HHHHH-HHHHhccCcceeEEEecCCCEEEE--EeCcc
Confidence            57899999999999999 99999999966553322111   21222 2222  224566666665554432  44544


No 46 
>TIGR03279 cyano_FeS_chp putative FeS-containing Cyanobacterial-specific oxidoreductase. Members of this protein family are predicted FeS-containing oxidoreductases of unknown function, apparently restricted to and universal across the Cyanobacteria. The high trusted cutoff score for this model, 700 bits, excludes homologs from other lineages. This exclusion seems justified because a significant number of sequence positions are simultaneously unique to and invariant across the Cyanobacteria, suggesting a specialized, conserved function, perhaps related to photosynthesis. A distantly related protein family, TIGR03278, in universal in and restricted to archaeal methanogens, and may be linked to methanogenesis.
Probab=86.66  E-value=0.91  Score=44.44  Aligned_cols=50  Identities=20%  Similarity=0.366  Sum_probs=34.0

Q ss_pred             EEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEee
Q 026827          109 IDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQK  167 (232)
Q Consensus       109 V~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR  167 (232)
                      |..|.|++-|+++| |++||+|+++-.   ..+.   ++-++.+++..  .++.|.+.+
T Consensus         2 I~~V~pgSpAe~AG-Le~GD~IlsING---~~V~---Dw~D~~~~l~~--e~l~L~V~~   51 (433)
T TIGR03279         2 ISAVLPGSIAEELG-FEPGDALVSING---VAPR---DLIDYQFLCAD--EELELEVLD   51 (433)
T ss_pred             cCCcCCCCHHHHcC-CCCCCEEEEECC---EECC---CHHHHHHHhcC--CcEEEEEEc
Confidence            56789999999999 999999999864   2333   33344444432  345555543


No 47 
>TIGR02860 spore_IV_B stage IV sporulation protein B. SpoIVB, the stage IV sporulation protein B of endospore-forming bacteria such as Bacillus subtilis, is a serine proteinase, expressed in the spore (rather than mother cell) compartment, that participates in a proteolytic activation cascade for Sigma-K. It appears to be universal among endospore-forming bacteria and occurs nowhere else.
Probab=85.00  E-value=1.6  Score=42.32  Aligned_cols=65  Identities=17%  Similarity=0.354  Sum_probs=39.3

Q ss_pred             cceeEEeeeCCCCeEEEEeCC--------CCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc-ccCceEEE
Q 026827           94 PYGLKFAKGRDGGTYIDAIAP--------GGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ-RVGPLLMK  164 (232)
Q Consensus        94 PLGL~Fee~~dGgvyV~eV~p--------GGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~-RsGpv~Lk  164 (232)
                      |.||.+.   .-||+|....+        ++.|+++| |++||+|+++-..   .+...+++   ..+++. ...++.|.
T Consensus        97 ~iGI~l~---t~GVlVvg~~~v~~~~g~~~SPAa~AG-Lq~GDiIvsING~---~V~s~~DL---~~iL~~~~g~~V~Lt  166 (402)
T TIGR02860        97 SIGVKLN---TKGVLVVGFSDIETEKGKIHSPGEEAG-IQIGDRILKINGE---KIKNMDDL---ANLINKAGGEKLTLT  166 (402)
T ss_pred             EEEEEEe---cCEEEEEEEEcccccCCCCCCHHHHcC-CCCCCEEEEECCE---ECCCHHHH---HHHHHhCCCCeEEEE
Confidence            4555553   23666655422        35577778 9999999998642   44444444   444442 24568888


Q ss_pred             Eeec
Q 026827          165 MQKR  168 (232)
Q Consensus       165 LeR~  168 (232)
                      +.|.
T Consensus       167 V~R~  170 (402)
T TIGR02860       167 IERG  170 (402)
T ss_pred             EEEC
Confidence            8774


No 48 
>PF14685 Tricorn_PDZ:  Tricorn protease PDZ domain; PDB: 1N6F_D 1N6D_C 1N6E_C 1K32_A.
Probab=83.67  E-value=5.9  Score=30.81  Aligned_cols=69  Identities=25%  Similarity=0.446  Sum_probs=41.8

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcc--------ccc-ccccCcEEEEeecccCCceeeccchhhHHHHhhcccC-ceEEE
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSAD--------KTG-MFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVG-PLLMK  164 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAa--------KaG-~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsG-pv~Lk  164 (232)
                      ||..|.-. +|+.-|..|-+|-+..        +.| .|++||.|++|-..   +|=+..++   -.++..+.| .|.|.
T Consensus         3 LGAd~~~~-~~~y~I~~I~~gd~~~~~~~sPL~~pGv~v~~GD~I~aInG~---~v~~~~~~---~~lL~~~agk~V~Lt   75 (88)
T PF14685_consen    3 LGADFSYD-NGGYRIARIYPGDPWNPNARSPLAQPGVDVREGDYILAINGQ---PVTADANP---YRLLEGKAGKQVLLT   75 (88)
T ss_dssp             -SEEEEEE-TTEEEEEEE-BS-TTSSS-B-GGGGGS----TT-EEEEETTE---E-BTTB-H---HHHHHTTTTSEEEEE
T ss_pred             cceEEEEc-CCEEEEEEEeCCCCCCccccCCccCCCCCCCCCCEEEEECCE---ECCCCCCH---HHHhcccCCCEEEEE
Confidence            78888887 6888889998874433        344 57899999998753   44444343   345665565 78999


Q ss_pred             EeecCC
Q 026827          165 MQKRYG  170 (232)
Q Consensus       165 LeR~~~  170 (232)
                      +.++.+
T Consensus        76 v~~~~~   81 (88)
T PF14685_consen   76 VNRKPG   81 (88)
T ss_dssp             EE-STT
T ss_pred             EecCCC
Confidence            998776


No 49 
>KOG3651 consensus Protein kinase C, alpha binding protein [Signal transduction mechanisms]
Probab=83.40  E-value=9.4  Score=37.14  Aligned_cols=124  Identities=15%  Similarity=0.214  Sum_probs=78.0

Q ss_pred             ceeEEeeeCC--CCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeecCCcc
Q 026827           95 YGLKFAKGRD--GGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKRYGKM  172 (232)
Q Consensus        95 LGL~Fee~~d--GgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~~~~~  172 (232)
                      .||.+.-+.-  .-+||+.|-++.-|++.|.|+.||.|++|.++   .+- -..--.|..+|..-.++|.+..-+--++.
T Consensus        18 iGISIGGGapyCPClYiVQvFD~tPAa~dG~i~~GDEi~avNg~---svK-GktKveVAkmIQ~~~~eV~IhyNKL~adp   93 (429)
T KOG3651|consen   18 IGISIGGGAPYCPCLYIVQVFDKTPAAKDGRIRCGDEIVAVNGI---SVK-GKTKVEVAKMIQVSLNEVKIHYNKLEADP   93 (429)
T ss_pred             eeEEecCCCCcCCeEEEEEeccCCchhccCccccCCeeEEecce---eec-CccHHHHHHHHHHhccceEEEehhcccCc
Confidence            4555543211  16899999999999999999999999999864   111 11122577789998999999877766665


Q ss_pred             ccccccchHHHHHHh--hcCccccc-------hhHHHHHHHHHHHHHHHHHHHHHHHHhhh
Q 026827          173 EQTGELSEKEIIRAE--RNSGVISN-------RVREIQMQNYMKKKEQKERREQDLLRVFL  224 (232)
Q Consensus       173 ~~~~~lteke~~rae--r~~G~i~~-------~~reiq~~ny~~k~e~~~qr~~~~~~~~~  224 (232)
                      ..+--|.  =++|..  |---|++.       .-|-|=-..-+-|++.+..+-..|-.||.
T Consensus        94 ~qGktLD--I~lKKvKHrvVen~ss~tADaLGLSRAILcND~LvkrleeLE~tae~Ykglv  152 (429)
T KOG3651|consen   94 TQGKTLD--ILLKKVKHRVVENVSSDTADALGLSRAILCNDPLVKRLEELEETAEFYKGLV  152 (429)
T ss_pred             ccCccHH--HHHHHHHHHHHhhcccCchhhhcchhhhhcCcHHHHHHHHHHhHHHHHHHHH
Confidence            5443332  112221  11111221       23556556667777777777777766664


No 50 
>KOG3552 consensus FERM domain protein FRM-8 [General function prediction only]
Probab=82.86  E-value=3  Score=45.21  Aligned_cols=74  Identities=20%  Similarity=0.320  Sum_probs=61.1

Q ss_pred             EEEEecCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEe
Q 026827           87 YEVEIEQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQ  166 (232)
Q Consensus        87 yeVeL~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLe  166 (232)
                      .+....--||.-|-.+  --|.|..|.+||.+.  |++.+||+|+++.    +|=..+.--.+|+..+|.--..|.|.+-
T Consensus        59 vq~~r~~~lGFgfvag--rPviVr~VT~GGps~--GKL~PGDQIl~vN----~Epv~daprervIdlvRace~sv~ltV~  130 (1298)
T KOG3552|consen   59 VQLQRNASLGFGFVAG--RPVIVRFVTEGGPSI--GKLQPGDQILAVN----GEPVKDAPRERVIDLVRACESSVNLTVC  130 (1298)
T ss_pred             hhhhccccccceeecC--CceEEEEecCCCCcc--ccccCCCeEEEec----CcccccccHHHHHHHHHHHhhhcceEEe
Confidence            5556667788888776  689999999999976  9999999999965    4666666778999999976778999888


Q ss_pred             ec
Q 026827          167 KR  168 (232)
Q Consensus       167 R~  168 (232)
                      +|
T Consensus       131 qP  132 (1298)
T KOG3552|consen  131 QP  132 (1298)
T ss_pred             cc
Confidence            86


No 51 
>PF04495 GRASP55_65:  GRASP55/65 PDZ-like domain ;  InterPro: IPR007583 GRASP55 (Golgi reassembly stacking protein of 55 kDa) and GRASP65 (a 65 kDa) protein are highly homologous. GRASP55 is a component of the Golgi stacking machinery. GRASP65, an N-ethylmaleimide-sensitive membrane protein required for the stacking of Golgi cisternae in a cell-free system [].; PDB: 3RLE_A 4EDJ_A.
Probab=75.67  E-value=13  Score=30.77  Aligned_cols=69  Identities=14%  Similarity=0.211  Sum_probs=41.0

Q ss_pred             CcceeEEe--eeC---CCCeEEEEeCCCCCccccccccc-CcEEEEeec-ccCCceeeccchhhHHHHhhcccCceEEEE
Q 026827           93 QPYGLKFA--KGR---DGGTYIDAIAPGGSADKTGMFQV-GDKVLATSA-VFGTEIWPAAEYGRTMYTIRQRVGPLLMKM  165 (232)
Q Consensus        93 KPLGL~Fe--e~~---dGgvyV~eV~pGGNAaKaG~I~V-GD~LvatSA-~FGdElWpA~~~G~t~~AIr~RsGpv~LkL  165 (232)
                      ..||+.+.  ...   ..+.-|..|.|++-|+++| +++ .|.|+++.. .|.    ..++|.....+  ....++.|.+
T Consensus        26 g~LG~sv~~~~~~~~~~~~~~Vl~V~p~SPA~~AG-L~p~~DyIig~~~~~l~----~~~~l~~~v~~--~~~~~l~L~V   98 (138)
T PF04495_consen   26 GLLGISVRFESFEGAEEEGWHVLRVAPNSPAAKAG-LEPFFDYIIGIDGGLLD----DEDDLFELVEA--NENKPLQLYV   98 (138)
T ss_dssp             SSS-EEEEEEE-TTGCCCEEEEEEE-TTSHHHHTT---TTTEEEEEETTCE------STCHHHHHHHH--TTTS-EEEEE
T ss_pred             CCCcEEEEEecccccccceEEEeEecCCCHHHHCC-ccccccEEEEccceecC----CHHHHHHHHHH--cCCCcEEEEE
Confidence            56775544  433   4488999999999999999 665 799999763 222    34455443332  3345788877


Q ss_pred             eec
Q 026827          166 QKR  168 (232)
Q Consensus       166 eR~  168 (232)
                      ...
T Consensus        99 yns  101 (138)
T PF04495_consen   99 YNS  101 (138)
T ss_dssp             EET
T ss_pred             EEC
Confidence            653


No 52 
>PF11874 DUF3394:  Domain of unknown function (DUF3394);  InterPro: IPR021814  This domain is functionally uncharacterised. This domain is found in bacteria. This presumed domain is about 190 amino acids in length. This domain is found associated with PF06808 from PFAM. 
Probab=71.20  E-value=5.3  Score=35.16  Aligned_cols=40  Identities=20%  Similarity=0.374  Sum_probs=35.2

Q ss_pred             ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecc
Q 026827           95 YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAV  136 (232)
Q Consensus        95 LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~  136 (232)
                      .||.+.+ .||.+.|+.|..|+.|+++| +.-|++|+.+..-
T Consensus       113 ~GL~l~~-e~~~~~Vd~v~fgS~A~~~g-~d~d~~I~~v~v~  152 (183)
T PF11874_consen  113 AGLTLME-EGGKVIVDEVEFGSPAEKAG-IDFDWEITEVEVP  152 (183)
T ss_pred             CCCEEEe-eCCEEEEEecCCCCHHHHcC-CCCCcEEEEEEec
Confidence            5788887 57899999999999999999 9999999988753


No 53 
>COG3031 PulC Type II secretory pathway, component PulC [Intracellular trafficking and secretion]
Probab=62.73  E-value=10  Score=35.49  Aligned_cols=62  Identities=26%  Similarity=0.488  Sum_probs=40.1

Q ss_pred             cCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeec
Q 026827           92 EQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKR  168 (232)
Q Consensus        92 ~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~  168 (232)
                      +|=+|..|+.+.||..|          +++| ++.||+.+++--.   ++-+-+..-+.+..|+. ...+.|.+.|+
T Consensus       204 eki~Gyr~~pgkd~slF----------~~sg-lq~GDIavaiNnl---dltdp~~m~~llq~l~~-m~s~qlTv~R~  265 (275)
T COG3031         204 EKIEGYRFEPGKDGSLF----------YKSG-LQRGDIAVAINNL---DLTDPEDMFRLLQMLRN-MPSLQLTVIRR  265 (275)
T ss_pred             CceEEEEecCCCCcchh----------hhhc-CCCcceEEEecCc---ccCCHHHHHHHHHhhhc-CcceEEEEEec
Confidence            34455555555555444          4777 9999999998753   44444444456666664 45678888874


No 54 
>COG3480 SdrC Predicted secreted protein containing a PDZ domain [Signal transduction mechanisms]
Probab=61.38  E-value=23  Score=34.25  Aligned_cols=69  Identities=16%  Similarity=0.375  Sum_probs=46.2

Q ss_pred             ecCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhh-HHHHhhcccCc-eEEEEeec
Q 026827           91 IEQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGR-TMYTIRQRVGP-LLMKMQKR  168 (232)
Q Consensus        91 L~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~-t~~AIr~RsGp-v~LkLeR~  168 (232)
                      ..||.-+.++     ||||..+.+++-|.  |++++||.|+++-..      +....++ +-+.-..+.|+ |+++.+|.
T Consensus       121 a~~pv~~~y~-----gvyv~~v~~~~~~~--gkl~~gD~i~avdg~------~f~s~~e~i~~v~~~k~Gd~VtI~~~r~  187 (342)
T COG3480         121 AGKPVEVTYA-----GVYVLSVIDNSPFK--GKLEAGDTIIAVDGE------PFTSSDELIDYVSSKKPGDEVTIDYERH  187 (342)
T ss_pred             cCCceEEEEe-----eEEEEEccCCcchh--ceeccCCeEEeeCCe------ecCCHHHHHHHHhccCCCCeEEEEEEec
Confidence            3455544443     79999999888754  789999999998753      1223443 33344466654 69999987


Q ss_pred             CCcc
Q 026827          169 YGKM  172 (232)
Q Consensus       169 ~~~~  172 (232)
                      .++.
T Consensus       188 ~~~~  191 (342)
T COG3480         188 NETP  191 (342)
T ss_pred             cCCC
Confidence            7664


No 55 
>PF01436 NHL:  NHL repeat;  InterPro: IPR001258 The NHL repeat, named after NCL-1, HT2A and Lin-41, is found largely in a large number of eukaryotic and prokaryotic proteins. For example, the repeat is found in a variety of enzymes of the copper type II, ascorbate-dependent monooxygenase family which catalyse the C terminus alpha-amidation of biological peptides []. In many it occurs in tandem arrays, for example in the ringfinger beta-box, coiled-coil (RBCC) eukaryotic growth regulators []. The 'Brain Tumor' protein (Brat) is one such growth regulator that contains a 6-bladed NHL-repeat beta-propeller [, ].  The NHL repeats are also found in serine/threonine protein kinase (STPK) in diverse range of pathogenic bacteria. These STPK are transmembrane receptors with a intracellular N-terminal kinase domain and extracellular C-terminal sensor domain. In the STPK, PknD, from Mycobacterium tuberculosis, the sensor domain forms a rigid, six-bladed b-propeller composed of NHL repeats with a flexible tether to the transmembrane domain.; GO: 0005515 protein binding; PDB: 3FVZ_A 3FW0_A 1RWL_A 1RWI_A 1Q7F_A.
Probab=59.46  E-value=10  Score=23.09  Aligned_cols=19  Identities=26%  Similarity=0.607  Sum_probs=16.2

Q ss_pred             ecCcceeEEeeeCCCCeEEEE
Q 026827           91 IEQPYGLKFAKGRDGGTYIDA  111 (232)
Q Consensus        91 L~KPLGL~Fee~~dGgvyV~e  111 (232)
                      +..|.||.+.  .+|.+||.+
T Consensus         1 f~~P~gvav~--~~g~i~VaD   19 (28)
T PF01436_consen    1 FNYPHGVAVD--SDGNIYVAD   19 (28)
T ss_dssp             BSSEEEEEEE--TTSEEEEEE
T ss_pred             CcCCcEEEEe--CCCCEEEEE
Confidence            3579999998  799999987


No 56 
>PLN00207 polyribonucleotide nucleotidyltransferase; Provisional
Probab=58.09  E-value=54  Score=35.21  Aligned_cols=50  Identities=14%  Similarity=0.303  Sum_probs=28.7

Q ss_pred             cccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEE-EeecCCc-------cccccccchHHHH
Q 026827          124 FQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMK-MQKRYGK-------MEQTGELSEKEII  184 (232)
Q Consensus       124 I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~Lk-LeR~~~~-------~~~~~~lteke~~  184 (232)
                      ++-||+++.++++..++.-+-.+|           =|++.. .||.|+-       +..+++-+|+|++
T Consensus       108 v~~g~t~vl~t~~~~~~~~~~~dF-----------~PLtV~y~Ek~~AaGkipggf~kREgrp~d~eiL  165 (891)
T PLN00207        108 VTDGETIVYTSVCLADVPSEPSDF-----------FPLSVHYQERFSAAGRTSGGFFKREGRTKDHEVL  165 (891)
T ss_pred             EEECCeEEEEEEEeccCCCCCCCc-----------cceeEeeeeehhhcCccCCceeccCCCCChHHHH
Confidence            355999999999876553332222           144443 2333321       2455778888864


No 57 
>PRK09681 putative type II secretion protein GspC; Provisional
Probab=57.73  E-value=31  Score=32.09  Aligned_cols=65  Identities=17%  Similarity=0.326  Sum_probs=44.3

Q ss_pred             eEEeee-CCCCeEEEEeCCCCCc---ccccccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEee
Q 026827           97 LKFAKG-RDGGTYIDAIAPGGSA---DKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQK  167 (232)
Q Consensus        97 L~Fee~-~dGgvyV~eV~pGGNA---aKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR  167 (232)
                      |.|..- .|| +.==.|.||+++   ...| ++.||+++++-..   +|=+.....++|..++. ...++|.++|
T Consensus       196 i~lsPv~~~G-l~GYrl~Pgkd~~lF~~~G-Lq~GDva~sING~---dL~D~~qa~~l~~~L~~-~tei~ltVeR  264 (276)
T PRK09681        196 IQLTPVRKEG-IVGYAVKPGADRSLFDASG-FKEGDIAIALNQQ---DFTDPRAMIALMRQLPS-MDSIQLTVLR  264 (276)
T ss_pred             EEEEEEeeCC-ceEEEECCCCcHHHHHHcC-CCCCCEEEEeCCe---eCCCHHHHHHHHHHhcc-CCeEEEEEEE
Confidence            445553 344 544567888776   4677 9999999999865   44444444456666665 5678999998


No 58 
>cd03701 IF2_IF5B_II IF2_IF5B_II: This family represents the domain II of prokaryotic Initiation Factor 2 (IF2) and its archeal and eukaryotic homologue aeIF5B. IF2, the largest initiation factor is an essential GTP binding protein. In E. coli three natural forms of IF2 exist in the cell, IF2alpha, IF2beta1, and IF2beta2. Disruption of the eIF5B gene (FUN12) in yeast causes a severe slow-growth phenotype, associated with a defect in translation. eIF5B has a function analogous to prokaryotic IF2 in mediating the joining of the 60S ribosomal subunit. The eIF5B consists of three N-terminal domains  (I, II, II) connected by a long helix to domain IV. Domain I is a G domain, domain II and IV are beta-barrels and domain III has a novel alpha-beta-alpha sandwich fold. The G domain and the beta-barrel domain II display a similar structure and arrangement to the homologous domains in EF1A, eEF1A and aeIF2gamma.
Probab=57.54  E-value=17  Score=28.05  Aligned_cols=35  Identities=23%  Similarity=0.396  Sum_probs=26.5

Q ss_pred             ceeEEeeeC-CC-CeEEEEeCCCCCcccccccccCcEEEEeec
Q 026827           95 YGLKFAKGR-DG-GTYIDAIAPGGSADKTGMFQVGDKVLATSA  135 (232)
Q Consensus        95 LGL~Fee~~-dG-gvyV~eV~pGGNAaKaG~I~VGD~LvatSA  135 (232)
                      -|.++|... .| |.+.+-|.      +.|.+++||.|++=++
T Consensus         2 ~g~ViE~~~~~g~G~vatviV------~~GtL~~Gd~iv~G~~   38 (95)
T cd03701           2 EGTVIESKLDKGRGPVATVIV------QNGTLKKGDVIVAGGT   38 (95)
T ss_pred             eEEEEEEEecCCCCeeEEEEE------EcCeEecCCEEEECCc
Confidence            377788763 34 88888888      6677999999998653


No 59 
>KOG3551 consensus Syntrophins (type beta) [Extracellular structures]
Probab=52.95  E-value=19  Score=35.98  Aligned_cols=66  Identities=24%  Similarity=0.455  Sum_probs=50.9

Q ss_pred             EEEEecC----cceeEEeeeCCC--CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhc
Q 026827           87 YEVEIEQ----PYGLKFAKGRDG--GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQ  156 (232)
Q Consensus        87 yeVeL~K----PLGL~Fee~~dG--gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~  156 (232)
                      -.|.+-|    =|||.+.-+++.  -|.|..|-+|=.|+.++.+-+||.|+.|.   |.++-+| .-.+...+++.
T Consensus        86 R~V~V~K~d~gGLGISIKGGreNkMPIlISKIFkGlAADQt~aL~~gDaIlSVN---G~dL~~A-tHdeAVqaLKr  157 (506)
T KOG3551|consen   86 RRVRVVKQDAGGLGISIKGGRENKMPILISKIFKGLAADQTGALFLGDAILSVN---GEDLRDA-THDEAVQALKR  157 (506)
T ss_pred             ceeEEEEecCCcceEEeecCcccCCceehhHhccccccccccceeeccEEEEec---chhhhhc-chHHHHHHHHh
Confidence            5566655    378888876544  89999999999999999999999999876   5577776 45555666663


No 60 
>KOG3549 consensus Syntrophins (type gamma) [Extracellular structures]
Probab=52.36  E-value=36  Score=33.88  Aligned_cols=80  Identities=23%  Similarity=0.296  Sum_probs=56.6

Q ss_pred             hccccEEEEEecCc----ceeEEeeeCCC--CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHh
Q 026827           81 EEKYEEYEVEIEQP----YGLKFAKGRDG--GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTI  154 (232)
Q Consensus        81 ~~~~eeyeVeL~KP----LGL~Fee~~dG--gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AI  154 (232)
                      +|..+|-+|+|.+-    |||.+.-+..-  -|.|..|-++-.|+.+|++=|||-|+.|...    -..+-.-..+...+
T Consensus        50 p~~s~eRtVtirRQ~vGGlGLSIKGGaEHn~PvviSkI~kdQaAd~tG~LFvGDAilqvNGi----~v~~c~HeevV~iL  125 (505)
T KOG3549|consen   50 PMESKERTVTIRRQKVGGLGLSIKGGAEHNLPVVISKIYKDQAADITGQLFVGDAILQVNGI----YVTACPHEEVVNIL  125 (505)
T ss_pred             CccCCceeEEEEeeecCcceeeeccccccCccEEeehhhhhhhhhhcCceEeeeeeEEeccE----EeecCChHHHHHHH
Confidence            45667788888763    55666554332  7899999999999999999999999998753    23333444566667


Q ss_pred             hcccCceEEE
Q 026827          155 RQRVGPLLMK  164 (232)
Q Consensus       155 r~RsGpv~Lk  164 (232)
                      |.--.-|+|.
T Consensus       126 RNAGdeVtlT  135 (505)
T KOG3549|consen  126 RNAGDEVTLT  135 (505)
T ss_pred             HhcCCEEEEE
Confidence            7655555664


No 61 
>smart00652 eIF1a eukaryotic translation initiation factor 1A.
Probab=48.48  E-value=55  Score=25.09  Aligned_cols=46  Identities=20%  Similarity=0.121  Sum_probs=32.1

Q ss_pred             cEEEEEecCcce--eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEE
Q 026827           85 EEYEVEIEQPYG--LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLA  132 (232)
Q Consensus        85 eeyeVeL~KPLG--L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~Lva  132 (232)
                      ++....+.+.+|  +.--+..||..++..|...=-  +.=-|+.||.|+-
T Consensus         5 ~q~~g~V~~~lG~~~~~V~~~dG~~~la~ipgK~R--k~iwI~~GD~VlV   52 (83)
T smart00652        5 GQEIAQVVKMLGNGRLEVMCADGKERLARIPGKMR--KKVWIRRGDIVLV   52 (83)
T ss_pred             CcEEEEEEEEcCCCEEEEEECCCCEEEEEEchhhc--ccEEEcCCCEEEE
Confidence            346677777777  333355789888888874433  4556899999987


No 62 
>PRK03760 hypothetical protein; Provisional
Probab=46.78  E-value=39  Score=27.29  Aligned_cols=36  Identities=19%  Similarity=0.264  Sum_probs=24.7

Q ss_pred             cCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEE
Q 026827           92 EQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVL  131 (232)
Q Consensus        92 ~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~Lv  131 (232)
                      -+|.-  +-....+-.||-|+.. |-+++.| |++||+|.
T Consensus        78 ~~P~~--~~~~~~~a~~VLEl~a-G~~~~~g-i~~Gd~v~  113 (117)
T PRK03760         78 LKPWR--IYVPKKPARYIIEGPV-GKIRVLK-VEVGDEIE  113 (117)
T ss_pred             CCCcc--ccCCCccceEEEEeCC-ChHHHcC-CCCCCEEE
Confidence            36653  2333456789999875 4556777 99999995


No 63 
>cd03702 IF2_mtIF2_II This family represents the domain II of bacterial Initiation Factor 2 (IF2) and its eukaryotic mitochondrial homologue mtIF2. IF2, the largest initiation factor is an essential GTP binding protein. In E. coli three natural forms of IF2 exist in the cell, IF2alpha, IF2beta1, and IF2beta2.  Bacterial IF-2 is structurally and functionally related to eukaryotic mitochondrial mtIF-2.
Probab=46.29  E-value=29  Score=27.05  Aligned_cols=44  Identities=23%  Similarity=0.524  Sum_probs=29.8

Q ss_pred             ceeEEeeeCC-C-CeEEEEeCCCCCcccccccccCcEEEEeecccC--Cceeecc
Q 026827           95 YGLKFAKGRD-G-GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFG--TEIWPAA  145 (232)
Q Consensus        95 LGL~Fee~~d-G-gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FG--dElWpA~  145 (232)
                      -|+++|...| | |.+.+-|.      +.|.+++||.|++=++ +|  ..||+..
T Consensus         2 ~g~VlE~~~~~g~G~vatviV------~~GtL~~Gd~iv~G~~-~gkVr~l~d~~   49 (95)
T cd03702           2 EGVVIESKLDKGRGPVATVLV------QNGTLKVGDVLVAGTT-YGKVRAMFDEN   49 (95)
T ss_pred             eEEEEEEEecCCCCccEEEEE------EcCeEeCCCEEEEccc-ccEEEEEECCC
Confidence            3777877633 4 77777777      5677999999998653 45  3344443


No 64 
>COG0361 InfA Translation initiation factor 1 (IF-1) [Translation, ribosomal structure and biogenesis]
Probab=45.38  E-value=42  Score=25.92  Aligned_cols=57  Identities=21%  Similarity=0.232  Sum_probs=36.3

Q ss_pred             cEEEEEecCcce---eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeecc-chhhH
Q 026827           85 EEYEVEIEQPYG---LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAA-EYGRT  150 (232)
Q Consensus        85 eeyeVeL~KPLG---L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~-~~G~t  150 (232)
                      .+.+=++.+.||   +.+. -.||.....-|.-...=.+- .|.+||+|+-       ++||.+ .-|++
T Consensus         7 ~e~~g~V~e~L~~~~f~v~-~edg~~~~ahI~GKmr~~~i-~I~~GD~V~V-------e~~~~d~~kg~I   67 (75)
T COG0361           7 IEMEGTVIEMLPNGRFRVE-LENGHERLAHISGKMRKNRI-RILPGDVVLV-------ELSPYDLTKGRI   67 (75)
T ss_pred             cEEEEEEEEecCCCEEEEE-ecCCcEEEEEccCcchheeE-EeCCCCEEEE-------EecccccccccE
Confidence            446666777777   3333 36777777777644442233 4889999987       788876 44443


No 65 
>PRK04012 translation initiation factor IF-1A; Provisional
Probab=45.04  E-value=66  Score=25.69  Aligned_cols=52  Identities=23%  Similarity=0.183  Sum_probs=34.3

Q ss_pred             cEEEEEecCcce--eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeecc
Q 026827           85 EEYEVEIEQPYG--LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAA  145 (232)
Q Consensus        85 eeyeVeL~KPLG--L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~  145 (232)
                      ++....+.+.+|  +.--+..||..++..|...=  -+.--|.+||.|+.       ++|+.+
T Consensus        21 ~e~~g~V~~~lG~~~~~V~~~dG~~~la~i~GK~--Rk~IwI~~GD~VlV-------e~~~~~   74 (100)
T PRK04012         21 GEVFGVVEQMLGANRVRVRCMDGVERMGRIPGKM--KKRMWIREGDVVIV-------APWDFQ   74 (100)
T ss_pred             CEEEEEEEEEcCCCEEEEEeCCCCEEEEEEchhh--cccEEecCCCEEEE-------EecccC
Confidence            456777777776  33335568888887777332  24446889999887       567764


No 66 
>KOG1320 consensus Serine protease [Posttranslational modification, protein turnover, chaperones]
Probab=43.57  E-value=65  Score=32.29  Aligned_cols=59  Identities=15%  Similarity=0.272  Sum_probs=45.3

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc-CceEEEEeecCCc
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV-GPLLMKMQKRYGK  171 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs-Gpv~LkLeR~~~~  171 (232)
                      +|+|.+|-|++-+...+ ++.||+|+++...      ++.....++.+|+.-+ ++....|.|+..+
T Consensus       399 ~v~is~Vlp~~~~~~~~-~~~g~~V~~vng~------~V~n~~~l~~~i~~~~~~~~v~vl~~~~~e  458 (473)
T KOG1320|consen  399 LVLVSQVLPGSINGGYG-LKPGDQVVKVNGK------PVKNLKHLYELIEECSTEDKVAVLDRRSAE  458 (473)
T ss_pred             EEEEEEeccCCCccccc-ccCCCEEEEECCE------EeechHHHHHHHHhcCcCceEEEEEecCcc
Confidence            69999999999998887 9999999998764      5566777788888433 4456667776554


No 67 
>KOG1738 consensus Membrane-associated guanylate kinase-interacting protein/connector enhancer of KSR-like [Nucleotide transport and metabolism]
Probab=43.43  E-value=24  Score=36.64  Aligned_cols=85  Identities=20%  Similarity=0.241  Sum_probs=57.5

Q ss_pred             ccccEEEEEecCc---ceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhhHHHHhhccc
Q 026827           82 EKYEEYEVEIEQP---YGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRV  158 (232)
Q Consensus        82 ~~~eeyeVeL~KP---LGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~Rs  158 (232)
                      .-.+.++..--||   +|+.+.-.-||-.+|..+.++.-|+....|..||.|+.+-.--+. =|.-   --+...++.-.
T Consensus       199 a~Le~vqls~~kp~eglg~~I~Ssydg~h~~s~~~e~Spad~~~kI~dgdEv~qiN~qtvV-gwql---k~vV~sL~~~~  274 (638)
T KOG1738|consen  199 ASLERVQLSTLSPSEGLGLYIDSSYDGPHVTSKIFEQSPADYRQKILDGDEVLQINEQTVV-GWQL---KVVVSSLRETP  274 (638)
T ss_pred             HHHHHHHhccCCcccCCceEEeeecCCceeccccccCChHHHhhcccCccceeeecccccc-cchh---HhHHhhcccCc
Confidence            3334444444488   899999999999999999999999999999999999987642110 1332   23344555444


Q ss_pred             CceEEEEeecCC
Q 026827          159 GPLLMKMQKRYG  170 (232)
Q Consensus       159 Gpv~LkLeR~~~  170 (232)
                      --+.+.|++++-
T Consensus       275 sgi~l~lkKrp~  286 (638)
T KOG1738|consen  275 AGIELTLKKRPV  286 (638)
T ss_pred             ccceeeeeccCC
Confidence            445555555543


No 68 
>cd04456 S1_IF1A_like S1_IF1A_like: Translation initiation factor IF1A-like, S1-like RNA-binding domain. IF1A is also referred to as eIF1A in eukaryotes and aIF1A in archaea. S1-like RNA-binding domains are found in a wide variety of RNA-associated proteins. IF1A is essential for translation initiation. eIF1A acts synergistically with eIF1 to mediate assembly of ribosomal initiation complexes at the initiation codon and maintain the accuracy of this process by recognizing and destabilizing aberrant preinitiation complexes from the mRNA. Without eIF1A and eIF1, 43S ribosomal preinitiation complexes can bind to the cap-proximal region, but are unable to reach the initiation codon. eIF1a also enhances the formation of 5'-terminal complexes in the presence of other translation initiation factors. This protein family is only found in eukaryotes and archaea.
Probab=42.94  E-value=36  Score=25.88  Aligned_cols=46  Identities=15%  Similarity=0.134  Sum_probs=28.8

Q ss_pred             EecCcce--eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeec
Q 026827           90 EIEQPYG--LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPA  144 (232)
Q Consensus        90 eL~KPLG--L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA  144 (232)
                      .+.+++|  +.--+..||..+...|...  .-+.=-|+.||.|+.       ++||.
T Consensus         5 ~V~~~lG~~~~~V~~~dg~~~l~~i~gK--~Rk~iwI~~GD~VlV-------~~~~~   52 (78)
T cd04456           5 RVLRMLGNNRHEVECADGQRRLVSIPGK--LRKNIWIKRGDFLIV-------DPIEE   52 (78)
T ss_pred             EEEEECCCCEEEEEECCCCEEEEEEchh--hccCEEEcCCCEEEE-------Eeccc
Confidence            3444554  3333446888888888743  224446899999987       56665


No 69 
>PRK14533 groES co-chaperonin GroES; Provisional
Probab=40.37  E-value=48  Score=25.99  Aligned_cols=27  Identities=22%  Similarity=0.265  Sum_probs=16.7

Q ss_pred             eEEEEeCCCCCcccccccccCcEEEEee
Q 026827          107 TYIDAIAPGGSADKTGMFQVGDKVLATS  134 (232)
Q Consensus       107 vyV~eV~pGGNAaKaG~I~VGD~LvatS  134 (232)
                      ..|.+|.+|.. .....+++||+|++-.
T Consensus        38 G~VvavG~g~~-~~~~~Vk~GD~Vl~~~   64 (91)
T PRK14533         38 AEVVAVGKLDD-EEDFDIKVGDKVIFSK   64 (91)
T ss_pred             EEEEEECCCCc-cccccccCCCEEEEcc
Confidence            34555665433 2234599999999743


No 70 
>cd05793 S1_IF1A S1_IF1A: Translation initiation factor IF1A, also referred to as eIF1A in eukaryotes and aIF1A in archaea, S1-like RNA-binding domain. S1-like RNA-binding domains are found in a wide variety of RNA-associated proteins. IF1A is essential for translation initiation. eIF1A acts synergistically with eIF1 to mediate assembly of ribosomal initiation complexes at the initiation codon and maintain the accuracy of this process by recognizing and destabilizing aberrant preinitiation complexes from the mRNA. Without eIF1A and eIF1, 43S ribosomal preinitiation complexes can bind to the cap-proximal region, but are unable to reach the initiation codon. eIF1a also enhances the formation of 5'-terminal complexes in the presence of other translation initiation factors. This protein family is only found in eukaryotes and archaea.
Probab=40.03  E-value=81  Score=23.86  Aligned_cols=36  Identities=25%  Similarity=0.239  Sum_probs=24.3

Q ss_pred             eeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccCCceeecc
Q 026827          101 KGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAA  145 (232)
Q Consensus       101 e~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~  145 (232)
                      +..||..++..|...=.  +.--|.+||.|+-       ++||.+
T Consensus        18 ~~~~g~~~la~i~gK~r--k~iwI~~GD~V~V-------e~~~~d   53 (77)
T cd05793          18 RCFDGKKRLCRIRGKMR--KRVWINEGDIVLV-------APWDFQ   53 (77)
T ss_pred             EECCCCEEEEEEchhhc--ccEEEcCCCEEEE-------Eecccc
Confidence            44678787777774433  4446889999887       467664


No 71 
>PTZ00414 10 kDa heat shock protein; Provisional
Probab=38.60  E-value=49  Score=26.63  Aligned_cols=24  Identities=33%  Similarity=0.327  Sum_probs=14.6

Q ss_pred             EEEEeCCCCCcccccccccCcEEEE
Q 026827          108 YIDAIAPGGSADKTGMFQVGDKVLA  132 (232)
Q Consensus       108 yV~eV~pGGNAaKaG~I~VGD~Lva  132 (232)
                      -|.+|.+|.... ...|++||+|++
T Consensus        48 ~VvAVG~G~~~~-~~~Vk~GD~Vl~   71 (100)
T PTZ00414         48 TVVAVAAATKDW-TPTVKVGDTVLL   71 (100)
T ss_pred             EEEEECCCCccc-cceecCCCEEEE
Confidence            344555553221 335999999997


No 72 
>PF01176 eIF-1a:  Translation initiation factor 1A / IF-1;  InterPro: IPR006196  The S1 domain of around 70 amino acids, originally identified in ribosomal protein S1, is found in a large number of RNA-associated proteins. It has been shown that S1 proteins bind RNA through their S1 domains with some degree of sequence specificity. This type of S1 domain is found in translation initiation factor 1.  The solution structure of one S1 RNA-binding domain from Escherichia coli polynucleotide phosphorylase has been determined []. It displays some similarity with the cold shock domain (CSD) (IPR002059 from INTERPRO). Both the S1 and the CSD domain consist of an antiparallel beta barrel of the same topology with 5 beta strands. This fold is also shared by many other proteins of unrelated function and is known as the OB fold. However, the S1 and CSD fold can be distinguished from the other OB folds by the presence of a short 3(10) helix at the end of strand 3. This unique feature is likely to form a part of the DNA/RNA-binding site.  This entry is specific for bacterial, chloroplastic and eukaryotic IF-1 type S1 domains.; GO: 0003723 RNA binding, 0003743 translation initiation factor activity, 0006413 translational initiation; PDB: 1JT8_A 3I4O_A 1AH9_A 1ZO1_W 1D7Q_A 2OQK_A 2DGY_A 1HR0_W.
Probab=37.09  E-value=55  Score=23.56  Aligned_cols=45  Identities=24%  Similarity=0.189  Sum_probs=27.4

Q ss_pred             EEEEEecCcce--eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEE
Q 026827           86 EYEVEIEQPYG--LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLA  132 (232)
Q Consensus        86 eyeVeL~KPLG--L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~Lva  132 (232)
                      +....+.+++|  +.--+..||..++..|...  --+.=-|+.||.|+-
T Consensus         4 e~~~~V~~~lG~~~~~V~~~dg~~~l~~i~gK--~r~~iwI~~GD~V~V   50 (65)
T PF01176_consen    4 EVIGRVTEMLGNNLFEVECEDGEERLARIPGK--FRKRIWIKRGDFVLV   50 (65)
T ss_dssp             EEEEEEEEEESSSEEEEEETTSEEEEEEE-HH--HHTCC---TTEEEEE
T ss_pred             EEEEEEEEECCCCEEEEEeCCCCEEEEEeccc--eeeeEecCCCCEEEE
Confidence            45566667777  3333457888888888744  444446899999876


No 73 
>PRK00364 groES co-chaperonin GroES; Reviewed
Probab=37.00  E-value=54  Score=25.51  Aligned_cols=11  Identities=55%  Similarity=0.622  Sum_probs=9.2

Q ss_pred             ccccCcEEEEe
Q 026827          123 MFQVGDKVLAT  133 (232)
Q Consensus       123 ~I~VGD~Lvat  133 (232)
                      .|++||+|++-
T Consensus        58 ~vk~GD~Vlf~   68 (95)
T PRK00364         58 DVKVGDKVLFG   68 (95)
T ss_pred             ccCCCCEEEEc
Confidence            58999999974


No 74 
>cd03703 aeIF5B_II aeIF5B_II: This family represents the domain II of archeal and eukaryotic aeIF5B. aeIF5B is a homologue of prokaryotic Initiation Factor 2 (IF2).  Disruption of the eIF5B gene (FUN12) in yeast causes a severe slow-growth phenotype, associated with a defect in translation. eIF5B has a function analogous to prokaryotic IF2 in mediating the joining of joining of 60S subunits.  The eIF5B consists of three N-terminal domains  (I, II, II) connected by a long helix to domain IV. Domain I is a G domain, domain II and IV are beta-barrels and domain III has a novel alpha-beta-alpha sandwich fold. The G domain and the beta-barrel domain II display a similar structure and arrangement to the homologous domains of EF1A, eEF1A and aeIF2gamma.
Probab=33.91  E-value=63  Score=26.36  Aligned_cols=33  Identities=30%  Similarity=0.537  Sum_probs=24.0

Q ss_pred             eeEEeee-CCC-CeEEEEeCCCCCcccccccccCcEEEEee
Q 026827           96 GLKFAKG-RDG-GTYIDAIAPGGSADKTGMFQVGDKVLATS  134 (232)
Q Consensus        96 GL~Fee~-~dG-gvyV~eV~pGGNAaKaG~I~VGD~LvatS  134 (232)
                      |.++|-. ..| |..++-|.      ..|.+++||+|+..+
T Consensus         3 gtVlEvk~~~G~G~t~dvIl------~~GtL~~GD~Iv~g~   37 (110)
T cd03703           3 GTVLEVKEEEGLGTTIDVIL------YDGTLREGDTIVVCG   37 (110)
T ss_pred             EEEEEEEEcCCCceEEEEEE------ECCeEecCCEEEEcc
Confidence            5566654 334 77778887      455699999999877


No 75 
>PF02643 DUF192:  Uncharacterized ACR, COG1430;  InterPro: IPR003795 This entry describes proteins of unknown function.; PDB: 3M7A_B 3PJY_B.
Probab=32.80  E-value=25  Score=27.52  Aligned_cols=27  Identities=30%  Similarity=0.507  Sum_probs=17.2

Q ss_pred             CCCCeEEEEeCCCCCcccccccccCcEEE
Q 026827          103 RDGGTYIDAIAPGGSADKTGMFQVGDKVL  131 (232)
Q Consensus       103 ~dGgvyV~eV~pGGNAaKaG~I~VGD~Lv  131 (232)
                      ..+.-||-|+.+| .+++-| |++||+|.
T Consensus        79 ~~~a~~vLE~~aG-~~~~~~-i~~Gd~v~  105 (108)
T PF02643_consen   79 YKPARYVLELPAG-WFEKLG-IKVGDRVR  105 (108)
T ss_dssp             CCEECEEEEEETT-HHHHHT---TT-EEE
T ss_pred             CCccCEEEEcCCC-chhhcC-CCCCCEEE
Confidence            3456788888765 456677 99999986


No 76 
>cd00320 cpn10 Chaperonin 10 Kd subunit (cpn10 or GroES); Cpn10 cooperates with chaperonin 60 (cpn60 or GroEL), an ATPase, to assist the folding and assembly of proteins and is found in eubacterial cytosol, as well as in the matrix of mitochondria and chloroplasts. It forms heptameric rings with a dome-like structure, forming a lid to the large cavity of the tetradecameric cpn60 cylinder and thereby tightly regulating release and binding of proteins to the cpn60 surface.
Probab=32.45  E-value=81  Score=24.40  Aligned_cols=29  Identities=31%  Similarity=0.369  Sum_probs=16.4

Q ss_pred             CeEEEEeCCCCCc----ccccccccCcEEEEee
Q 026827          106 GTYIDAIAPGGSA----DKTGMFQVGDKVLATS  134 (232)
Q Consensus       106 gvyV~eV~pGGNA----aKaG~I~VGD~LvatS  134 (232)
                      ...|.+|.||--.    .....+++||+|++--
T Consensus        36 ~g~VvAVG~g~~~~~g~~~~~~vk~GD~Vl~~~   68 (93)
T cd00320          36 EGKVVAVGPGRRNENGERVPLSVKVGDKVLFPK   68 (93)
T ss_pred             EEEEEEECCCeECCCCCCccccccCCCEEEECC
Confidence            3445556655211    1123599999999744


No 77 
>TIGR00739 yajC preprotein translocase, YajC subunit. While this protein is part of the preprotein translocase in Escherichia coli, it is not essential for viability or protein secretion. The N-terminus region contains a predicted membrane-spanning region followed by a region consisting almost entirely of residues with charged (acidic, basic, or zwitterionic) side chains. This small protein is about 100 residues in length, and is restricted to bacteria; however, this protein is absent from some lineages, including spirochetes and Mycoplasmas.
Probab=32.42  E-value=31  Score=26.45  Aligned_cols=41  Identities=24%  Similarity=0.263  Sum_probs=25.5

Q ss_pred             ccccCcEEEEeecccCCceeeccchhhHHHHhhcccCceEEEEeec
Q 026827          123 MFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQRVGPLLMKMQKR  168 (232)
Q Consensus       123 ~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~RsGpv~LkLeR~  168 (232)
                      .+++||.|+-+|..+|.-+.-.+++    --+.. +..+.+++.|.
T Consensus        37 ~L~~Gd~VvT~gGi~G~V~~i~d~~----v~vei-~~g~~i~~~r~   77 (84)
T TIGR00739        37 SLKKGDKVLTIGGIIGTVTKIAENT----IVIEL-NDNTEITFSKN   77 (84)
T ss_pred             hCCCCCEEEECCCeEEEEEEEeCCE----EEEEE-CCCeEEEEEhH
Confidence            4899999999999999533332222    12222 23367777763


No 78 
>COG1430 Uncharacterized conserved protein [Function unknown]
Probab=31.48  E-value=69  Score=26.71  Aligned_cols=40  Identities=25%  Similarity=0.358  Sum_probs=24.4

Q ss_pred             CcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEee
Q 026827           93 QPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATS  134 (232)
Q Consensus        93 KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatS  134 (232)
                      +|....--....+.-||-|+..| -+++.+ |+|||+|....
T Consensus        82 ~P~~~~~~~~~~~~~yvLEl~~G-~~~~~~-i~vGd~v~~~~  121 (126)
T COG1430          82 VPWSTYPCKSYGPVRYVLELPAG-WAARLG-IKVGDRVEFRP  121 (126)
T ss_pred             cccccCCCCCCCCccEEEEecCC-chhhcC-CccCCEEEecc
Confidence            44443333333333688888754 445566 99999997643


No 79 
>PF03829 PTSIIA_gutA:  PTS system glucitol/sorbitol-specific IIA component;  InterPro: IPR004716 The phosphoenolpyruvate-dependent sugar phosphotransferase system (PTS) [, ] is a major carbohydrate transport system in bacteria. The PTS catalyses the phosphorylation of incoming sugar substrates and coupled with translocation across the cell membrane, makes the PTS a link between the uptake and metabolism of sugars. The general mechanism of the PTS is the following: a phosphoryl group from phosphoenolpyruvate (PEP) is transferred via a signal transduction pathway, to enzyme I (EI) which in turn transfers it to a phosphoryl carrier, the histidine protein (HPr). Phospho-HPr then transfers the phosphoryl group to a sugar-specific permease, a membrane-bound complex known as enzyme 2 (EII), which transports the sugar to the cell. EII consists of at least three structurally distinct domains IIA, IIB and IIC []. These can either be fused together in a single polypeptide chain or exist as two or three interactive chains, formerly called enzymes II (EII) and III (EIII).  The first domain (IIA or EIIA) carries the first permease-specific phosphorylation site, a histidine which is phosphorylated by phospho-HPr. The second domain (IIB or EIIB) is phosphorylated by phospho-IIA on a cysteinyl or histidyl residue, depending on the sugar transported. Finally, the phosphoryl group is transferred from the IIB domain to the sugar substrate concomitantly with the sugar uptake processed by the IIC domain. This third domain (IIC or EIIC) forms the translocation channel and the specific substrate-binding site.  An additional transmembrane domain IID, homologous to IIC, can be found in some PTSs, e.g. for mannose [, , , ].  The Man family is unique in several respects among PTS permease families:   It is the only PTS family in which members possess a IID protein.  It is the only PTS family in which the IIB constituent is phosphorylated on a histidyl rather than a cysteyl residue.  Its permease members exhibit broad specificity for a range of sugars, rather than being specific for just one or a few sugars.   This family consists only of glucitol-specific transporters, and occur both in Gram-negative and Gram-positive bacteria. The system in Escherichia coli consists of a IIA protein, and a IIBC protein. This family is specific for the IIA component.; GO: 0008982 protein-N(PI)-phosphohistidine-sugar phosphotransferase activity, 0009401 phosphoenolpyruvate-dependent sugar phosphotransferase system, 0005737 cytoplasm; PDB: 2F9H_A.
Probab=28.36  E-value=98  Score=25.26  Aligned_cols=51  Identities=16%  Similarity=0.352  Sum_probs=31.0

Q ss_pred             CeEEEEeCCCCCcccccccccCcEEEEeecccCCceeeccchhh-HHHHhhcccCceEEEEee
Q 026827          106 GTYIDAIAPGGSADKTGMFQVGDKVLATSAVFGTEIWPAAEYGR-TMYTIRQRVGPLLMKMQK  167 (232)
Q Consensus       106 gvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FGdElWpA~~~G~-t~~AIr~RsGpv~LkLeR  167 (232)
                      ..|++.+.     .-.+.|++||+|.     +|+.-|.+..+|. +...++. .|-++|+|.-
T Consensus        39 ~~vih~~~-----~~~~~i~~Gd~l~-----i~~~~y~ItaVG~~an~NL~~-LGH~Tl~F~g   90 (117)
T PF03829_consen   39 YCVIHTFN-----ELKGDIKPGDTLI-----IGGQEYTITAVGSVANQNLRE-LGHITLVFDG   90 (117)
T ss_dssp             TCEEEE-T-----GGG----TT-EEE-----ETTEEEEEEEE-TTHHHHHHH-HS-EEEE-S-
T ss_pred             EEEEEecC-----cccCCcCCCCEEE-----ECCeEEEEEEEhHHHHHHHHh-cCcEEEEECC
Confidence            67777776     2455699999997     7889999999995 4445655 7889998865


No 80 
>KOG1421 consensus Predicted signaling-associated protein (contains a PDZ domain) [General function prediction only]
Probab=27.73  E-value=81  Score=33.88  Aligned_cols=32  Identities=31%  Similarity=0.596  Sum_probs=27.7

Q ss_pred             CCCCeEEEEeCCCCCcccccccccCcEEEEeecc
Q 026827          103 RDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAV  136 (232)
Q Consensus       103 ~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~  136 (232)
                      +-|-..|..|.++|-|+|.  ++.||+|+++-..
T Consensus       301 ~tgmLvV~~vL~~gpa~k~--Le~GDillavN~t  332 (955)
T KOG1421|consen  301 RTGMLVVETVLPEGPAEKK--LEPGDILLAVNST  332 (955)
T ss_pred             cceeEEEEEeccCCchhhc--cCCCcEEEEEcce
Confidence            4578899999999999976  7999999998853


No 81 
>PRK05896 DNA polymerase III subunits gamma and tau; Validated
Probab=27.70  E-value=47  Score=34.04  Aligned_cols=88  Identities=17%  Similarity=0.243  Sum_probs=58.6

Q ss_pred             ccccCcEEEEeecccCCceeeccchhh------------HHHHhhcccCceEEEEeecCCccccccccchHH--HHHHhh
Q 026827          123 MFQVGDKVLATSAVFGTEIWPAAEYGR------------TMYTIRQRVGPLLMKMQKRYGKMEQTGELSEKE--IIRAER  188 (232)
Q Consensus       123 ~I~VGD~LvatSA~FGdElWpA~~~G~------------t~~AIr~RsGpv~LkLeR~~~~~~~~~~lteke--~~raer  188 (232)
                      .|+++|+|+++|  ||--+...++.|-            .+..|...-+..+++..           .|.++  ++.+.+
T Consensus       497 ~~~~~~~~~~~~--~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-----------~~~~~~~~~~~~~  563 (605)
T PRK05896        497 IIKQADLVLWVS--PNALILGVEDLGLIELINKVNESFEFIKTIFKKFNKNKLVIA-----------ISKKQATKITNIK  563 (605)
T ss_pred             HHHhhceEEEec--CCeEEEeehhhHHHHHHHHHHhhhHHHHHHHHHhccceEEee-----------eeHHhhhhhhhHh
Confidence            689999999999  7765555555552            12223333344444432           23344  577889


Q ss_pred             cCccccchhHHHHHHHHHHHHHHHHHHHHHHHHhh
Q 026827          189 NSGVISNRVREIQMQNYMKKKEQKERREQDLLRVF  223 (232)
Q Consensus       189 ~~G~i~~~~reiq~~ny~~k~e~~~qr~~~~~~~~  223 (232)
                      +-++.-.-++-.|+.+-...--+|.||.+..+.-|
T Consensus       564 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  598 (605)
T PRK05896        564 NQKLKTNIINDVDIDDLKMLIKKEKTRKQEVDALL  598 (605)
T ss_pred             hhcccchhhhHhhHHHHHHHHhhhhHHHHHHHHHH
Confidence            99999999999999998777777778855554443


No 82 
>PRK06531 yajC preprotein translocase subunit YajC; Validated
Probab=25.68  E-value=50  Score=27.06  Aligned_cols=41  Identities=22%  Similarity=0.323  Sum_probs=25.3

Q ss_pred             ccccCcEEEEeecccCCceeeccc-hhhHHHHhhcccCceEEEEeec
Q 026827          123 MFQVGDKVLATSAVFGTEIWPAAE-YGRTMYTIRQRVGPLLMKMQKR  168 (232)
Q Consensus       123 ~I~VGD~LvatSA~FGdElWpA~~-~G~t~~AIr~RsGpv~LkLeR~  168 (232)
                      .+++||.|+-++.++|. |-..++ .+    .+......+.+++.|.
T Consensus        36 sLk~GD~VvT~GGi~G~-V~~I~~~~~----~v~le~~gv~i~v~r~   77 (113)
T PRK06531         36 AIQKGDEVVTIGGLYGT-VDEVDTEAK----TIVLDVDGVYLTFELA   77 (113)
T ss_pred             hcCCCCEEEECCCcEEE-EEEEecCCC----EEEEEECCEEEEEEhh
Confidence            48999999999999995 333322 11    1222223477777764


No 83 
>CHL00113 rps4 ribosomal protein S4; Reviewed
Probab=25.43  E-value=38  Score=29.95  Aligned_cols=31  Identities=23%  Similarity=0.290  Sum_probs=23.9

Q ss_pred             cccccchHHHHHHhhcCccccchhHHHHHHHHHHHHHH
Q 026827          174 QTGELSEKEIIRAERNSGVISNRVREIQMQNYMKKKEQ  211 (232)
Q Consensus       174 ~~~~lteke~~raer~~G~i~~~~reiq~~ny~~k~e~  211 (232)
                      ++-.|-|||++|.-      | |+.|-|++||.++...
T Consensus        44 y~~~L~eKqk~~~~------Y-g~~ekq~~~~~~~a~~   74 (201)
T CHL00113         44 YRIRLEEKQKLRFN------Y-GLTERQLLKYVRIARK   74 (201)
T ss_pred             HHHHHHHHHHHHHH------c-CCCHHHHHHHHHHHHh
Confidence            55578899998853      3 4789999999998653


No 84 
>cd05706 S1_Rrp5_repeat_sc10 S1_Rrp5_repeat_sc10: Rrp5 is a trans-acting factor important for biogenesis of both the 40S and 60S eukaryotic ribosomal subunits. Rrp5 has two distinct regions, an N-terminal region containing tandemly repeated S1 RNA-binding domains (12 S1 repeats in Saccharomyces cerevisiae Rrp5 and 14 S1 repeats in Homo sapiens Rrp5) and a C-terminal region containing tetratricopeptide repeat (TPR) motifs thought to be involved in protein-protein interactions. Mutational studies have shown that each region represents a specific functional domain. Deletions within the S1-containing region inhibit pre-rRNA processing at either site A3 or A2, whereas deletions within the TPR region confer an inability to support cleavage of A0-A2. This CD includes S. cerevisiae S1 repeat 10 (sc10). Rrp5 is found in eukaryotes but not in prokaryotes or archaea.
Probab=24.99  E-value=50  Score=22.92  Aligned_cols=42  Identities=17%  Similarity=0.032  Sum_probs=25.6

Q ss_pred             CcceeEEee--eCCCCeEEEEeCCCCCcccccccccCcEEEEee
Q 026827           93 QPYGLKFAK--GRDGGTYIDAIAPGGSADKTGMFQVGDKVLATS  134 (232)
Q Consensus        93 KPLGL~Fee--~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatS  134 (232)
                      .+-|+.++-  +.+|-+-+..+...........+++||.|.+.=
T Consensus        15 ~~~gi~v~l~~~~~g~v~~s~l~~~~~~~~~~~~~~Gd~v~~~V   58 (73)
T cd05706          15 NDRYVLVQLGNKVTGPSFITDALDDYSEALPYKFKKNDIVRACV   58 (73)
T ss_pred             eCCeEEEEeCCCcEEEEEhhhccCccccccccccCCCCEEEEEE
Confidence            345555543  244566666666554443345689999998843


No 85 
>TIGR02604 Piru_Ver_Nterm putative membrane-bound dehydrogenase domain. All proteins that score above the trusted cutoff score of 45 to this model are large proteins of either Pirellula sp. 1 or Verrucomicrobium spinosum. These proteins all contain, in addition to this domain, several hundred residues of highly variable sequence, and then a well-conserved C-terminal domain (TIGR02603) that features a putative cytochrome c-type heme binding motif CXXCH. The membrane-bound L-sorbosone dehydrogenase from Acetobacter liquefaciens (Gluconacetobacter liquefaciens) is homologous to this domain but lacks additional sequence regions shared by members of this family and belongs to a different clade of the larger family of homologs. It and its closely related homologs are excluded from the this model by scoring between the trusted (45) and noise (18) cutoffs.
Probab=24.77  E-value=1.4e+02  Score=27.37  Aligned_cols=45  Identities=16%  Similarity=0.257  Sum_probs=25.8

Q ss_pred             ecCcceeEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEEeecccC
Q 026827           91 IEQPYGLKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLATSAVFG  138 (232)
Q Consensus        91 L~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatSA~FG  138 (232)
                      |.+|.+|.|.+  +|.+||.+-..-..... ..-+.||+|+.....-|
T Consensus        13 ~~~P~~ia~d~--~G~l~V~e~~~y~~~~~-~~~~~~~rI~~l~d~dg   57 (367)
T TIGR02604        13 LRNPIAVCFDE--RGRLWVAEGITYSRPAG-RQGPLGDRILILEDADG   57 (367)
T ss_pred             cCCCceeeECC--CCCEEEEeCCcCCCCCC-CCCCCCCEEEEEEcCCC
Confidence            67888888854  78888887643322211 11344566666554433


No 86 
>cd05696 S1_Rrp5_repeat_hs4 S1_Rrp5_repeat_hs4: Rrp5 is a trans-acting factor important for biogenesis of both the 40S and 60S eukaryotic ribosomal subunits. Rrp5 has two distinct regions, an N-terminal region containing tandemly repeated S1 RNA-binding domains (12 S1 repeats in Saccharomyces cerevisiae Rrp5 and 14 S1 repeats in Homo sapiens Rrp5) and a C-terminal region containing tetratricopeptide repeat (TPR) motifs thought to be involved in protein-protein interactions. Mutational studies have shown that each region represents a specific functional domain. Deletions within the S1-containing region inhibit pre-rRNA processing at either site A3 or A2, whereas deletions within the TPR region confer an inability to support cleavage of A0-A2. This CD includes H. sapiens S1 repeat 4 (hs4). Rrp5 is found in eukaryotes but not in prokaryotes or archaea.
Probab=24.56  E-value=48  Score=23.61  Aligned_cols=43  Identities=23%  Similarity=0.269  Sum_probs=24.8

Q ss_pred             ecCcceeEEeeeC--CCCeEEEEeCCCCCcccccccccCcEEEEe
Q 026827           91 IEQPYGLKFAKGR--DGGTYIDAIAPGGSADKTGMFQVGDKVLAT  133 (232)
Q Consensus        91 L~KPLGL~Fee~~--dGgvyV~eV~pGGNAaKaG~I~VGD~Lvat  133 (232)
                      +.++.|+.++-..  +|-+-+.++...-.......+++||.|.+-
T Consensus        12 v~~~~G~~V~l~~gv~G~i~~s~l~~~~~~~~~~~~~vG~~v~~k   56 (71)
T cd05696          12 VEPDLGAVFELKDGLLGFVHISHLSDDKVPSDTGPFKAGTTHKAR   56 (71)
T ss_pred             EccCceEEEEeCCCCEEEEEHHHCCcchhcCcccccCCCCEEEEE
Confidence            3467887777643  333333444433222234569999999873


No 87 
>TIGR03095 rusti_cyanin rusticyanin. Rusticyanin is a blue copper protein, described in an obligate acidophilic chemolithoautroph, Acidithiobacillus ferrooxidans, as an electron transfer protein. It can constitute up to 5 percent of protein in cells grown on Fe(II) and is thought to be part of an electron chain for Fe(II) oxidation, with two c-type cytochromes, an aa3-type cytochrome oxidase, and 02 as terminal electron acceptor. It is rather closely related to sulfocyanin (TIGR03094).
Probab=24.06  E-value=1.1e+02  Score=25.58  Aligned_cols=43  Identities=19%  Similarity=0.107  Sum_probs=30.9

Q ss_pred             ecCcceeEEeee-----CCC---CeEEEEeCCCCCcccccc---------cccCcEEEEe
Q 026827           91 IEQPYGLKFAKG-----RDG---GTYIDAIAPGGSADKTGM---------FQVGDKVLAT  133 (232)
Q Consensus        91 L~KPLGL~Fee~-----~dG---gvyV~eV~pGGNAaKaG~---------I~VGD~Lvat  133 (232)
                      +.|+-|++++.+     +||   .||...+.|+-+-..=..         ++.||.|.-+
T Consensus         6 ~~~~~~~~~~~~~~~v~~~g~~v~v~~~~~~~~~~~~~f~~~~~~~P~I~v~~Gd~V~v~   65 (148)
T TIGR03095         6 NETDPGVQVSVSGSTIYYNNSTTLVVAAGPMPGPSMYSFEIHDLKNPTIVIPEGVTVHFT   65 (148)
T ss_pred             cccCCCcEEecCCCEEEEcCCEEEEEEEEcCCCCCceeEEecCCCCCEEEEcCCCEEEEE
Confidence            457778888763     456   678888998888754442         5899998773


No 88 
>PF07197 DUF1409:  Protein of unknown function (DUF1409);  InterPro: IPR010811 This represents a short conserved region (approximately 50 residues long), sometimes repeated, within a number of hypothetical Oryza sativa proteins of unknown function.
Probab=23.48  E-value=38  Score=24.60  Aligned_cols=17  Identities=41%  Similarity=0.507  Sum_probs=14.8

Q ss_pred             hcCccccchhHHHHHHH
Q 026827          188 RNSGVISNRVREIQMQN  204 (232)
Q Consensus       188 r~~G~i~~~~reiq~~n  204 (232)
                      -|||-|.+++.|||.+=
T Consensus        12 ~~cg~IrarleE~qa~i   28 (51)
T PF07197_consen   12 VDCGSIRARLEEIQAQI   28 (51)
T ss_pred             hccchHHHHHHHHHHHh
Confidence            49999999999999653


No 89 
>TIGR00523 eIF-1A eukaryotic/archaeal initiation factor 1A. Recommended nomenclature: eIF-1A for eukaryotes, aIF-1A for Archaea. Also called eIF-4C
Probab=23.30  E-value=2.2e+02  Score=22.68  Aligned_cols=46  Identities=28%  Similarity=0.179  Sum_probs=30.4

Q ss_pred             cEEEEEecCcce--eEEeeeCCCCeEEEEeCCCCCcccccccccCcEEEE
Q 026827           85 EEYEVEIEQPYG--LKFAKGRDGGTYIDAIAPGGSADKTGMFQVGDKVLA  132 (232)
Q Consensus        85 eeyeVeL~KPLG--L~Fee~~dGgvyV~eV~pGGNAaKaG~I~VGD~Lva  132 (232)
                      ++....+.+.+|  +.--+..||..++..|...=-  +.--|..||.|+-
T Consensus        19 ~e~~g~V~~~lG~~~~~V~~~dG~~~la~i~GK~R--k~iwI~~GD~VlV   66 (99)
T TIGR00523        19 GEILGVIEQMLGAGRVKVRCLDGKTRLGRIPGKLK--KRIWIREGDVVIV   66 (99)
T ss_pred             CEEEEEEEEEcCCCEEEEEeCCCCEEEEEEchhhc--ccEEecCCCEEEE
Confidence            557777777777  333345688888877774322  4445888998886


No 90 
>cd05704 S1_Rrp5_repeat_hs13 S1_Rrp5_repeat_hs13: Rrp5 is a trans-acting factor important for biogenesis of both the 40S and 60S eukaryotic ribosomal subunits.  Rrp5 has two distinct regions, an N-terminal region containing tandemly repeated S1 RNA-binding domains (12 S1 repeats in Saccharomyces cerevisiae Rrp5 and 14 S1 repeats in Homo sapiens Rrp5) and a C-terminal region containing tetratricopeptide repeat (TPR) motifs thought to be involved in protein-protein interactions.  Mutational studies have shown that each region represents a specific functional domain. Deletions within the S1-containing region inhibit pre-rRNA processing at either site A3 or A2, whereas deletions within the TPR region confer an inability to support cleavage of A0-A2. This CD includes H. sapiens S1 repeat 13 (hs13). Rrp5 is found in eukaryotes but not in prokaryotes or archaea.
Probab=22.17  E-value=40  Score=24.12  Aligned_cols=46  Identities=17%  Similarity=0.172  Sum_probs=29.7

Q ss_pred             EEecCcceeEEee--eCCCCeEEEEeCCCCCcccccccccCcEEEEee
Q 026827           89 VEIEQPYGLKFAK--GRDGGTYIDAIAPGGSADKTGMFQVGDKVLATS  134 (232)
Q Consensus        89 VeL~KPLGL~Fee--~~dGgvyV~eV~pGGNAaKaG~I~VGD~LvatS  134 (232)
                      +.+..+.|+..+-  +.+|-+.+.++..+-...-...+++||.|.+.-
T Consensus        12 ~~i~~~~g~~v~l~~~~~Glvhis~~s~~~~~~~~~~~~~Gd~v~~kV   59 (72)
T cd05704          12 TKVIPHSGLTVQLPFGKTGLVSIFHLSDSYTENPLEGFKPGKIVRCCI   59 (72)
T ss_pred             EEeeCCcEEEEECCCCCEEEEEHHHhcCcccCCHHHhCCCCCEEEEEE
Confidence            3444457866654  355677777776665444345689999998843


No 91 
>COG4043 Preprotein translocase subunit Sec61beta [Intracellular    trafficking, secretion, and vesicular transport]
Probab=21.64  E-value=83  Score=26.17  Aligned_cols=37  Identities=19%  Similarity=0.258  Sum_probs=24.9

Q ss_pred             ccccccccCcEEEEeecccCCceeeccchhhHHHHhh
Q 026827          119 DKTGMFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIR  155 (232)
Q Consensus       119 aKaG~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr  155 (232)
                      +|...|++||+|+......-.++-..+.|..-..+++
T Consensus        29 ~krr~ik~GD~IiF~~~~l~v~V~~vr~Y~tF~~mlr   65 (111)
T COG4043          29 PKRRQIKPGDKIIFNGDKLKVEVIDVRVYDTFEEMLR   65 (111)
T ss_pred             HhhcCCCCCCEEEEcCCeeEEEEEEEeehhHHHHHHH
Confidence            4555699999999876555556666666664444554


No 92 
>COG4810 EutS Ethanolamine utilization protein [Amino acid transport and metabolism]
Probab=21.39  E-value=97  Score=25.94  Aligned_cols=64  Identities=22%  Similarity=0.290  Sum_probs=49.4

Q ss_pred             ecCcceeEEeeeCCCCeEEEEeCCCCCccccc--ccccCcEEEEeecccCCceeeccchhhHHHHhhcc
Q 026827           91 IEQPYGLKFAKGRDGGTYIDAIAPGGSADKTG--MFQVGDKVLATSAVFGTEIWPAAEYGRTMYTIRQR  157 (232)
Q Consensus        91 L~KPLGL~Fee~~dGgvyV~eV~pGGNAaKaG--~I~VGD~LvatSA~FGdElWpA~~~G~t~~AIr~R  157 (232)
                      +-|.||+.   ..-|-+-|--|.|+-.|--++  .++.||+=++.=..|...+.=.-++|-|.+++++-
T Consensus        38 l~~KlGl~---~~~~AIGIlTiTP~EaaiIa~DiA~Ksg~v~iGFlDRFsGalvltGdv~aVE~aLkqv  103 (121)
T COG4810          38 LAKKLGLD---PDAGAIGILTITPGEAAIIAGDIATKSGDVHIGFLDRFSGALVLTGDVGAVEEALKQV  103 (121)
T ss_pred             HHHHhCCC---CCCCceEEEEecCchhhhhhhhhhcccCceEEeeeecccceEEEEcchHHHHHHHHHH
Confidence            34567764   235678888999998877666  56889998888777888888888899888888863


Done!