Query         032308
Match_columns 143
No_of_seqs    125 out of 936
Neff          6.3 
Searched_HMMs 46136
Date          Fri Mar 29 12:23:13 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/032308.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/032308hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PLN03024 Putative EG45-like do 100.0 3.3E-35 7.2E-40  215.5  12.8  119   12-142     5-125 (125)
  2 PLN00193 expansin-A; Provision 100.0 2.3E-31 5.1E-36  215.1  14.7  119   24-143    26-156 (256)
  3 PLN00050 expansin A; Provision 100.0   1E-30 2.2E-35  210.6  11.7  114   26-143    23-148 (247)
  4 PLN03023 Expansin-like B1; Pro 100.0   3E-30 6.4E-35  207.8  12.8  107   24-143    21-139 (247)
  5 smart00837 DPBB_1 Rare lipopro  99.9 1.8E-26   4E-31  159.7   7.3   80   59-140     1-87  (87)
  6 PF03330 DPBB_1:  Rare lipoprot  99.9 1.1E-22 2.4E-27  137.1   6.2   76   59-140     1-78  (78)
  7 COG4305 Endoglucanase C-termin  99.4 8.4E-13 1.8E-17  101.9   8.3   95   29-143    31-130 (232)
  8 TIGR00413 rlpA rare lipoprotei  99.2 8.8E-11 1.9E-15   92.6  10.9   90   31-143     1-91  (208)
  9 COG0797 RlpA Lipoproteins [Cel  99.2 9.3E-11   2E-15   93.8  10.6   96   25-143    79-175 (233)
 10 PF00967 Barwin:  Barwin family  99.2 4.7E-11   1E-15   86.0   5.0   59   68-143    55-117 (119)
 11 PRK10672 rare lipoprotein A; P  99.0 5.3E-09 1.2E-13   88.5  11.7   90   30-142    80-170 (361)
 12 PF07249 Cerato-platanin:  Cera  98.7 1.1E-07 2.3E-12   69.4   8.8   71   52-143    38-112 (119)
 13 PF02015 Glyco_hydro_45:  Glyco  96.0   0.013 2.9E-07   46.3   5.0   54   59-123    70-123 (201)
 14 PRK15262 putative fimbrial pro  80.0     2.4 5.1E-05   33.1   3.5   39    6-45      3-41  (197)
 15 PF15240 Pro-rich:  Proline-ric  72.3     2.5 5.3E-05   33.0   1.7   27   10-37      1-27  (179)
 16 PF10717 ODV-E18:  Occlusion-de  55.0      20 0.00044   24.6   3.4   27    6-32     28-54  (85)
 17 PRK13159 cytochrome c-type bio  51.9      14  0.0003   28.2   2.5   37    2-38      3-39  (155)
 18 PRK13150 cytochrome c-type bio  48.3      14  0.0003   28.3   2.0   36    2-37      3-38  (159)
 19 PRK11657 dsbG disulfide isomer  45.3      38 0.00082   27.2   4.2   36   93-142   117-154 (251)
 20 PF03100 CcmE:  CcmE;  InterPro  43.9     4.6  0.0001   29.5  -1.2   37    1-37      1-37  (131)
 21 PF07584 BatA:  Aerotolerance r  40.2      39 0.00084   22.0   3.0   24    3-26     52-75  (77)
 22 PF10913 DUF2706:  Protein of u  39.4      41 0.00088   21.3   2.8   19    6-24      2-20  (60)
 23 PF13670 PepSY_2:  Peptidase pr  39.3      27 0.00059   23.0   2.2   21   73-100    52-72  (83)
 24 PRK13254 cytochrome c-type bio  37.1      19 0.00041   27.1   1.2   37    2-38      3-39  (148)
 25 PF05324 Sperm_Ag_HE2:  Sperm a  36.0      30 0.00065   23.1   1.9   22    7-28      3-24  (73)
 26 cd03020 DsbA_DsbC_DsbG DsbA fa  32.8 1.1E+02  0.0023   23.2   4.8   15   93-107    77-92  (197)
 27 PF13623 SurA_N_2:  SurA N-term  32.8      34 0.00073   25.5   2.0   19    2-20      1-19  (145)
 28 PTZ00257 Glycoprotein GP63 (le  32.2      42 0.00092   31.0   2.9   38   74-127   507-551 (622)
 29 PF12071 DUF3551:  Protein of u  31.2 1.2E+02  0.0026   20.5   4.3    6   42-47     42-48  (82)
 30 PRK02710 plastocyanin; Provisi  30.9      70  0.0015   22.6   3.3   16    1-16      1-16  (119)
 31 PRK13165 cytochrome c-type bio  29.5      36 0.00078   26.1   1.7   36    2-37      3-38  (160)
 32 PF08664 YcbB:  YcbB domain;  I  28.1      37 0.00079   25.2   1.5   12    1-12     67-78  (134)
 33 PF04202 Mfp-3:  Foot protein 3  27.4      51  0.0011   21.8   1.9    9   33-41     25-33  (71)
 34 PF08194 DIM:  DIM protein;  In  26.9      73  0.0016   18.5   2.3   14   22-35     15-28  (36)
 35 PF04149 DUF397:  Domain of unk  25.9 1.7E+02  0.0037   18.1   5.3   36   74-129    15-51  (56)
 36 PRK10095 ribonuclease I; Provi  25.7      59  0.0013   26.8   2.4   41    1-45      1-48  (268)
 37 PF07803 GSG-1:  GSG1-like prot  25.5      89  0.0019   22.8   3.0   20    1-20      2-21  (118)
 38 PHA02945 interferon resistance  25.3      87  0.0019   21.7   2.8   21   93-121    60-80  (88)
 39 PF08525 OapA_N:  Opacity-assoc  25.2   1E+02  0.0022   16.8   2.6   15    6-20     11-25  (30)
 40 PF07610 DUF1573:  Protein of u  25.2      84  0.0018   18.4   2.4   36   96-140    10-45  (45)
 41 PRK15260 fimbrial protein SteF  25.1      77  0.0017   24.2   2.8   40    4-45      3-42  (178)
 42 PRK09474 malE maltose ABC tran  25.0 1.2E+02  0.0025   25.0   4.1   35    4-38      2-38  (396)
 43 PRK11901 hypothetical protein;  25.0      63  0.0014   27.6   2.5   25    5-29     34-58  (327)
 44 PF04535 DUF588:  Domain of unk  24.3 1.4E+02  0.0031   21.7   4.1   37    1-37      5-45  (149)
 45 COG1930 CbiN ABC-type cobalt t  23.6 1.1E+02  0.0024   21.5   3.1   29    9-40      7-35  (97)
 46 PRK10081 entericidin B membran  23.2 1.2E+02  0.0025   18.8   2.8   17    6-22      3-19  (48)
 47 PF13624 SurA_N_3:  SurA N-term  22.7      28 0.00061   25.0   0.0   16    1-16      1-16  (154)
 48 PF05887 Trypan_PARP:  Procycli  22.3      29 0.00064   26.0   0.0   19    7-25      4-22  (143)
 49 PRK15216 putative fimbrial bio  21.6 1.8E+02  0.0039   24.9   4.5   51   12-62      4-75  (340)
 50 cd00927 Cyt_c_Oxidase_VIc Cyto  21.5 1.4E+02  0.0031   19.7   3.2   18    2-19     12-29  (70)
 51 PF01623 Carla_C4:  Carlavirus   20.9      40 0.00086   23.6   0.4   10   71-80     54-63  (91)
 52 PRK10877 protein disulfide iso  20.8 1.4E+02   0.003   23.7   3.6   16   92-107   106-122 (232)
 53 PF13453 zf-TFIIB:  Transcripti  20.6 1.6E+02  0.0034   16.8   3.0   23   99-129    17-39  (41)
 54 PF13462 Thioredoxin_4:  Thiore  20.3      53  0.0011   23.3   1.0   41   93-143    12-54  (162)
 55 COG3838 VirB2 Type IV secretor  20.1 1.1E+02  0.0024   22.0   2.6   28    1-28      4-31  (108)
 56 TIGR02645 ARCH_P_rylase putati  20.1 3.5E+02  0.0076   24.4   6.3   51   73-139    29-79  (493)

No 1  
>PLN03024 Putative EG45-like domain containing protein 1; Provisional
Probab=100.00  E-value=3.3e-35  Score=215.50  Aligned_cols=119  Identities=29%  Similarity=0.613  Sum_probs=101.8

Q ss_pred             HHHHHHHHHHhhhccCCceeeEEEeCCCCCCCCcccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCC--CCCc
Q 032308           12 LSFLLFISQLICNTSFADVGTAARYGPPFLPTTCYGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISAS--EPGT   89 (143)
Q Consensus        12 ~~~~~~~~~~~~~~a~~~~G~aT~Y~~~~~~GaC~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~--~~~~   89 (143)
                      +||++.+++.+.+++.++.|+||||++ +.+|+||++.    +.+.++||+|+.+|++|+.||+||||+|.+..  .+.+
T Consensus         5 ~~~~~~~~~~~~~~~~~~~G~AT~Y~~-~~~gAC~~~~----~~g~~iaAls~~lf~~G~~CG~c~~V~C~~~~~~~~~~   79 (125)
T PLN03024          5 ILIFSTVLVFLFSVSYATPGIATFYTS-YTPSACYRGT----SFGVMIAAASDSLWNNGRVCGKMFTVKCKGPRNAVPHP   79 (125)
T ss_pred             eHHHHHHHHHHhhhhcccceEEEEeCC-CCCccccCCC----CCCCEeEEeCHHHcCCCcccCceEEEEECCCCcccccc
Confidence            456666777888999999999999996 5779997663    36899999999999999999999999997532  1347


Q ss_pred             cCCCCeEEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhcCCCceEEEEEEE
Q 032308           90 CEPEQTIQIRIVDYALQLESTPSVSGTTIVLSETAFRTIANSTATLINVEFQQ  142 (143)
Q Consensus        90 C~~g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~  142 (143)
                      |. +++|+|+|+|+||++      +++|||||++||++||+++.|+|+|+|++
T Consensus        80 c~-gksV~V~VtD~CP~~------C~~~~DLS~~AF~~iA~~~aG~v~V~y~~  125 (125)
T PLN03024         80 CT-GKSVTVKIVDHCPSG------CASTLDLSREAFAQIANPVAGIINIDYIP  125 (125)
T ss_pred             cc-CCeEEEEEEcCCCCC------CCCceEcCHHHHHHhcCccCCEEEEEEeC
Confidence            86 789999999999952      23699999999999999999999999985


No 2  
>PLN00193 expansin-A; Provisional
Probab=99.97  E-value=2.3e-31  Score=215.11  Aligned_cols=119  Identities=22%  Similarity=0.330  Sum_probs=99.1

Q ss_pred             hccCCceeeEEEeCCCC----CCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEE
Q 032308           24 NTSFADVGTAARYGPPF----LPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQI   98 (143)
Q Consensus        24 ~~a~~~~G~aT~Y~~~~----~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V   98 (143)
                      +.+.+..|+||||+.++    ..||| ||+.. ..+++.++||+|+.+|++|+.||+||||+|....++.+|.++++|+|
T Consensus        26 ~~~~W~~a~AT~Yg~~d~~gt~gGACGYg~l~-~~~~g~~~AAls~~lf~~G~~CGaCyev~C~~~~~~~~C~~g~sV~V  104 (256)
T PLN00193         26 TPSGWTKAHATFYGGSDASGTMGGACGYGNLY-STGYGTRTAALSTALFNDGASCGQCYRIMCDYQADSRWCIKGASVTI  104 (256)
T ss_pred             CCCCceeeEEEEcCCCCCCCCCCcccCCCCcc-ccCCCceeeecCHhHccCCccccCeEEEECCCCCCCccccCCCeEEE
Confidence            33467899999999643    36899 99854 45678899999999999999999999999964345778986779999


Q ss_pred             EEeecCCCCCCCC-------CCCCceEEeCHHHHHHhhcCCCceEEEEEEEC
Q 032308           99 RIVDYALQLESTP-------SVSGTTIVLSETAFRTIANSTATLINVEFQQV  143 (143)
Q Consensus        99 ~V~D~Cp~c~~~~-------~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~V  143 (143)
                      +|||+||..+..|       +.+..|||||++||.+||....|+|+|+||||
T Consensus       105 t~td~CP~n~~~~~~~ggwC~~~~~HFDLS~~AF~~iA~~~~Giv~V~yrRV  156 (256)
T PLN00193        105 TATNFCPPNYALPNNNGGWCNPPLQHFDMAQPAWEKIGIYRGGIVPVLFQRV  156 (256)
T ss_pred             EEecCCCCcccccccCCCcCCCCCcccccCHHHHHHHhhhcCCeEeEEEEEe
Confidence            9999999753222       12458999999999999999999999999997


No 3  
>PLN00050 expansin A; Provisional
Probab=99.97  E-value=1e-30  Score=210.59  Aligned_cols=114  Identities=25%  Similarity=0.405  Sum_probs=95.7

Q ss_pred             cCCceeeEEEeCCCC----CCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEE
Q 032308           26 SFADVGTAARYGPPF----LPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRI  100 (143)
Q Consensus        26 a~~~~G~aT~Y~~~~----~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V  100 (143)
                      ..|..++||||+.++    ..||| ||+... .+.+.++||+|+.+|++|..||+||||+|.+  .+.+|.+ ++|+|+|
T Consensus        23 ~~W~~a~AT~Yg~~dg~gt~gGACGYg~l~~-~~~g~~~AAls~~lf~~G~~CGaCyeV~C~~--~~~~C~~-gsV~V~i   98 (247)
T PLN00050         23 SGWTGAHATFYGGGDASGTMGGACGYGNLYS-QGYGTNTAALSTALFNNGLSCGACFEIKCVN--DNIWCLP-GSIIITA   98 (247)
T ss_pred             CCccccEEEEcCCCCCCCCCCcccCCCCccc-cCCCceeeeccHhHccCCccccceEEEEcCC--CCcccCC-CcEEEEE
Confidence            468899999999653    36899 998543 4678899999999999999999999999976  4557984 5899999


Q ss_pred             eecCCCCCCCC-------CCCCceEEeCHHHHHHhhcCCCceEEEEEEEC
Q 032308          101 VDYALQLESTP-------SVSGTTIVLSETAFRTIANSTATLINVEFQQV  143 (143)
Q Consensus       101 ~D~Cp~c~~~~-------~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~V  143 (143)
                      ||+||+.+..|       ..+..|||||++||.+||....|+|+|+||||
T Consensus        99 td~CP~~~~~~~~~~gwC~~~~~hFDLS~~AF~~iA~~~aGii~V~yRRV  148 (247)
T PLN00050         99 TNFCPPNLALPNNDGGWCNPPQQHFDLSQPVFQKIAQYKAGIVPVQYRRV  148 (247)
T ss_pred             ecCCCCCcCcCccCCCcCCCCCcccccCHHHHHHHhhhcCCeeeeEEEEe
Confidence            99999743222       12458999999999999999999999999997


No 4  
>PLN03023 Expansin-like B1; Provisional
Probab=99.97  E-value=3e-30  Score=207.77  Aligned_cols=107  Identities=24%  Similarity=0.529  Sum_probs=91.4

Q ss_pred             hccCCceeeEEEeCCCC----CCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEE
Q 032308           24 NTSFADVGTAARYGPPF----LPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQI   98 (143)
Q Consensus        24 ~~a~~~~G~aT~Y~~~~----~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V   98 (143)
                      ....+..++||||++++    ..||| ||+... ..++.++||++ .+|++|..||+||||+|.   .+.+|. +++|+|
T Consensus        21 ~~~~W~~a~AT~Yg~~~g~gt~gGACGYg~~~~-~~~g~~~aa~s-~Lf~~G~~CGaCy~irC~---~~~~C~-~~~v~V   94 (247)
T PLN03023         21 KSQDFTYSRATYYGSPDCLGTPTGACGFGEYGR-TVNGGNVAGVS-RLYRNGTGCGACYQVRCK---APNLCS-DDGVNV   94 (247)
T ss_pred             hcCCcccceEEEeCCCCCCCCCCccccCCcccc-CCCcceeeeeh-hhhcCCchhcccEEeecC---CCCccC-CCCeEE
Confidence            44457799999999875    46899 998543 33467899998 999999999999999997   477998 468999


Q ss_pred             EEeecCCCCCCCCCCCCceEEeCHHHHHHhhcC-------CCceEEEEEEEC
Q 032308           99 RIVDYALQLESTPSVSGTTIVLSETAFRTIANS-------TATLINVEFQQV  143 (143)
Q Consensus        99 ~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~-------~~G~i~V~w~~V  143 (143)
                      +|||.||.       +..|||||.+||.+||.+       ..|+|+|+||||
T Consensus        95 ~iTd~~~~-------~~~hFdLS~~AF~~iA~pg~~~~l~~aGiv~v~YrRV  139 (247)
T PLN03023         95 VVTDYGEG-------DKTDFILSPRAYARLARPNMAAELFAYGVVDVEYRRI  139 (247)
T ss_pred             EEEeCCCC-------CCCccccCHHHHHHHhCccccchhccCcEEEeEEEEE
Confidence            99999985       478999999999999995       469999999997


No 5  
>smart00837 DPBB_1 Rare lipoprotein A (RlpA)-like double-psi beta-barrel. Rare lipoprotein A (RlpA) contains a conserved region that has the double-psi beta-barrel (DPBB) fold. The function of RlpA is not well understood, but it has been shown to act as a prc mutant suppressor in Escherichia coli. The DPBB fold is often an enzymatic domain. The members of this family are quite diverse, and if catalytic this family may contain several different functions. Another example of this domain is found in the N terminus of pollen allergen.
Probab=99.93  E-value=1.8e-26  Score=159.71  Aligned_cols=80  Identities=28%  Similarity=0.531  Sum_probs=69.4

Q ss_pred             EEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCCCCC-------CCCceEEeCHHHHHHhhcC
Q 032308           59 FAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLESTPS-------VSGTTIVLSETAFRTIANS  131 (143)
Q Consensus        59 iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~~~~-------~~~~~lDLS~~AF~~ia~~  131 (143)
                      +||+|+.+|++|..||+||||+|.+  +|.+|.++++|+|+|||+||.+++.+.       .+..|||||++||.+||+.
T Consensus         1 taA~s~~lf~~G~~CG~Cy~v~C~~--~~~~C~~~~~V~V~vtd~CP~~~~~~~~~~~~C~~~~~hfDLS~~AF~~iA~~   78 (87)
T smart00837        1 TAALSTALFNNGASCGACYEIMCVD--SPKWCKPGGSITVTATNFCPPNYALSNDNGGWCNPPRKHFDLSQPAFEKIAQY   78 (87)
T ss_pred             CcccCHHHccCCccccceEEEEeCC--CCCcccCCCeEEEEEeccCCccccccccCCCccCCCCcCeEcCHHHHHHHhhh
Confidence            4799999999999999999999975  567898777999999999998643221       1358999999999999999


Q ss_pred             CCceEEEEE
Q 032308          132 TATLINVEF  140 (143)
Q Consensus       132 ~~G~i~V~w  140 (143)
                      +.|+|+|+|
T Consensus        79 ~~Gvi~v~y   87 (87)
T smart00837       79 KAGIVPVKY   87 (87)
T ss_pred             cCCEEeeEC
Confidence            999999997


No 6  
>PF03330 DPBB_1:  Rare lipoprotein A (RlpA)-like double-psi beta-barrel;  InterPro: IPR009009  Beta barrels are commonly observed in protein structures. They are classified in terms of two integral parameters: the number of strands in the sheet, n, and the shear number, S, a measure of the stagger of the strands in the beta-sheet. These two parameters have been shown to determine the major geometrical features of beta-barrels. Six-stranded beta-barrels with a pseudo-twofold axis are found in several proteins. One involving parallel strands forming two psi structures is known as the double-psi barrel. The first psi structure consists of the loop connecting strands beta1 and beta2 (a 'psi loop') and the strand beta5, whereas the second psi structure consists of the loop connecting strands beta4 and beta5 and the strand beta2. All the psi structures in double-psi barrels have a unique handedness, in that beta1 (beta4), beta2 (beta5) and the loop following beta5 (beta2) form a right-handed helix. The unique handedness may be related to the fact that the twisting angle between the parallel pair of strands is always larger than that between the antiparallel pair [].; PDB: 1N10_B 3D30_A 2BH0_A 2HCZ_X.
Probab=99.87  E-value=1.1e-22  Score=137.09  Aligned_cols=76  Identities=33%  Similarity=0.629  Sum_probs=61.2

Q ss_pred             EEEeCCCCCCCCcccCCeEEEEeccCCCC-CccCCC-CeEEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhcCCCceE
Q 032308           59 FAAAGDGIWDNGASCGRQYLVRCISASEP-GTCEPE-QTIQIRIVDYALQLESTPSVSGTTIVLSETAFRTIANSTATLI  136 (143)
Q Consensus        59 iaA~s~~~~~~g~~CG~c~~V~c~~~~~~-~~C~~g-~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i  136 (143)
                      .||++..+|++|..||+||+++|.....+ +.|+.+ ++|+|+|+|+||+|      +.+|||||+.||++|++++.|+|
T Consensus         1 t~a~~~~~y~~g~~cG~~~~~~~~~~a~~~~~~~~~~ksV~v~V~D~Cp~~------~~~~lDLS~~aF~~la~~~~G~i   74 (78)
T PF03330_consen    1 TAAGSATWYDNGTACGQCYQVTCLTAASATGTCKVGNKSVTVTVVDRCPGC------PPNHLDLSPAAFKALADPDAGVI   74 (78)
T ss_dssp             EEEE-HHHHGGGTTTT-EEEEEE---SSTT--BESEECEEEEEEEEE-TTS------SSSEEEEEHHHHHHTBSTTCSSE
T ss_pred             CeEEEhhhcCCCCcCCCeeeccccccCCccceEEecCCeEEEEEEccCCCC------cCCEEEeCHHHHHHhCCCCceEE
Confidence            48999999999999999999999433211 127632 99999999999997      68999999999999999999999


Q ss_pred             EEEE
Q 032308          137 NVEF  140 (143)
Q Consensus       137 ~V~w  140 (143)
                      +|+|
T Consensus        75 ~V~w   78 (78)
T PF03330_consen   75 PVEW   78 (78)
T ss_dssp             EEEE
T ss_pred             EEEC
Confidence            9999


No 7  
>COG4305 Endoglucanase C-terminal domain/subunit and related proteins [Carbohydrate transport and metabolism]
Probab=99.41  E-value=8.4e-13  Score=101.89  Aligned_cols=95  Identities=22%  Similarity=0.237  Sum_probs=79.6

Q ss_pred             ceeeEEEeCCCCCCCCc-ccCCCCCCCCCCeEEEeCCCCCCCC----cccCCeEEEEeccCCCCCccCCCCeEEEEEeec
Q 032308           29 DVGTAARYGPPFLPTTC-YGNDPTQFPSSNLFAAAGDGIWDNG----ASCGRQYLVRCISASEPGTCEPEQTIQIRIVDY  103 (143)
Q Consensus        29 ~~G~aT~Y~~~~~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g----~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~  103 (143)
                      +.|-|||-+..|.+|+= -.    +.|.+.-|.|+|+.+-|-|    +.-|+.+||.     +|     .++.+|.|+|+
T Consensus        31 f~G~ATyTgsGYsGGAflLD----PI~sd~eITAlNPaqlNlGGipAAmAGaYLrVq-----GP-----KG~TTVYVTDl   96 (232)
T COG4305          31 FEGYATYTGSGYSGGAFLLD----PIPSDMEITALNPAQLNLGGIPAAMAGAYLRVQ-----GP-----KGKTTVYVTDL   96 (232)
T ss_pred             cceeEEEecccccCceEEec----CcCCcceeeecCHHHcccCCchhhhccceEEEE-----CC-----CCceEEEEecc
Confidence            36889987767777766 33    3456678999999988876    6789999998     55     46789999999


Q ss_pred             CCCCCCCCCCCCceEEeCHHHHHHhhcCCCceEEEEEEEC
Q 032308          104 ALQLESTPSVSGTTIVLSETAFRTIANSTATLINVEFQQV  143 (143)
Q Consensus       104 Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~V  143 (143)
                      -|+.      ..+.|||||.||.+|++...|+|+|+||.|
T Consensus        97 YPeg------asGaLDLSpNAFakIGnm~qGrIpvqWrvv  130 (232)
T COG4305          97 YPEG------ASGALDLSPNAFAKIGNMKQGRIPVQWRVV  130 (232)
T ss_pred             cccc------cccccccChHHHhhhcchhcCccceeEEEe
Confidence            9995      678999999999999999999999999976


No 8  
>TIGR00413 rlpA rare lipoprotein A. This is a family of prokaryotic proteins with unknown function. Lipoprotein annotation based on the presence of consensus lipoprotein signal sequence. Included in this family is the E. coli putative lipoprotein rlpA.
Probab=99.24  E-value=8.8e-11  Score=92.56  Aligned_cols=90  Identities=23%  Similarity=0.243  Sum_probs=72.8

Q ss_pred             eeEEEeCCCCCCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCC
Q 032308           31 GTAARYGPPFLPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLES  109 (143)
Q Consensus        31 G~aT~Y~~~~~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~  109 (143)
                      |.|+||++..++..- .|..   |....+.||..+-.+      |..++|+...        ||++|+|+|.|++|.-  
T Consensus         1 G~ASwYg~~f~G~~TAnGe~---y~~~~~tAAHktLPl------gT~V~VtNl~--------ngrsviVrVnDRGPf~--   61 (208)
T TIGR00413         1 GLASWYGPKFHGRKTANGEV---YNMKALTAAHKTLPF------NTYVKVTNLH--------NNRSVIVRINDRGPFS--   61 (208)
T ss_pred             CEEeEeCCCCCCCcCCCCee---cCCCccccccccCCC------CCEEEEEECC--------CCCEEEEEEeCCCCCC--
Confidence            789999986654333 3543   334578888887766      8999999763        6899999999999984  


Q ss_pred             CCCCCCceEEeCHHHHHHhhcCCCceEEEEEEEC
Q 032308          110 TPSVSGTTIVLSETAFRTIANSTATLINVEFQQV  143 (143)
Q Consensus       110 ~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~V  143 (143)
                          ++..||||+.|+++|+-...|+.+|+.+.+
T Consensus        62 ----~gRiIDLS~aAA~~Lg~~~~G~a~V~vevl   91 (208)
T TIGR00413        62 ----DDRIIDLSHAAAREIGLISRGVGQVRIEVL   91 (208)
T ss_pred             ----CCCEEECCHHHHHHcCCCcCceEEEEEEEE
Confidence                678999999999999999999999988753


No 9  
>COG0797 RlpA Lipoproteins [Cell envelope biogenesis, outer membrane]
Probab=99.23  E-value=9.3e-11  Score=93.80  Aligned_cols=96  Identities=24%  Similarity=0.275  Sum_probs=77.2

Q ss_pred             ccCCceeeEEEeCCCCCCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeec
Q 032308           25 TSFADVGTAARYGPPFLPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDY  103 (143)
Q Consensus        25 ~a~~~~G~aT~Y~~~~~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~  103 (143)
                      ......|.|+||+...++--- .|+.   +....+.||..+-.|      |...+|++.+        ||++|+|+|.|+
T Consensus        79 ~~~~~~G~ASwYg~~fhgr~TA~Ge~---~n~~~~tAAH~TLP~------~t~v~VtNl~--------NgrsvvVRINDR  141 (233)
T COG0797          79 ASFEQVGYASWYGEKFHGRKTANGER---YDMNALTAAHKTLPL------PTYVRVTNLD--------NGRSVVVRINDR  141 (233)
T ss_pred             ccccccceeeeeccccCCccccCccc---ccccccccccccCCC------CCEEEEEEcc--------CCcEEEEEEeCC
Confidence            344467999999976554333 4443   334678899988888      7899999874        689999999999


Q ss_pred             CCCCCCCCCCCCceEEeCHHHHHHhhcCCCceEEEEEEEC
Q 032308          104 ALQLESTPSVSGTTIVLSETAFRTIANSTATLINVEFQQV  143 (143)
Q Consensus       104 Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~V  143 (143)
                      +|.-      ++..||||..|+++|+....|+.+|+.+.+
T Consensus       142 GPf~------~gRiIDlS~aAA~~l~~~~~G~a~V~i~~l  175 (233)
T COG0797         142 GPFV------SGRIIDLSKAAADKLGMIRSGVAKVRIEVL  175 (233)
T ss_pred             CCCC------CCcEeEcCHHHHHHhCCccCceEEEEEEEe
Confidence            9984      678999999999999999999988887754


No 10 
>PF00967 Barwin:  Barwin family;  InterPro: IPR001153 Barwin is a basic protein isolated from aqueous extracts of barley seeds. It is 125 amino acids in length, and contains six cysteine residues that combine to form three disulphide bridges [, ]. Comparative analysis shows the sequence to be highly similar to a 122 amino acid stretch in the C-terminal of the products of two wound-induced genes (win1 and win2) from potato, the product of the hevein gene of rubber trees, and pathogenesis-related protein 4 from tobacco. The high levels of similarity to these proteins, and their ability to bind saccharides, suggest that the barwin domain may be involved in a common defence mechanism in plants.; GO: 0042742 defense response to bacterium, 0050832 defense response to fungus; PDB: 1BW3_A 1BW4_A.
Probab=99.16  E-value=4.7e-11  Score=86.04  Aligned_cols=59  Identities=24%  Similarity=0.331  Sum_probs=43.4

Q ss_pred             CCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhcCC----CceEEEEEEEC
Q 032308           68 DNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLESTPSVSGTTIVLSETAFRTIANST----ATLINVEFQQV  143 (143)
Q Consensus        68 ~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~----~G~i~V~w~~V  143 (143)
                      .+.+.||+|++||...        +|++++|+|||+|+.+         .|||.+.+|.+|-...    .|.+.|+|+.|
T Consensus        55 ~gq~~CGkClrVTNt~--------tga~~~~RIVDqCsnG---------GLDld~~vF~~iDtdG~G~~~Ghl~V~y~fV  117 (119)
T PF00967_consen   55 MGQDSCGKCLRVTNTA--------TGAQVTVRIVDQCSNG---------GLDLDPTVFNQIDTDGQGYAQGHLIVDYEFV  117 (119)
T ss_dssp             -SGGGTT-EEEEE-TT--------T--EEEEEEEEE-SSS---------SEES-SSSHHHH-SSSHHHHHTEEEEEEEEE
T ss_pred             cCcccccceEEEEecC--------CCcEEEEEEEEcCCCC---------CcccChhHHhhhccCCcccccceEEEEEEEE
Confidence            4558999999999653        4789999999999863         7999999999996543    68999999986


No 11 
>PRK10672 rare lipoprotein A; Provisional
Probab=99.00  E-value=5.3e-09  Score=88.46  Aligned_cols=90  Identities=23%  Similarity=0.160  Sum_probs=72.3

Q ss_pred             eeeEEEeCCCCCCCCc-ccCCCCCCCCCCeEEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCC
Q 032308           30 VGTAARYGPPFLPTTC-YGNDPTQFPSSNLFAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLE  108 (143)
Q Consensus        30 ~G~aT~Y~~~~~~GaC-~g~~~~~~p~~~~iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~  108 (143)
                      .|.|+||+..+++..- .|+.   |....+.||..+-.+      |..++|++..        ||++|+|+|.|++|.- 
T Consensus        80 ~G~ASwYg~~f~G~~TA~Ge~---~~~~~~tAAH~tLPl------ps~vrVtNl~--------ngrsvvVrVnDRGP~~-  141 (361)
T PRK10672         80 AGLAAIYDAEAGSNLTASGER---FDPNALTAAHPTLPI------PSYVRVTNLA--------NGRMIVVRINDRGPYG-  141 (361)
T ss_pred             EEEEEEeCCccCCCcCcCcee---ecCCcCeeeccCCCC------CCEEEEEECC--------CCcEEEEEEeCCCCCC-
Confidence            5889999976554444 4543   334578888888777      8999999774        6899999999999984 


Q ss_pred             CCCCCCCceEEeCHHHHHHhhcCCCceEEEEEEE
Q 032308          109 STPSVSGTTIVLSETAFRTIANSTATLINVEFQQ  142 (143)
Q Consensus       109 ~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w~~  142 (143)
                           .+.-||||+.|+++|+-...+.+.|+.-.
T Consensus       142 -----~gRiiDLS~aAA~~Lg~~~~~~V~ve~i~  170 (361)
T PRK10672        142 -----PGRVIDLSRAAADRLNTSNNTKVRIDPII  170 (361)
T ss_pred             -----CCCeeEcCHHHHHHhCCCCCceEEEEEEe
Confidence                 67899999999999998888888887653


No 12 
>PF07249 Cerato-platanin:  Cerato-platanin;  InterPro: IPR010829 Cerato-platanin (CP) is the first member of the cerato-platanin family. It is produced by the Ascomycete Ceratocystis fimbriata f. sp. platani and causes the severe plant disease: canker stain. This protein occurs in the cell wall of the fungus and is involved in the host-plane interaction and induces both cell necrosis and phytoalexin synthesis which is one of the first plant defense-related events. CP, like other fungal surface proteins, is able to self assemble in vitro []. CP is a 120 amino acid protein, containing 40% hydrophobic residues and two S-S bridges. It contains four cysteine residues that form two disulphide bonds []. The N-terminal region of CP is very similar to cerato-ulmin, a phytotoxic protein produced by the Ophiostoma species belonging to the hydrophobin family, which also self-assembles []. This entry also includes other precursor proteins.; PDB: 2KQA_A 3M3G_A.
Probab=98.72  E-value=1.1e-07  Score=69.44  Aligned_cols=71  Identities=20%  Similarity=0.330  Sum_probs=51.1

Q ss_pred             CCCCCCeEEEeCCC-CCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhc
Q 032308           52 QFPSSNLFAAAGDG-IWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLESTPSVSGTTIVLSETAFRTIAN  130 (143)
Q Consensus        52 ~~p~~~~iaA~s~~-~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~  130 (143)
                      +.|.--+|.+.+.- -| |...||.|+||+.          ++++|.|..+|.=++          .|+||++||+.|.+
T Consensus        38 ~lp~Fp~IGg~~~V~gW-nS~~CGtC~~lty----------~g~si~vlaID~a~~----------gfnis~~A~n~LT~   96 (119)
T PF07249_consen   38 SLPNFPYIGGAPAVAGW-NSPNCGTCWKLTY----------NGRSIYVLAIDHAGG----------GFNISLDAMNDLTN   96 (119)
T ss_dssp             CSTTTTSEEEETT--ST-T-TTTT-EEEEEE----------TTEEEEEEEEEE-SS----------SEEE-HHHHHHHHT
T ss_pred             hcCCCCeeccccccccC-CCCCCCCeEEEEE----------CCeEEEEEEEecCCC----------cccchHHHHHHhcC
Confidence            34444567777764 46 4588999999995          378999999998543          49999999999987


Q ss_pred             C---CCceEEEEEEEC
Q 032308          131 S---TATLINVEFQQV  143 (143)
Q Consensus       131 ~---~~G~i~V~w~~V  143 (143)
                      .   ..|+|+++|++|
T Consensus        97 g~a~~lG~V~a~~~qV  112 (119)
T PF07249_consen   97 GQAVELGRVDATYTQV  112 (119)
T ss_dssp             S-CCCC-EEE-EEEEE
T ss_pred             CcccceeEEEEEEEEc
Confidence            3   479999999987


No 13 
>PF02015 Glyco_hydro_45:  Glycosyl hydrolase family 45;  InterPro: IPR000334 O-Glycosyl hydrolases 3.2.1. from EC are a widespread group of enzymes that hydrolyse the glycosidic bond between two or more carbohydrates, or between a carbohydrate and a non-carbohydrate moiety. A classification system for glycosyl hydrolases, based on sequence similarity, has led to the definition of 85 different families [, ]. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. Glycoside hydrolase family 45 GH45 from CAZY comprises enzymes with only one known activity; endoglucanase (3.2.1.4 from EC). The microbial degradation of cellulose and xylans requires several types of enzymes such as endoglucanases, cellobiohydrolases (3.2.1.91 from EC) (exoglucanases), or xylanases (3.2.1.8 from EC) [, ]. Fungi and bacteria produce a spectrum of cellulolytic enzymes (cellulases) and xylanases which, on the basis of sequence similarities, can be classified into families. One of these families is known as the cellulase family K or as the glycosyl hydrolases family 45 []. The best conserved regions in these enzymes is located in the N-terminal section. It contains an aspartic acid residue which has been shown [] to act as a nucleophile in the catalytic mechanism. This also has several cysteines that are involved in forming disulphide bridges.; GO: 0008810 cellulase activity, 0005975 carbohydrate metabolic process; PDB: 1OA7_A 1OA9_A 1L8F_A 1HD5_A 4ENG_A 3ENG_A 2ENG_A.
Probab=96.02  E-value=0.013  Score=46.26  Aligned_cols=54  Identities=17%  Similarity=0.153  Sum_probs=33.6

Q ss_pred             EEEeCCCCCCCCcccCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCCCCCCCCceEEeCHH
Q 032308           59 FAAAGDGIWDNGASCGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLESTPSVSGTTIVLSET  123 (143)
Q Consensus        59 iaA~s~~~~~~g~~CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~  123 (143)
                      +||.+-.-......|++||+++-+++.     -.||+.+|+|++.--+-      ..+||||.-+
T Consensus        70 faA~~~~G~~e~~~Cc~Cy~LtFt~g~-----l~GKkmiVQ~tNtG~dl------g~n~FDl~iP  123 (201)
T PF02015_consen   70 FAAASITGGSESSWCCACYELTFTSGP-----LKGKKMIVQVTNTGGDL------GSNQFDLAIP  123 (201)
T ss_dssp             EEEEE-TT--HHHHTT-EEEEEE-SST-----TTT-EEEEEEEEE-TTT------TTTEEEEE-T
T ss_pred             eeeeeecCCCCCCcccceEEEEEcCCC-----cCCCEeEEEecccCCCC------CCCeEEEEeC
Confidence            566653322334789999999987632     23899999999988663      4689999754


No 14 
>PRK15262 putative fimbrial protein StaF; Provisional
Probab=79.97  E-value=2.4  Score=33.12  Aligned_cols=39  Identities=10%  Similarity=0.087  Sum_probs=31.7

Q ss_pred             HHHHHHHHHHHHHHHHhhhccCCceeeEEEeCCCCCCCCc
Q 032308            6 RQALQWLSFLLFISQLICNTSFADVGTAARYGPPFLPTTC   45 (143)
Q Consensus         6 ~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~~~~~~GaC   45 (143)
                      ||+.++.++++++.|++..++.+..|+.+|.|- .....|
T Consensus         3 ~~~~~~~~~~~~~~~~~~~~~~a~~g~I~f~G~-Iv~~tC   41 (197)
T PRK15262          3 RKLMKKIILFLGLLFALTSPPAYAGQDVDLTAN-IKNSTC   41 (197)
T ss_pred             hHHHHHHHHHHHHHHHhcccccccCCEEEEEEE-EEcCCc
Confidence            677888888888888888888888999999773 345688


No 15 
>PF15240 Pro-rich:  Proline-rich
Probab=72.28  E-value=2.5  Score=33.03  Aligned_cols=27  Identities=11%  Similarity=0.053  Sum_probs=16.4

Q ss_pred             HHHHHHHHHHHHhhhccCCceeeEEEeC
Q 032308           10 QWLSFLLFISQLICNTSFADVGTAARYG   37 (143)
Q Consensus        10 ~~~~~~~~~~~~~~~~a~~~~G~aT~Y~   37 (143)
                      |+|+||.+++|+|+|+...+.. ..+.+
T Consensus         1 MLlVLLSvALLALSSAQ~~dEd-v~~e~   27 (179)
T PF15240_consen    1 MLLVLLSVALLALSSAQSTDED-VSQEE   27 (179)
T ss_pred             ChhHHHHHHHHHhhhccccccc-ccccc
Confidence            3556666777777777666554 34444


No 16 
>PF10717 ODV-E18:  Occlusion-derived virus envelope protein ODV-E18;  InterPro: IPR019655  Baculovirus occlusion-derived virus (ODV) derives its envelope from an intranuclear membrane source. Occlusion-derived viral envelope proteins that are detected in viral-induced intranuclear microvesicles, but not detected in the plasma membrane, cytoplasmic membranes, or the nuclear envelope. This entry represents ODV-E18 protein which is encoded by baculovirus late genes with transcription initiating from a TAAG motif. ODV-E18 exists as a dimer in the ODV envelope, which contains a hydrophobic domain that putatively acts as a target or retention signal for intranuclear microvesicles []. ; GO: 0019031 viral envelope
Probab=55.01  E-value=20  Score=24.64  Aligned_cols=27  Identities=15%  Similarity=0.203  Sum_probs=18.4

Q ss_pred             HHHHHHHHHHHHHHHHhhhccCCceee
Q 032308            6 RQALQWLSFLLFISQLICNTSFADVGT   32 (143)
Q Consensus         6 ~~~~~~~~~~~~~~~~~~~~a~~~~G~   32 (143)
                      --.|-+++|.|++.++|-+.+...+..
T Consensus        28 MtILivLVIIiLlImlfqsSS~~~~s~   54 (85)
T PF10717_consen   28 MTILIVLVIIILLIMLFQSSSNGNSSS   54 (85)
T ss_pred             HHHHHHHHHHHHHHHHHhccCCCCCCC
Confidence            345667778888888887776665443


No 17 
>PRK13159 cytochrome c-type biogenesis protein CcmE; Reviewed
Probab=51.86  E-value=14  Score=28.17  Aligned_cols=37  Identities=8%  Similarity=-0.079  Sum_probs=19.8

Q ss_pred             hHHHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeCC
Q 032308            2 LSRIRQALQWLSFLLFISQLICNTSFADVGTAARYGP   38 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~~   38 (143)
                      ..|-||+..++++++.++++..-+..+.+....||-.
T Consensus         3 ~~r~rRl~~v~~~~~~~~~a~~Lv~~al~~n~~yF~t   39 (155)
T PRK13159          3 ATRKQRLWLVIGVLTAAALAVTLIVLALQRNMSYLFT   39 (155)
T ss_pred             hhhhhHHHHHHHHHHHHHHHHHHHHHHhhhCceEEEC
Confidence            4666777655555554444444333444455566653


No 18 
>PRK13150 cytochrome c-type biogenesis protein CcmE; Reviewed
Probab=48.33  E-value=14  Score=28.31  Aligned_cols=36  Identities=11%  Similarity=-0.045  Sum_probs=20.1

Q ss_pred             hHHHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeC
Q 032308            2 LSRIRQALQWLSFLLFISQLICNTSFADVGTAARYG   37 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~   37 (143)
                      ..|-||++.+++++++++++..-+-.+.+....||-
T Consensus         3 ~~r~rRl~~v~~~~~~~~~a~~Lvl~al~~n~~yF~   38 (159)
T PRK13150          3 LRRKNRLWVVCAVLAGLGLTTALVLYALRANIDLFY   38 (159)
T ss_pred             hhhhhHHHHHHHHHHHHHHHHHHHHHHHhhCccEEe
Confidence            567777766666555555544444444445555544


No 19 
>PRK11657 dsbG disulfide isomerase/thiol-disulfide oxidase; Provisional
Probab=45.27  E-value=38  Score=27.24  Aligned_cols=36  Identities=6%  Similarity=0.001  Sum_probs=22.0

Q ss_pred             CCeEEEEEee-cCCCCCCCCCCCCceEEeCHHHHHHhhc-CCCceEEEEEEE
Q 032308           93 EQTIQIRIVD-YALQLESTPSVSGTTIVLSETAFRTIAN-STATLINVEFQQ  142 (143)
Q Consensus        93 g~sV~V~V~D-~Cp~c~~~~~~~~~~lDLS~~AF~~ia~-~~~G~i~V~w~~  142 (143)
                      ++.+++..+| .||.|.              ..++.+.+ .+.|.|.|+|..
T Consensus       117 ak~~I~vFtDp~CpyC~--------------kl~~~l~~~~~~g~V~v~~ip  154 (251)
T PRK11657        117 APRIVYVFADPNCPYCK--------------QFWQQARPWVDSGKVQLRHIL  154 (251)
T ss_pred             CCeEEEEEECCCChhHH--------------HHHHHHHHHhhcCceEEEEEe
Confidence            4666777888 999982              23333332 234667777754


No 20 
>PF03100 CcmE:  CcmE;  InterPro: IPR004329 CcmE is the product of one of a cluster of Ccm genes that are necessary for cytochrome c biosynthesis in eubacteria. Expression of these proteins is induced when the organisms are grown under anaerobic conditions with nitrate or nitrite as the final electron acceptor.; GO: 0017003 protein-heme linkage, 0017004 cytochrome complex assembly, 0005886 plasma membrane; PDB: 1SR3_A 2KCT_A 1J6Q_A 1LM0_A.
Probab=43.88  E-value=4.6  Score=29.45  Aligned_cols=37  Identities=19%  Similarity=0.141  Sum_probs=3.2

Q ss_pred             ChHHHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeC
Q 032308            1 MLSRIRQALQWLSFLLFISQLICNTSFADVGTAARYG   37 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~   37 (143)
                      |.+|=||+..+++++++++++..-+..+..+.++||-
T Consensus         1 ~~~~~~rl~~~~~~~~~i~~~~~l~~~~~~~~~~yy~   37 (131)
T PF03100_consen    1 MKRRKKRLILVVLGLVIIAAAIYLILYSFSDSAVYYL   37 (131)
T ss_dssp             -------------------------------SSS-EE
T ss_pred             CCcceeehhhHHHHHHHHHHHHHHHHHHhhccceEEc
Confidence            6666677766666565555555555555566677664


No 21 
>PF07584 BatA:  Aerotolerance regulator N-terminal;  InterPro: IPR024163 The Batl operon appears to be important in pathogenicity and aerotolerance. BatA ensures bacterial survival in the early stages of the infection process, when the infected sites are aerobic, and is produced under conditions of oxidative stress []. Proteins produced by the Batl operon share a highly-conserved sequence at their N terminus and the full length proteins carry multiple membrane-spanning domains []. This entry represents the conserved N-terminal domain, which is also found in some uncharacterised proteins.
Probab=40.19  E-value=39  Score=22.04  Aligned_cols=24  Identities=33%  Similarity=0.378  Sum_probs=16.3

Q ss_pred             HHHHHHHHHHHHHHHHHHHhhhcc
Q 032308            3 SRIRQALQWLSFLLFISQLICNTS   26 (143)
Q Consensus         3 ~~~~~~~~~~~~~~~~~~~~~~~a   26 (143)
                      +|+|+++..++.++.++++....|
T Consensus        52 ~~~~~~l~l~L~lLal~lli~AlA   75 (77)
T PF07584_consen   52 RRLRRHLLLLLRLLALALLILALA   75 (77)
T ss_pred             HHHhhhHHHHHHHHHHHHHHHHHc
Confidence            468888888777666666655444


No 22 
>PF10913 DUF2706:  Protein of unknown function (DUF2706);  InterPro: IPR024444 This family of proteins with unknown function appears to be restricted to Rickettsia spp.
Probab=39.43  E-value=41  Score=21.29  Aligned_cols=19  Identities=26%  Similarity=0.555  Sum_probs=15.3

Q ss_pred             HHHHHHHHHHHHHHHHhhh
Q 032308            6 RQALQWLSFLLFISQLICN   24 (143)
Q Consensus         6 ~~~~~~~~~~~~~~~~~~~   24 (143)
                      ..++++++++|.++++++-
T Consensus         2 lk~lkf~lv~imlaqllsc   20 (60)
T PF10913_consen    2 LKSLKFLLVLIMLAQLLSC   20 (60)
T ss_pred             hhHHHHHHHHHHHHHHHcC
Confidence            3578889999999998864


No 23 
>PF13670 PepSY_2:  Peptidase propeptide and YPEB domain This Prosite motif covers only the active site. This is family M4 in the peptidase classification. 
Probab=39.30  E-value=27  Score=22.99  Aligned_cols=21  Identities=10%  Similarity=0.183  Sum_probs=14.2

Q ss_pred             cCCeEEEEeccCCCCCccCCCCeEEEEE
Q 032308           73 CGRQYLVRCISASEPGTCEPEQTIQIRI  100 (143)
Q Consensus        73 CG~c~~V~c~~~~~~~~C~~g~sV~V~V  100 (143)
                      -+.||||+..+       .+|+.+.|+|
T Consensus        52 ~~g~yev~~~~-------~dG~~~ev~v   72 (83)
T PF13670_consen   52 DDGCYEVEARD-------KDGKKVEVYV   72 (83)
T ss_pred             CCCEEEEEEEE-------CCCCEEEEEE
Confidence            35568988554       2577787776


No 24 
>PRK13254 cytochrome c-type biogenesis protein CcmE; Reviewed
Probab=37.15  E-value=19  Score=27.13  Aligned_cols=37  Identities=14%  Similarity=0.030  Sum_probs=18.0

Q ss_pred             hHHHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeCC
Q 032308            2 LSRIRQALQWLSFLLFISQLICNTSFADVGTAARYGP   38 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~~   38 (143)
                      ..|-||+..+++++++++++..-+..+.....+||-.
T Consensus         3 ~~~~~rl~~~~~~~~~~~~~~~L~~~a~~~~~~yf~t   39 (148)
T PRK13254          3 KRKRRRLLIILGALAALGLAVALVLYALRQNIVFFYT   39 (148)
T ss_pred             ccchhHHHHHHHHHHHHHHHHHHHHHHHHhCCceeeC
Confidence            4555565444444444444333333344555666653


No 25 
>PF05324 Sperm_Ag_HE2:  Sperm antigen HE2;  InterPro: IPR007988 This family consists of several variants of the human and chimpanzee (Pan troglodytes) sperm antigen proteins (HE2 and EP2 respectively). The EP2 gene codes for a family of androgen-dependent, epididymis-specific secretory proteins.The EP2 gene uses alternative promoters and differential splicing to produce a family of variant messages. The translated putative protein variants differ significantly from each other. Some of these putative proteins have similarity to beta-defensins, a family of antimicrobial peptides [].; GO: 0005576 extracellular region
Probab=36.03  E-value=30  Score=23.05  Aligned_cols=22  Identities=27%  Similarity=0.256  Sum_probs=15.3

Q ss_pred             HHHHHHHHHHHHHHHhhhccCC
Q 032308            7 QALQWLSFLLFISQLICNTSFA   28 (143)
Q Consensus         7 ~~~~~~~~~~~~~~~~~~~a~~   28 (143)
                      |++.....|++++|+|...+.+
T Consensus         3 ~llP~~~sLLLvaLLfPG~s~a   24 (73)
T PF05324_consen    3 RLLPSFVSLLLVALLFPGSSRA   24 (73)
T ss_pred             chhHHHHHHHHHHHHccCcccc
Confidence            4566666677788888766655


No 26 
>cd03020 DsbA_DsbC_DsbG DsbA family, DsbC and DsbG subfamily; V-shaped homodimeric proteins containing a redox active CXXC motif imbedded in a TRX fold. They function as protein disulfide isomerases and chaperones in the bacterial periplasm to correct non-native disulfide bonds formed by DsbA and prevent aggregation of incorrectly folded proteins. DsbC and DsbG are kept in their reduced state by the cytoplasmic membrane protein DsbD, which utilizes the TRX/TRX reductase system in the cytosol as a source of reducing equivalents. DsbG differ from DsbC in that it has a more limited substrate specificity, and it may preferentially act later in the folding process to catalyze disulfide rearrangements in folded or partially folded proteins. Also included in the alignment is the predicted protein TrbB, whose gene was sequenced from the enterohemorrhagic E. coli type IV pilus gene cluster, which is required for efficient plasmid transfer.
Probab=32.83  E-value=1.1e+02  Score=23.17  Aligned_cols=15  Identities=7%  Similarity=-0.057  Sum_probs=11.0

Q ss_pred             CCeEEEEEee-cCCCC
Q 032308           93 EQTIQIRIVD-YALQL  107 (143)
Q Consensus        93 g~sV~V~V~D-~Cp~c  107 (143)
                      ++...+..+| .||.|
T Consensus        77 ~~~~i~~f~D~~Cp~C   92 (197)
T cd03020          77 GKRVVYVFTDPDCPYC   92 (197)
T ss_pred             CCEEEEEEECCCCccH
Confidence            4666677788 78877


No 27 
>PF13623 SurA_N_2:  SurA N-terminal domain
Probab=32.76  E-value=34  Score=25.49  Aligned_cols=19  Identities=26%  Similarity=0.291  Sum_probs=11.9

Q ss_pred             hHHHHHHHHHHHHHHHHHH
Q 032308            2 LSRIRQALQWLSFLLFISQ   20 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~   20 (143)
                      +++||....+|+++|.++|
T Consensus         1 L~kIR~r~~lLi~vIglAL   19 (145)
T PF13623_consen    1 LQKIRQRGGLLIIVIGLAL   19 (145)
T ss_pred             ChhHhhcchHHHHHHHHHH
Confidence            5789997665555444443


No 28 
>PTZ00257 Glycoprotein GP63 (leishmanolysin); Provisional
Probab=32.25  E-value=42  Score=31.00  Aligned_cols=38  Identities=21%  Similarity=0.267  Sum_probs=25.0

Q ss_pred             CCeEEEEeccCCCCCccCCCCeEEEEEee-----cCCCCCCCCCCCCceEEeC--HHHHHH
Q 032308           74 GRQYLVRCISASEPGTCEPEQTIQIRIVD-----YALQLESTPSVSGTTIVLS--ETAFRT  127 (143)
Q Consensus        74 G~c~~V~c~~~~~~~~C~~g~sV~V~V~D-----~Cp~c~~~~~~~~~~lDLS--~~AF~~  127 (143)
                      +.|++|+|.+        +.+++.|++.+     .||+        +..++++  ..+|.+
T Consensus       507 ~~C~~v~C~~--------~~~t~sV~v~G~~~w~~Cp~--------G~~I~~~~~~~~f~~  551 (622)
T PTZ00257        507 ALCANVMCDT--------AARTYSVQVRGSSGYVACTP--------GESIDLATLSAAFVE  551 (622)
T ss_pred             CEEEEEECCC--------CCCEEEEEEEeCCCEEECCC--------CCeEccCCCCccccC
Confidence            7899999973        23678888774     4654        3567775  345653


No 29 
>PF12071 DUF3551:  Protein of unknown function (DUF3551);  InterPro: IPR021937  This family of proteins is functionally uncharacterised. This protein is found in bacteria. Proteins in this family are typically between 79 to 104 amino acids in length. This protein has a single completely conserved residue C that may be functionally important. 
Probab=31.23  E-value=1.2e+02  Score=20.54  Aligned_cols=6  Identities=50%  Similarity=1.453  Sum_probs=3.4

Q ss_pred             CCCc-cc
Q 032308           42 PTTC-YG   47 (143)
Q Consensus        42 ~GaC-~g   47 (143)
                      +|.| |.
T Consensus        42 ~g~C~y~   48 (82)
T PF12071_consen   42 PGDCSYS   48 (82)
T ss_pred             CccCCcC
Confidence            4567 54


No 30 
>PRK02710 plastocyanin; Provisional
Probab=30.90  E-value=70  Score=22.60  Aligned_cols=16  Identities=25%  Similarity=0.295  Sum_probs=9.4

Q ss_pred             ChHHHHHHHHHHHHHH
Q 032308            1 MLSRIRQALQWLSFLL   16 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~   16 (143)
                      |..|.|..+..+|+++
T Consensus         1 ~~~~~~~~~~~~~~~~   16 (119)
T PRK02710          1 MAKRLRSIAAALVAVV   16 (119)
T ss_pred             CchhHHHHHHHHHHHH
Confidence            5667776666555443


No 31 
>PRK13165 cytochrome c-type biogenesis protein CcmE; Reviewed
Probab=29.53  E-value=36  Score=26.08  Aligned_cols=36  Identities=11%  Similarity=-0.066  Sum_probs=15.7

Q ss_pred             hHHHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeC
Q 032308            2 LSRIRQALQWLSFLLFISQLICNTSFADVGTAARYG   37 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~   37 (143)
                      ..|-||++.++++++.++++..-+-.+.+...+||-
T Consensus         3 ~~~~rRl~~~~~~~~~~~~a~~L~l~al~~n~~yF~   38 (160)
T PRK13165          3 PRRKKRLWLACAVLAGLALTIGLVLYALRSNIDLFY   38 (160)
T ss_pred             ccchhhHHHHHHHHHHHHHHHHHHHHHHhhCccEEe
Confidence            345566544444444343333223334444455543


No 32 
>PF08664 YcbB:  YcbB domain;  InterPro: IPR013972  YcbB is a DNA-binding protein []. 
Probab=28.08  E-value=37  Score=25.24  Aligned_cols=12  Identities=33%  Similarity=0.490  Sum_probs=9.9

Q ss_pred             ChHHHHHHHHHH
Q 032308            1 MLSRIRQALQWL   12 (143)
Q Consensus         1 ~~~~~~~~~~~~   12 (143)
                      |-|||||+....
T Consensus        67 ~EQRIRRai~~a   78 (134)
T PF08664_consen   67 IEQRIRRAIKQA   78 (134)
T ss_pred             HHHHHHHHHHHH
Confidence            569999998883


No 33 
>PF04202 Mfp-3:  Foot protein 3;  InterPro: IPR007328 Mytilus foot protein-3 (Mfp-3) is a highly polymorphic protein family located in the byssal adhesive plaques of blue mussels.
Probab=27.39  E-value=51  Score=21.78  Aligned_cols=9  Identities=22%  Similarity=0.312  Sum_probs=4.6

Q ss_pred             EEEeCCCCC
Q 032308           33 AARYGPPFL   41 (143)
Q Consensus        33 aT~Y~~~~~   41 (143)
                      +-+|+|.+.
T Consensus        25 g~~y~p~y~   33 (71)
T PF04202_consen   25 GYYYYPGYN   33 (71)
T ss_pred             ccccCCCCC
Confidence            345666543


No 34 
>PF08194 DIM:  DIM protein;  InterPro: IPR013172 Drosophila immune-induced molecules (DIMs) are short proteins induced during the immune response of Drosophila []. This entry includes DIMs 1 to 4 and DIM23.
Probab=26.85  E-value=73  Score=18.46  Aligned_cols=14  Identities=14%  Similarity=0.083  Sum_probs=6.0

Q ss_pred             hhhccCCceeeEEE
Q 032308           22 ICNTSFADVGTAAR   35 (143)
Q Consensus        22 ~~~~a~~~~G~aT~   35 (143)
                      ++++....-|+.+-
T Consensus        15 l~~a~~~~pG~ViI   28 (36)
T PF08194_consen   15 LAAAVPATPGNVII   28 (36)
T ss_pred             HHhcccCCCCeEEE
Confidence            33333343555543


No 35 
>PF04149 DUF397:  Domain of unknown function (DUF397);  InterPro: IPR007278 The function of this family is unknown. It has been suggested that some members of this family are regulators of transcription.
Probab=25.88  E-value=1.7e+02  Score=18.12  Aligned_cols=36  Identities=14%  Similarity=0.251  Sum_probs=25.6

Q ss_pred             CCeEEEEeccCCCCCccCCCCeEEEEEee-cCCCCCCCCCCCCceEEeCHHHHHHhh
Q 032308           74 GRQYLVRCISASEPGTCEPEQTIQIRIVD-YALQLESTPSVSGTTIVLSETAFRTIA  129 (143)
Q Consensus        74 G~c~~V~c~~~~~~~~C~~g~sV~V~V~D-~Cp~c~~~~~~~~~~lDLS~~AF~~ia  129 (143)
                      |.|+||.-.         ++  . |-|-| +-|        ....|-+++.+|..+-
T Consensus        15 ~~CVEva~~---------~~--~-v~vRDSk~p--------~~~~L~~t~~eW~aFl   51 (56)
T PF04149_consen   15 GNCVEVARL---------PG--G-VAVRDSKDP--------DGPVLTFTPAEWAAFL   51 (56)
T ss_pred             CCcEEEEee---------cc--e-EEEecCCCC--------CCCEEEeCHHHHHHHH
Confidence            889999743         12  2 66767 344        3578999999999863


No 36 
>PRK10095 ribonuclease I; Provisional
Probab=25.74  E-value=59  Score=26.83  Aligned_cols=41  Identities=22%  Similarity=0.209  Sum_probs=23.1

Q ss_pred             ChHHHHHHHHHHHHHHHHHHHhhhccC-----CceeeEEEeCC--CCCCCCc
Q 032308            1 MLSRIRQALQWLSFLLFISQLICNTSF-----ADVGTAARYGP--PFLPTTC   45 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~a~-----~~~G~aT~Y~~--~~~~GaC   45 (143)
                      |.-|.|+++.+.|+++    ++++.+.     ...|...||--  ++.++-|
T Consensus         1 ~~~~~~~~~~~~~~~~----~~~~~~~~~~~~~~~g~fd~YvLALSWqP~fC   48 (268)
T PRK10095          1 MKAFWRNAALLAVSLL----PFSSANAVALQAKQYGDFDRYVLALSWQTGFC   48 (268)
T ss_pred             CchHHHHHHHHHHHHh----hhhhhhccCCCCCcCCCcceEEEEEeeCHHHH
Confidence            6667777776655553    2333332     35677777762  2345555


No 37 
>PF07803 GSG-1:  GSG1-like protein;  InterPro: IPR012478 This family contains sequences bearing similarity to a region of GSG1 (Q9Z1H7 from SWISSPROT), a protein specifically expressed in testicular germ cells []. It is possible that over expression of the human homologue may be involved in tumourigenesis of human testicular germ cell tumours []. The region in question has four highly conserved cysteine residues. 
Probab=25.53  E-value=89  Score=22.81  Aligned_cols=20  Identities=30%  Similarity=0.272  Sum_probs=10.2

Q ss_pred             ChHHHHHHHHHHHHHHHHHH
Q 032308            1 MLSRIRQALQWLSFLLFISQ   20 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~   20 (143)
                      |.+|=|.+|.++|.++.++|
T Consensus         2 ~sr~~Ra~Ls~~ln~LAL~~   21 (118)
T PF07803_consen    2 MSRRQRALLSLILNLLALAF   21 (118)
T ss_pred             cchhhHHHHHHHHHHHHHHH
Confidence            34555556666554443333


No 38 
>PHA02945 interferon resistance protein; Provisional
Probab=25.31  E-value=87  Score=21.71  Aligned_cols=21  Identities=10%  Similarity=0.284  Sum_probs=17.6

Q ss_pred             CCeEEEEEeecCCCCCCCCCCCCceEEeC
Q 032308           93 EQTIQIRIVDYALQLESTPSVSGTTIVLS  121 (143)
Q Consensus        93 g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS  121 (143)
                      |++|+++|...=|.        .+|+|||
T Consensus        60 GqkvV~KVirVd~~--------kg~IDlS   80 (88)
T PHA02945         60 GKTVKVKVIRVDYT--------KGYIDVN   80 (88)
T ss_pred             CCEEEEEEEEECCC--------CCEEEeE
Confidence            78999999888774        6799997


No 39 
>PF08525 OapA_N:  Opacity-associated protein A N-terminal motif;  InterPro: IPR013731 This domain is found in the Haemophilus influenzae opacity-associated protein (OapA). It is required for efficient nasopharyngeal mucosal colonisation, and its expression is associated with a distinctive transparent colony phenotype. OapA is thought to be a secreted protein, and its expression exhibits high-frequency phase variation [, ]. This motif occurs at the N terminus of these proteins. It contains a conserved histidine followed by a run of hydrophobic residues.  Many of the proteins in this entry are unassigned peptidases belonging to MEROPS peptidase family M23B. 
Probab=25.21  E-value=1e+02  Score=16.82  Aligned_cols=15  Identities=33%  Similarity=0.357  Sum_probs=8.3

Q ss_pred             HHHHHHHHHHHHHHH
Q 032308            6 RQALQWLSFLLFISQ   20 (143)
Q Consensus         6 ~~~~~~~~~~~~~~~   20 (143)
                      ||.+..++.++++.+
T Consensus        11 r~~l~~l~~v~l~ll   25 (30)
T PF08525_consen   11 RRALIALSAVVLVLL   25 (30)
T ss_pred             HHHHHHHHHHHHHHH
Confidence            556666555555533


No 40 
>PF07610 DUF1573:  Protein of unknown function (DUF1573);  InterPro: IPR011467 These hypothetical proteins from bacteria, such as Rhodopirellula baltica, Bacteroides thetaiotaomicron and Porphyromonas gingivalis, share a region of conserved sequence towards their N termini.
Probab=25.18  E-value=84  Score=18.36  Aligned_cols=36  Identities=25%  Similarity=0.264  Sum_probs=20.2

Q ss_pred             EEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhcCCCceEEEEE
Q 032308           96 IQIRIVDYALQLESTPSVSGTTIVLSETAFRTIANSTATLINVEF  140 (143)
Q Consensus        96 V~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~w  140 (143)
                      -.+.|.|.=++|.|      ...+++.   +.|++-..|.|.|+|
T Consensus        10 ~~L~I~~v~tsCgC------t~~~~~~---~~i~PGes~~i~v~y   45 (45)
T PF07610_consen   10 SPLVITDVQTSCGC------TTAEYSK---KPIAPGESGKIKVTY   45 (45)
T ss_pred             CcEEEEEeeEccCC------EEeeCCc---ceECCCCEEEEEEEC
Confidence            34555665566654      2333333   336666678887776


No 41 
>PRK15260 fimbrial protein SteF; Provisional
Probab=25.13  E-value=77  Score=24.15  Aligned_cols=40  Identities=23%  Similarity=0.203  Sum_probs=28.2

Q ss_pred             HHHHHHHHHHHHHHHHHHhhhccCCceeeEEEeCCCCCCCCc
Q 032308            4 RIRQALQWLSFLLFISQLICNTSFADVGTAARYGPPFLPTTC   45 (143)
Q Consensus         4 ~~~~~~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~~~~~~GaC   45 (143)
                      ||-|..+ .+++.+++|++...+.+..|+.+|.|. .....|
T Consensus         3 ~~~~~~~-~~~~~~~~~~~~~~~~~~~g~I~F~G~-Ii~~~C   42 (178)
T PRK15260          3 RIFQTAG-HLIGGVMLWAVCNTLPAATPNVHYSGK-LVAGAC   42 (178)
T ss_pred             chhhcch-HHHHHHHHHhcccccccCCCEEEEEEE-EEeCCc
Confidence            5655544 356677777777777788899999884 334589


No 42 
>PRK09474 malE maltose ABC transporter periplasmic protein; Reviewed
Probab=25.00  E-value=1.2e+02  Score=25.02  Aligned_cols=35  Identities=11%  Similarity=0.222  Sum_probs=24.3

Q ss_pred             HHHHHHHHHHHHHHHHHHhhhc--cCCceeeEEEeCC
Q 032308            4 RIRQALQWLSFLLFISQLICNT--SFADVGTAARYGP   38 (143)
Q Consensus         4 ~~~~~~~~~~~~~~~~~~~~~~--a~~~~G~aT~Y~~   38 (143)
                      .|||.+..+++++.+.++++..  +....++.|++..
T Consensus         2 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~w~~   38 (396)
T PRK09474          2 KIKKGLRTLALSALATLMFSASALAKIEEGKLVIWIN   38 (396)
T ss_pred             cHHHHHHHHHHHHHHHHHHhcccccccCCCeEEEEEC
Confidence            3677888877788777787622  3445678888863


No 43 
>PRK11901 hypothetical protein; Reviewed
Probab=25.00  E-value=63  Score=27.57  Aligned_cols=25  Identities=24%  Similarity=0.021  Sum_probs=15.8

Q ss_pred             HHHHHHHHHHHHHHHHHhhhccCCc
Q 032308            5 IRQALQWLSFLLFISQLICNTSFAD   29 (143)
Q Consensus         5 ~~~~~~~~~~~~~~~~~~~~~a~~~   29 (143)
                      =|||+|.-+=++||+||+..+..+.
T Consensus        34 SRQh~MiGiGilVLlLLIi~IgSAL   58 (327)
T PRK11901         34 SRQHMMIGIGILVLLLLIIAIGSAL   58 (327)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHhhhc
Confidence            4888887666666666665554443


No 44 
>PF04535 DUF588:  Domain of unknown function (DUF588);  InterPro: IPR006702 This family of plant proteins contains a domain that may have a catalytic activity. It has a conserved arginine and aspartate that could form an active site. These proteins are predicted to contain 3 or 4 transmembrane helices.
Probab=24.34  E-value=1.4e+02  Score=21.71  Aligned_cols=37  Identities=16%  Similarity=0.022  Sum_probs=26.1

Q ss_pred             ChHHHHHHHHHHHHHHHHHHHhhhccCC----ceeeEEEeC
Q 032308            1 MLSRIRQALQWLSFLLFISQLICNTSFA----DVGTAARYG   37 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~a~~----~~G~aT~Y~   37 (143)
                      +.+.+.|.+++.+.++.++++.+.....    ...++.|.+
T Consensus         5 ~~~l~LR~~~~~~sl~a~~vm~t~~qt~~~~~~~~~~~f~~   45 (149)
T PF04535_consen    5 IASLVLRLLAFVLSLAALAVMATNKQTVSVFSIQFTAKFSD   45 (149)
T ss_pred             hhhHHHHHHHHHHHHHHHHHHHhcCCcceeeccccceeecc
Confidence            3578899999988888888777665542    235666654


No 45 
>COG1930 CbiN ABC-type cobalt transport system, periplasmic component [Inorganic ion transport and metabolism]
Probab=23.64  E-value=1.1e+02  Score=21.46  Aligned_cols=29  Identities=21%  Similarity=0.305  Sum_probs=15.4

Q ss_pred             HHHHHHHHHHHHHhhhccCCceeeEEEeCCCC
Q 032308            9 LQWLSFLLFISQLICNTSFADVGTAARYGPPF   40 (143)
Q Consensus         9 ~~~~~~~~~~~~~~~~~a~~~~G~aT~Y~~~~   40 (143)
                      +.++++.+++++++...+.-   +.-+|++.+
T Consensus         7 ~~ll~i~~i~~l~li~~~~~---~~ge~gGaD   35 (97)
T COG1930           7 LNLLAIGIILALPLIPFSFV---TDGEFGGAD   35 (97)
T ss_pred             HHHHHHHHHHHHHHHHheec---ccccccCCc
Confidence            34444555555555555544   444567653


No 46 
>PRK10081 entericidin B membrane lipoprotein; Provisional
Probab=23.19  E-value=1.2e+02  Score=18.76  Aligned_cols=17  Identities=12%  Similarity=0.325  Sum_probs=7.7

Q ss_pred             HHHHHHHHHHHHHHHHh
Q 032308            6 RQALQWLSFLLFISQLI   22 (143)
Q Consensus         6 ~~~~~~~~~~~~~~~~~   22 (143)
                      +|.+.+++.++++++++
T Consensus         3 Kk~i~~i~~~l~~~~~l   19 (48)
T PRK10081          3 KKTIAAIFSVLVLSTVL   19 (48)
T ss_pred             HHHHHHHHHHHHHHHHH
Confidence            44444444444444443


No 47 
>PF13624 SurA_N_3:  SurA N-terminal domain; PDB: 3NRK_A.
Probab=22.70  E-value=28  Score=25.01  Aligned_cols=16  Identities=31%  Similarity=0.449  Sum_probs=0.0

Q ss_pred             ChHHHHHHHHHHHHHH
Q 032308            1 MLSRIRQALQWLSFLL   16 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~   16 (143)
                      |++.||++.+++.+++
T Consensus         1 Ml~~~r~~~~~~~~~~   16 (154)
T PF13624_consen    1 MLRFIRKNSKVFKILI   16 (154)
T ss_dssp             ----------------
T ss_pred             CccccccchhhhhhhH
Confidence            8899999876544333


No 48 
>PF05887 Trypan_PARP:  Procyclic acidic repetitive protein (PARP);  InterPro: IPR008882 This family consists of several Trypanosoma brucei procyclic acidic repetitive protein (PARP) like sequences. The procyclic acidic repetitive protein (parp) genes of T. brucei encode a small family of abundant surface proteins whose expression is restricted to the procyclic form of the parasite. They are found at two unlinked loci, parpA and parpB; transcription of both loci is developmentally regulated [].; GO: 0016020 membrane; PDB: 2X34_B 2X32_B.
Probab=22.26  E-value=29  Score=26.02  Aligned_cols=19  Identities=32%  Similarity=0.424  Sum_probs=0.0

Q ss_pred             HHHHHHHHHHHHHHHhhhc
Q 032308            7 QALQWLSFLLFISQLICNT   25 (143)
Q Consensus         7 ~~~~~~~~~~~~~~~~~~~   25 (143)
                      |||-+|-+|++++.||+..
T Consensus         4 r~l~~LavLL~~A~Lfag~   22 (143)
T PF05887_consen    4 RHLCLLAVLLFGAALFAGV   22 (143)
T ss_dssp             -------------------
T ss_pred             ccccccccccccccccccc
Confidence            3444444455555555443


No 49 
>PRK15216 putative fimbrial biosynthesis regulatory protein; Provisional
Probab=21.61  E-value=1.8e+02  Score=24.89  Aligned_cols=51  Identities=22%  Similarity=0.203  Sum_probs=30.9

Q ss_pred             HHHHHHHHHHhhhccCCceeeEEEeC--------------------CCCCCCCc-ccCCCCCCCCCCeEEEe
Q 032308           12 LSFLLFISQLICNTSFADVGTAARYG--------------------PPFLPTTC-YGNDPTQFPSSNLFAAA   62 (143)
Q Consensus        12 ~~~~~~~~~~~~~~a~~~~G~aT~Y~--------------------~~~~~GaC-~g~~~~~~p~~~~iaA~   62 (143)
                      +++++++.|.+...-.+=.|+.|+-.                    ..+....| ..+.-++..+++.|+.+
T Consensus         4 ~~l~~~m~~~~~~~yaac~~~it~~~~~~i~~d~~~l~~~q~~~~~~~f~d~~c~~t~~vt~~~~sd~ivg~   75 (340)
T PRK15216          4 LLFLLMMMQFTQLGYAACNATLTNTKDYTIQSDSLMLGGEESAIITNGFTDANCSNSDVVTKLETSDHIIGM   75 (340)
T ss_pred             hHHHHHHHHHcccchhheeeEEeeccceEEecceEEeccceeeEeeccccccccccCceeeccCccceEEee
Confidence            45566666665544455566666533                    12345788 65555666678888887


No 50 
>cd00927 Cyt_c_Oxidase_VIc Cytochrome c oxidase subunit VIc. Cytochrome c oxidase (CcO), the terminal oxidase in the respiratory chains of eukaryotes and most bacteria, is a multi-chain transmembrane protein located in the inner membrane of mitochondria and the cell membrane of prokaryotes. It catalyzes the reduction of O2 and simultaneously pumps protons across the membrane. The number of subunits varies from three to five in bacteria and up to 13 in mammalian mitochondria. Subunits I, II, and III of mammalian CcO are encoded within the mitochondrial genome and the remaining 10 subunits are encoded within the nuclear genome. The VIc subunit is found only in eukaryotes and its specific function remains unclear. It has been reported that the relative concentrations of some nuclear encoded CcO subunits, including subunit VIc, compared to those of the mitochondrial encoded subunits, are altered significantly during the progression of prostate cancer.
Probab=21.49  E-value=1.4e+02  Score=19.73  Aligned_cols=18  Identities=28%  Similarity=0.172  Sum_probs=12.6

Q ss_pred             hHHHHHHHHHHHHHHHHH
Q 032308            2 LSRIRQALQWLSFLLFIS   19 (143)
Q Consensus         2 ~~~~~~~~~~~~~~~~~~   19 (143)
                      .+|||+++.+.+++.+.+
T Consensus        12 ~~~l~~~l~~a~~lsl~~   29 (70)
T cd00927          12 ASRIKRHLIVAFVLSLGA   29 (70)
T ss_pred             HHHHHHHHHHHHHHHHHH
Confidence            478999988866555433


No 51 
>PF01623 Carla_C4:  Carlavirus putative nucleic acid binding protein;  InterPro: IPR002568 This family of carlavirus nucleic acid binding proteins includes a motif for a potential C-4 type zinc finger this has four highly conserved cysteine residues and is a conserved feature of the carlaviruses 3' terminal ORF []. These proteins may function as viral transcriptional regulators. The carlavirus family includes Garlic latent virus and Potato virus S and Potato virus M, these viruses are positive strand, ssRNA with no DNA stage.; GO: 0003676 nucleic acid binding, 0006355 regulation of transcription, DNA-dependent
Probab=20.89  E-value=40  Score=23.55  Aligned_cols=10  Identities=40%  Similarity=0.663  Sum_probs=8.5

Q ss_pred             cccCCeEEEE
Q 032308           71 ASCGRQYLVR   80 (143)
Q Consensus        71 ~~CG~c~~V~   80 (143)
                      ..|-+||+|.
T Consensus        54 gRC~RCyRv~   63 (91)
T PF01623_consen   54 GRCHRCYRVY   63 (91)
T ss_pred             CCCCCCeeec
Confidence            4699999996


No 52 
>PRK10877 protein disulfide isomerase II DsbC; Provisional
Probab=20.81  E-value=1.4e+02  Score=23.67  Aligned_cols=16  Identities=13%  Similarity=0.000  Sum_probs=12.6

Q ss_pred             CCCeEEEEEee-cCCCC
Q 032308           92 PEQTIQIRIVD-YALQL  107 (143)
Q Consensus        92 ~g~sV~V~V~D-~Cp~c  107 (143)
                      +++.+.+..+| .||.|
T Consensus       106 ~~k~~I~vFtDp~CpyC  122 (232)
T PRK10877        106 QEKHVITVFTDITCGYC  122 (232)
T ss_pred             CCCEEEEEEECCCChHH
Confidence            35677777899 89997


No 53 
>PF13453 zf-TFIIB:  Transcription factor zinc-finger
Probab=20.60  E-value=1.6e+02  Score=16.75  Aligned_cols=23  Identities=13%  Similarity=0.187  Sum_probs=15.3

Q ss_pred             EEeecCCCCCCCCCCCCceEEeCHHHHHHhh
Q 032308           99 RIVDYALQLESTPSVSGTTIVLSETAFRTIA  129 (143)
Q Consensus        99 ~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia  129 (143)
                      ..+|.||.|      .+  +=|....|+++.
T Consensus        17 ~~id~C~~C------~G--~W~d~~el~~~~   39 (41)
T PF13453_consen   17 VEIDVCPSC------GG--IWFDAGELEKLL   39 (41)
T ss_pred             EEEEECCCC------Ce--EEccHHHHHHHH
Confidence            467999987      23  445666777653


No 54 
>PF13462 Thioredoxin_4:  Thioredoxin; PDB: 3FEU_A 3HZ8_A 3DVW_A 3A3T_E 3GMF_A 1Z6M_A 3GYK_C 3BCK_A 3BD2_A 3BCI_A ....
Probab=20.28  E-value=53  Score=23.29  Aligned_cols=41  Identities=10%  Similarity=0.106  Sum_probs=23.3

Q ss_pred             CCeEEEEEee-cCCCCCCCCCCCCceEEeCHHHHHHhhc-CCCceEEEEEEEC
Q 032308           93 EQTIQIRIVD-YALQLESTPSVSGTTIVLSETAFRTIAN-STATLINVEFQQV  143 (143)
Q Consensus        93 g~sV~V~V~D-~Cp~c~~~~~~~~~~lDLS~~AF~~ia~-~~~G~i~V~w~~V  143 (143)
                      .+.+++...| .||.|      ..    +.+...+.+.. .+.|.|.+.|+.+
T Consensus        12 a~~~v~~f~d~~Cp~C------~~----~~~~~~~~~~~~i~~~~v~~~~~~~   54 (162)
T PF13462_consen   12 APITVTEFFDFQCPHC------AK----FHEELEKLLKKYIDPGKVKFVFRPV   54 (162)
T ss_dssp             TSEEEEEEE-TTSHHH------HH----HHHHHHHHHHHHTTTTTEEEEEEES
T ss_pred             CCeEEEEEECCCCHhH------HH----HHHHHhhhhhhccCCCceEEEEEEc
Confidence            3455555677 89997      22    33333333333 2578888888764


No 55 
>COG3838 VirB2 Type IV secretory pathway, VirB2 components (pilins) [Intracellular trafficking and secretion]
Probab=20.14  E-value=1.1e+02  Score=21.96  Aligned_cols=28  Identities=29%  Similarity=0.210  Sum_probs=15.5

Q ss_pred             ChHHHHHHHHHHHHHHHHHHHhhhccCC
Q 032308            1 MLSRIRQALQWLSFLLFISQLICNTSFA   28 (143)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~a~~   28 (143)
                      |.+|||..+..+++.+.+.++....+.+
T Consensus         4 l~~~i~~~~a~~~~a~al~l~~~~~~~~   31 (108)
T COG3838           4 LSSRIRPAIAALIVAVALLLLAAFVAPA   31 (108)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHhccccc
Confidence            3578888888544444443444444333


No 56 
>TIGR02645 ARCH_P_rylase putative thymidine phosphorylase. Members of this family are closely related to characterized examples of thymidine phosphorylase (EC 2.4.2.4) and pyrimidine nucleoside phosphorylase (RC 2.4.2.2). Most examples are found in the archaea, but other examples in Legionella pneumophila str. Paris and Rhodopseudomonas palustris CGA009.
Probab=20.08  E-value=3.5e+02  Score=24.39  Aligned_cols=51  Identities=20%  Similarity=0.135  Sum_probs=35.7

Q ss_pred             cCCeEEEEeccCCCCCccCCCCeEEEEEeecCCCCCCCCCCCCceEEeCHHHHHHhhcCCCceEEEE
Q 032308           73 CGRQYLVRCISASEPGTCEPEQTIQIRIVDYALQLESTPSVSGTTIVLSETAFRTIANSTATLINVE  139 (143)
Q Consensus        73 CG~c~~V~c~~~~~~~~C~~g~sV~V~V~D~Cp~c~~~~~~~~~~lDLS~~AF~~ia~~~~G~i~V~  139 (143)
                      =+..++|+.          ++++++..|++.=.-      -.++.+-||..+|++|.-...-.|.|.
T Consensus        29 ~~~rv~v~~----------~~~~~~a~~~~~~~~------~~~~~~gl~~~~~~~l~~~~g~~v~v~   79 (493)
T TIGR02645        29 PQDRVEVRI----------GGKSLIAILVGSDTL------VEMGEIGLSVSAVETFMAREGDIVTVT   79 (493)
T ss_pred             cCCeEEEEe----------CCEEEEEEEeccccc------ccCCeeeccHHHHHHcCCCCCCEEEEe
Confidence            377888884          367898888763111      246789999999999966554446553


Done!