Query         006408
Match_columns 646
No_of_seqs    363 out of 2114
Neff          5.7 
Searched_HMMs 46136
Date          Thu Mar 28 22:52:04 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/006408.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/006408hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PLN03133 beta-1,3-galactosyltr 100.0  1E-130  2E-135 1100.9  52.2  521  101-646   103-636 (636)
  2 KOG2287 Galactosyltransferases 100.0 9.2E-61   2E-65  512.1  28.5  333  306-646     5-349 (349)
  3 PLN03193 beta-1,3-galactosyltr 100.0 1.1E-48 2.3E-53  418.6  19.6  240  345-610   103-355 (408)
  4 PF01762 Galactosyl_T:  Galacto 100.0 7.8E-44 1.7E-48  351.2  17.3  183  413-597     1-190 (195)
  5 PTZ00210 UDP-GlcNAc-dependent  100.0 2.3E-35 4.9E-40  312.2  19.9  232  387-638    73-358 (382)
  6 KOG2288 Galactosyltransferases 100.0 6.1E-34 1.3E-38  285.8  17.7  241  396-644     8-271 (274)
  7 smart00276 GLECT Galectin. Gal 100.0 8.6E-30 1.9E-34  236.5  16.3  127  157-367     1-127 (128)
  8 PF00337 Gal-bind_lectin:  Gala 100.0 2.2E-29 4.9E-34  234.1  15.2  132  156-367     1-133 (133)
  9 cd00070 GLECT Galectin/galacto 100.0 2.8E-29 6.1E-34  232.5  15.3  127  156-366     1-127 (127)
 10 KOG3587 Galectin, galactose-bi  99.9 8.9E-25 1.9E-29  207.1  15.2  137  155-369     4-140 (143)
 11 PF02434 Fringe:  Fringe-like;   99.7 4.2E-18   9E-23  175.7  10.4  183  400-597     7-198 (252)
 12 KOG2246 Galactosyltransferases  99.6 2.3E-15 4.9E-20  162.6  12.6  165  397-597    89-264 (364)
 13 PLN03153 hypothetical protein;  99.1 9.8E-10 2.1E-14  121.9  14.9  173  399-597   122-308 (537)
 14 KOG3708 Uncharacterized conser  97.7 0.00018 3.9E-09   79.7  10.4  195  400-636    27-244 (681)
 15 PF13641 Glyco_tranf_2_3:  Glyc  95.3    0.22 4.7E-06   49.2  11.9  184  401-597     3-198 (228)
 16 TIGR03472 HpnI hopanoid biosyn  94.5     1.3 2.7E-05   48.4  16.3  158  432-597    70-241 (373)
 17 cd02520 Glucosylceramide_synth  94.0    0.63 1.4E-05   45.4  11.3  133  432-597    30-165 (196)
 18 PF01755 Glyco_transf_25:  Glyc  93.8    0.96 2.1E-05   44.5  12.4   99  403-512     4-107 (200)
 19 cd04184 GT2_RfbC_Mx_like Myxoc  93.1     7.5 0.00016   37.3  17.1  154  433-597    32-189 (202)
 20 cd04196 GT_2_like_d Subfamily   92.5     2.4 5.2E-05   40.9  12.7  170  416-595    11-190 (214)
 21 cd04192 GT_2_like_e Subfamily   91.8     6.5 0.00014   38.3  15.1  131  459-596    55-195 (229)
 22 cd04186 GT_2_like_c Subfamily   91.5     6.1 0.00013   36.1  13.7   83  485-597    70-153 (166)
 23 cd04187 DPM1_like_bac Bacteria  91.3       2 4.3E-05   40.9  10.6  132  433-570    30-164 (181)
 24 cd02510 pp-GalNAc-T pp-GalNAc-  90.6      12 0.00026   39.1  16.5  116  480-597    74-213 (299)
 25 cd06423 CESA_like CESA_like is  90.3     3.4 7.3E-05   37.3  10.7   92  479-570    68-171 (180)
 26 PRK11204 N-glycosyltransferase  90.1     7.3 0.00016   42.8  15.0  146  437-597    87-248 (420)
 27 cd06433 GT_2_WfgS_like WfgS an  90.0     7.3 0.00016   36.7  13.2  115  479-597    65-182 (202)
 28 cd06421 CESA_CelA_like CESA_Ce  89.9     1.6 3.5E-05   42.9   8.9  112  481-597    76-199 (234)
 29 PF00535 Glycos_transf_2:  Glyc  89.8       3 6.6E-05   37.7  10.0  154  402-568     3-168 (169)
 30 PF13506 Glyco_transf_21:  Glyc  89.6    0.42   9E-06   47.0   4.3  117  476-597    18-142 (175)
 31 cd06420 GT2_Chondriotin_Pol_N   89.3     7.2 0.00016   36.7  12.5   99  480-597    70-168 (182)
 32 cd06439 CESA_like_1 CESA_like_  89.3      10 0.00022   37.9  14.3  180  400-597    30-217 (251)
 33 cd02525 Succinoglycan_BP_ExoA   89.2      23 0.00051   34.8  16.6  155  432-597    31-196 (249)
 34 cd04185 GT_2_like_b Subfamily   89.2       7 0.00015   37.7  12.5   92  479-597    70-162 (202)
 35 cd06435 CESA_NdvC_like NdvC_li  88.5       8 0.00017   38.3  12.7  113  480-597    73-197 (236)
 36 TIGR03469 HonB hopene-associat  88.4     5.1 0.00011   44.0  12.2  105  489-597   133-250 (384)
 37 PRK14583 hmsR N-glycosyltransf  88.3     8.3 0.00018   43.2  14.0  153  432-597   104-269 (444)
 38 cd06532 Glyco_transf_25 Glycos  88.2     3.1 6.6E-05   38.6   8.8  110  403-571     2-116 (128)
 39 cd04191 Glucan_BSP_ModH Glucan  88.0     6.2 0.00014   41.1  11.9  187  403-597     3-219 (254)
 40 cd06434 GT2_HAS Hyaluronan syn  87.9      12 0.00027   36.8  13.6  157  433-597    29-201 (235)
 41 COG1215 Glycosyltransferases,   87.2      29 0.00063   37.9  17.3  186  399-597    54-253 (439)
 42 cd04195 GT2_AmsE_like GT2_AmsE  86.9     6.7 0.00015   37.7  10.8  150  434-597    31-189 (201)
 43 COG1216 Predicted glycosyltran  85.5      29 0.00063   36.7  15.6  135  458-597    55-208 (305)
 44 cd02526 GT2_RfbF_like RfbF is   84.4      44 0.00095   32.9  17.6  106  489-597    75-192 (237)
 45 PLN02726 dolichyl-phosphate be  83.5      47   0.001   33.5  15.6  111  480-597    84-206 (243)
 46 cd06427 CESA_like_2 CESA_like_  83.5      20 0.00043   36.0  12.8  114  479-597    74-200 (241)
 47 cd04188 DPG_synthase DPG_synth  80.6      20 0.00044   35.0  11.3  154  432-597    30-196 (211)
 48 cd04179 DPM_DPG-synthase_like   80.3      13 0.00027   35.1   9.4  118  447-569    42-167 (185)
 49 PF13632 Glyco_trans_2_3:  Glyc  79.8     7.4 0.00016   37.5   7.8  100  492-597     1-112 (193)
 50 cd06442 DPM1_like DPM1_like re  73.2      33 0.00071   33.4  10.5   89  481-569    70-167 (224)
 51 PF10111 Glyco_tranf_2_2:  Glyc  72.8 1.1E+02  0.0024   32.0  14.8  160  431-597    33-210 (281)
 52 cd06437 CESA_CaSu_A2 Cellulose  71.7      98  0.0021   30.6  13.6  113  480-597    78-201 (232)
 53 PRK10714 undecaprenyl phosphat  71.6      63  0.0014   34.8  13.0  130  432-570    38-174 (325)
 54 PF04646 DUF604:  Protein of un  71.6     5.5 0.00012   41.8   4.6   43  554-597    12-57  (255)
 55 TIGR01556 rhamnosyltran L-rham  69.4      49  0.0011   34.1  11.2  114  480-597    65-189 (281)
 56 PRK14716 bacteriophage N4 adso  68.8      49  0.0011   38.2  11.9  106  489-597   158-277 (504)
 57 PRK05454 glucosyltransferase M  64.7      85  0.0019   37.7  13.2  198  398-605   123-350 (691)
 58 TIGR03030 CelA cellulose synth  59.1   2E+02  0.0043   34.7  15.0  120  472-597   212-346 (713)
 59 PRK11498 bcsA cellulose syntha  56.0 1.4E+02   0.003   37.0  13.0  112  480-597   330-457 (852)
 60 cd02522 GT_2_like_a GT_2_like_  55.9   2E+02  0.0043   27.8  15.6  106  481-597    64-175 (221)
 61 PF00853 Runt:  Runt domain;  I  54.2      16 0.00034   34.5   3.7   31  294-335    87-126 (135)
 62 cd00761 Glyco_tranf_GTA_type G  49.8 1.7E+02  0.0037   25.3  13.8   82  480-595    68-151 (156)
 63 cd02514 GT13_GLCNAC-TI GT13_GL  48.8 1.1E+02  0.0024   33.6   9.8   84  479-568    87-174 (334)
 64 KOG1594 Uncharacterized enzyme  46.4      73  0.0016   34.0   7.5  119  207-365    65-190 (305)
 65 TIGR03111 glyc2_xrt_Gpos1 puta  43.5 5.1E+02   0.011   29.0  14.8  110  479-593   121-250 (439)
 66 KOG3982 Runt and related trans  33.7      40 0.00087   37.2   3.4   30  294-334   184-222 (475)
 67 cd04190 Chitin_synth_C C-termi  31.9      59  0.0013   33.0   4.3  110  488-597    72-208 (244)
 68 cd06438 EpsO_like EpsO protein  30.4 4.7E+02    0.01   24.7  11.1   77  488-567    80-169 (183)
 69 cd06913 beta3GnTL1_like Beta 1  28.9 2.2E+02  0.0048   27.7   7.7   34  481-514    76-109 (219)
 70 COG4092 Predicted glycosyltran  25.6 2.2E+02  0.0049   30.6   7.1   65  448-512    51-117 (346)
 71 COG3306 Glycosyltransferase in  25.2 1.8E+02  0.0038   30.7   6.4  170  403-591     5-192 (255)
 72 PRK11234 nfrB bacteriophage N4  24.9 1.3E+03   0.029   28.1  18.2  156  432-597    93-274 (727)
 73 PHA01631 hypothetical protein   24.1 1.4E+02   0.003   29.8   4.9   65  487-571    69-133 (176)
 74 PF04666 Glyco_transf_54:  N-Ac  21.1 4.9E+02   0.011   28.1   8.9  109  395-505    48-185 (297)

No 1  
>PLN03133 beta-1,3-galactosyltransferase; Provisional
Probab=100.00  E-value=9.8e-131  Score=1100.93  Aligned_cols=521  Identities=39%  Similarity=0.690  Sum_probs=480.5

Q ss_pred             hhHHHHHHHHHHHHHHhHhhhhcccc-c-cccC--CCCCCCCCCCCCcee-cccccccCCCeEEEcCCCCCCCcEEEEEE
Q 006408          101 VLERMADEAWTLGLKAWDEVDKFDVK-E-TVSS--NVYEGKPESCPSWLS-MSGEELANGDRLMFLPCGLAAGSSITVVG  175 (646)
Q Consensus       101 ~~~~~~~~~~~~~~~~~~~~~~~~~~-~-~~~~--~~~~~~~~~cp~sv~-~~~~~~~~~~~~~~lP~GL~~Gs~itV~G  175 (646)
                      .....|.+||+||+.||++|.+++++ . ...+  +..+.++.+||+||+ ++++++.+++|++.|||||++|++|||+|
T Consensus       103 ~~~~~~~~~~~~~~~aw~~~~~~~~~~~~~~~~~~~~~~~~~~~cp~~~~~~~~~~~~~~~~~~~iP~GL~~Gs~ItI~G  182 (636)
T PLN03133        103 QVLPNGVEAIKEAGVAWESLMASVEEEKLGYTNESSLRKSKEKQCPYFLNKMNATELGDSGYKLKIPCGLTQGSSITIIG  182 (636)
T ss_pred             ccCchHHHHHHHHHHHHHHHHHHHHHHhhccccccccccCCCCCCchhhhhcccccccCCceEEecCCcCCCCCEEEEEE
Confidence            36678999999999999999998773 2 2222  223567789999999 69999988899999999999999999999


Q ss_pred             EcCCCcccccchhhhccCCCCcceeeeEEEEecCCcCCCCCCCCeeEEEccccCCCCC-CCCEEEEeccc-CCcccceee
Q 006408          176 TPHYAHQEFLPQLTRRRNGDSLVMVSQFMVELQGLKSVDGEDPPKILHLNPRIKGDWS-HRPVIEHNTCY-RMQWGTAQR  253 (646)
Q Consensus       176 ~p~~~~~~~~~~~~~~~~~~~~~~~~~F~i~L~g~~~~~~~~~~i~LH~NpRl~~d~~-~~pvIv~Nt~~-~~~WG~eeR  253 (646)
                      +|+..+                   ++|+|||+|+...+++++||||||||||++||+ ++|+||||||+ +|+||.|||
T Consensus       183 ~p~~~~-------------------~~F~InL~g~~~~g~~~~~iaLHfNpRf~gd~~t~~~vIV~NT~~~~~~WG~EER  243 (636)
T PLN03133        183 IPDGLL-------------------GNFRIDLTGEPLPGEPDPPIILHYNVRLLGDKITEDPVIVQNTWTAAHDWGEEER  243 (636)
T ss_pred             EeCCCC-------------------CeEEEEEeecCcCCCCCCCEEEEEcCccCCCccccCCEEEeCCCcCCCcccHhhh
Confidence            999754                   499999999876666788999999999999975 79999999999 999999999


Q ss_pred             cCCCCCCCCCCccccchhhhhhccccCccccccccccccccccc-cccCCCCCCCCCCCCCCCeEEEEEEEccceEEEEe
Q 006408          254 CDGLSSKKDDDMLVDGNLRCEKWMRNDVADSKDSKTASWFKRFI-GREQKPEVTWPFPFVEGRLFILTLRAGVEGYHINV  332 (646)
Q Consensus       254 c~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~fPF~~G~~F~lti~~g~egf~v~V  332 (646)
                      |++|+|++|+  +||||++||||+++++.++++++++||++|+| ++++++..+|+|||++|++|++||+||.|||||+|
T Consensus       244 c~~~~~~~~~--~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~lti~~g~egf~v~V  321 (636)
T PLN03133        244 CPSPDPDKNK--KVDDLDQCNKMVGRDDKRVLSTSLHSNGSRRSPMSQEATKARRYFPFKQGYLSVATLRVGTEGIQMTV  321 (636)
T ss_pred             cCCCCccccc--cccchhhhhhhhcccccccccccccccccccccccccccccccCCCCCCCCcEEEEEEecCCEEEEEE
Confidence            9999999995  79999999999999999999999999999998 77889999999999999999999999999999999


Q ss_pred             CCeEEEEeecccCcCcccceEEEEecccceeeeecccCCCCCCCcchhhhhhhhhhhccCCCC-CCCceEEEEEeCCCCC
Q 006408          333 GGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVYATNLPASHPSFSLQRVLEMSSKWKAEPLP-ARPVHLFIGVLSATNH  411 (646)
Q Consensus       333 nG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~a~slP~s~~sf~p~~~~e~~~~~kapp~p-~~~v~LlI~V~Sap~~  411 (646)
                      ||+|+|+|+||+++++|.|++|+|+|||+|+||.+.++|.+|++    .+..+.+.|++||++ +++++|||+|+|+++|
T Consensus       322 nG~H~tsF~yR~~lep~~V~~l~V~GDv~l~SV~a~~~p~~~~~----~~~~d~e~lkAppL~~~~~~~LlI~V~Sap~n  397 (636)
T PLN03133        322 DGKHITSFAYRETLEPWLVSEVRISGDLKLISVLASGLPTSEDS----EHVIDLEALKSPPLSPKKPLDLFIGVFSTANN  397 (636)
T ss_pred             CCeEEEeeeCCCCCCccceeEEEEeCcEEEEEEEeeCCCCCCch----hcccchHHhcCCCCCCCCceEEEEEEeCCccc
Confidence            99999999999998999999999999999999999999999986    577789999999988 5679999999999999


Q ss_pred             HHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCce
Q 006408          412 FAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAA  491 (646)
Q Consensus       412 ~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~ak  491 (646)
                      |+||+|||+|||+...+++..++++||||.+.+..++..|++|+++|+|||++||.|+|+|+|+||++++.|+.+|++++
T Consensus       398 f~rR~AIR~TWg~~~~~~~~~v~~rFvVG~s~n~~l~~~L~~Ea~~ygDIIq~dF~DsY~NLTlKtl~~~~wa~~c~~ak  477 (636)
T PLN03133        398 FKRRMAVRRTWMQYDAVRSGAVAVRFFVGLHKNQMVNEELWNEARTYGDIQLMPFVDYYSLITWKTLAICIFGTEVVSAK  477 (636)
T ss_pred             HHHHHHHHHhhccccccCCCceEEEEEEecCCcHHHHHHHHHHHHHcCCeEEEeeechhhhhHHHHHHHHHHHHhCCCce
Confidence            99999999999998776677899999999999999999999999999999999999999999999999999999888999


Q ss_pred             EEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCcccc--ccceeccccCCCCCCCCCCCCCeEEeCHHHHHHHH
Q 006408          492 YIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRT--GKWAVTYEEWPQEVYPPYANGPGYVISSDIAKFIV  569 (646)
Q Consensus       492 fvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~--sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv  569 (646)
                      ||||+|||+|||+++|+++|+.....+.+|+|++..+.+|+|+  +|||||+++||++.|||||+|+|||||+|+|++|+
T Consensus       478 FilK~DDDvFVnv~~Ll~~L~~~~~~~~Ly~G~v~~~~~PiRd~~sKWYVs~~eyp~~~YPpYasG~gYVlS~Dla~~L~  557 (636)
T PLN03133        478 YVMKTDDDAFVRVDEVLASLKRTNVSHGLLYGLINSDSQPHRNPDSKWYISPEEWPEETYPPWAHGPGYVVSRDIAKEVY  557 (636)
T ss_pred             EEEEcCCceEEcHHHHHHHHHhcCCCCceEEEEeccCCCcccCCCCCCCCCHHHCCCCCCCCCCCcCEEEEcHHHHHHHH
Confidence            9999999999999999999988776778999999999999997  99999999999999999999999999999999999


Q ss_pred             HHhcCCccCCCCCChHHHHHHHHHcCCC-CCcccccCCCcccCCcCCceEEEecCCHHHHHHHHHHhcCC-CCCCCCCC
Q 006408          570 LQHGNQSLRLFKMEDVSMGMWVEQFNST-MTVRYSHSWKFCQYGCMEGYYTAHYQSPRQMICLWDKLSRG-RAHCCNFR  646 (646)
Q Consensus       570 ~~~~~~~l~~f~~EDV~iGi~l~~lgi~-~pV~y~h~~r~c~~~C~~~~it~H~~sP~~M~~lW~~l~~~-~~~Cc~~~  646 (646)
                      .+..+..+++|++||||||+|+++++.. .++.|.|+.++|..+|..++|++|+++|++|+++|++|+++ +++||+++
T Consensus       558 ~~s~s~~l~~f~lEDVyvGi~l~~l~k~gl~v~~~~~~r~~~~~C~~~~i~~H~~sP~eM~~lW~~l~~~~~~~Cc~~~  636 (636)
T PLN03133        558 KRHKEGRLKMFKLEDVAMGIWIAEMKKEGLEVKYENDGRIYNEGCKDGYVVAHYQSPREMLCLWQKLQEGKRATCCGEW  636 (636)
T ss_pred             HhhhhcccCcCChhhHhHHHHHHHhcccCCCceeeCCCcccCCcCCCCeEEEecCCHHHHHHHHHHHhccCCCCccCCC
Confidence            8754567899999999999999876532 35788899999999999999999999999999999999965 59999975


No 2  
>KOG2287 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=100.00  E-value=9.2e-61  Score=512.09  Aligned_cols=333  Identities=34%  Similarity=0.546  Sum_probs=298.9

Q ss_pred             CCCCCCCCCCeEEEEEEEccceEEEEeCCeEEEEeecccCcCcccceEEEEecccceeeeecccCCCCCCCcchhhhhhh
Q 006408          306 TWPFPFVEGRLFILTLRAGVEGYHINVGGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVYATNLPASHPSFSLQRVLEM  385 (646)
Q Consensus       306 ~~~fPF~~G~~F~lti~~g~egf~v~VnG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~a~slP~s~~sf~p~~~~e~  385 (646)
                      .+.+|+..+..|+.++.++.+++++.++++|.++|.++..++.+..++...++.+..+.....+.+.+...+....++. 
T Consensus         5 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l-   83 (349)
T KOG2287|consen    5 EFLFPLLPGKRFVSTLRLVLEGLQISEPLRLLTSFLLLPTIKNCLATGWAFSTPLLLTGDFGSSFPLSFADFQKFFYLL-   83 (349)
T ss_pred             cccccccccchhhhhhhhhheeeeeccccccCCcccccCCCcccccccccccCCccccCcccccccccchhhccChhhh-
Confidence            4679999999999999999999999999999999999998888999999999999888888888888777654433332 


Q ss_pred             hhhhccCCCCCC--CceEEEEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCCh-hHHHHHHHHHhhcCcEE
Q 006408          386 SSKWKAEPLPAR--PVHLFIGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRK-EVNAVLKKEAAFFGDIV  462 (646)
Q Consensus       386 ~~~~kapp~p~~--~v~LlI~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~-~~~~~L~~Eae~ygDII  462 (646)
                          ..|+.|..  +++|+|+|+|+++|++||++||+|||+...+++++++++|+||++.++ +++..|++|++.|||||
T Consensus        84 ----~~p~~~~~~~~~~lLl~V~S~~~~farR~aiR~TW~~~~~v~~~~v~~~FLvG~~~~~~~~~~~l~~Ea~~ygDIi  159 (349)
T KOG2287|consen   84 ----YLPEICDPDRPPELLLLVKSAPDNFARRNAIRKTWGNENNVRGGRVRVLFLVGLPSNEDKLNKLLADEARLYGDII  159 (349)
T ss_pred             ----cCChhhcCCCCceEEEEEecCCCCHHHHHHHHHHhcCccccCCCcEEEEEEecCCCcHHHHHHHHHHHHHHhCCEE
Confidence                23333322  489999999999999999999999999998889999999999998865 57899999999999999


Q ss_pred             EEeecccccchhHHHHHHHhhhhh-cCCceEEEEecCCccccHHHHHHHHhhc-CCCcceEEEeeccCCCcccc--ccce
Q 006408          463 ILPFMDRYELVVLKTIAICEFGVQ-NVTAAYIMKCDDDTFIRVDAVLKEIEGI-FPKRSLYMGNLNLLHRPLRT--GKWA  538 (646)
Q Consensus       463 ~~df~DsY~nLtlKtl~~l~wa~~-~~~akfvmKvDDDtfVnvd~Ll~~L~~~-~~~~~lY~G~v~~~~~P~R~--sKWy  538 (646)
                      ++||.|+|.|+|+||+++++|+.. |++++||||+|||+||++++|+++|++. ++...+|+|.+.....|+|+  +|||
T Consensus       160 ~~df~Dty~nltlKtl~~l~w~~~~cp~akfi~K~DDDvfv~~~~L~~~L~~~~~~~~~~~~G~v~~~~~p~R~~~~Kwy  239 (349)
T KOG2287|consen  160 QVDFEDTYFNLTLKTLAILLWGVSKCPDAKFILKIDDDVFVNPDNLLEYLDKLNDPSSDLYYGRVIQNAPPIRDKTSKWY  239 (349)
T ss_pred             EEecccchhchHHHHHHHHHHHHhcCCcceEEEeccCceEEcHHHHHHHHhccCCCCcceEEEeecccCCCCCCCCCCCc
Confidence            999999999999999999999998 5589999999999999999999999998 78889999999999999997  9999


Q ss_pred             eccccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHc-CCCCCcccccCCC---cccCCcC
Q 006408          539 VTYEEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQF-NSTMTVRYSHSWK---FCQYGCM  614 (646)
Q Consensus       539 Vs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~l-gi~~pV~y~h~~r---~c~~~C~  614 (646)
                      ||+++||++.|||||+|+|||||+++|++|+++  +.+.+++++|||+||+|+++. |+. |+++.+...   .|+.+|.
T Consensus       240 Vp~~~y~~~~YP~Y~sG~gYvis~~~a~~l~~~--s~~~~~~~iEDV~~g~~l~~~~gi~-~~~~~~~~~~~~~~~~~~~  316 (349)
T KOG2287|consen  240 VPESEYPCSVYPPYASGPGYVISGDAARRLLKA--SKHLKFFPIEDVFVGGCLAEDLGIK-PVNHPGFFEIPLSFDPCCY  316 (349)
T ss_pred             cCHHHCCCCCCCCcCCCceeEecHHHHHHHHHH--hcCCCccchHHHHHHHHHHHhcCCC-cccCcccccccccCCCCcc
Confidence            999999999999999999999999999999996  678899999999999999998 877 776655333   3467788


Q ss_pred             CceEEEecCCHHHHHHHHHHhcC-CCCCCCCCC
Q 006408          615 EGYYTAHYQSPRQMICLWDKLSR-GRAHCCNFR  646 (646)
Q Consensus       615 ~~~it~H~~sP~~M~~lW~~l~~-~~~~Cc~~~  646 (646)
                      .+++++|+++|.+|.++|++++. .+..||+.+
T Consensus       317 ~~~~~~H~~~p~e~~~~w~~~~~~~~~~c~~~~  349 (349)
T KOG2287|consen  317 RDLLAVHRLSPNEMIYLWKKLKDLANLKCKNLR  349 (349)
T ss_pred             cceEEEecCCHHHHHHHHHHhhcccccccccCC
Confidence            99999999999999999999997 889999864


No 3  
>PLN03193 beta-1,3-galactosyltransferase; Provisional
Probab=100.00  E-value=1.1e-48  Score=418.60  Aligned_cols=240  Identities=23%  Similarity=0.349  Sum_probs=205.1

Q ss_pred             CcCcccceEEEEecccceeeeecccCCCCCCCcchhhhhhhhhhhccCCCCCCCceEEEEEeCCCCCHHHHHHHHHHhhc
Q 006408          345 GFTLEDATGLAIKGDVDIHSVYATNLPASHPSFSLQRVLEMSSKWKAEPLPARPVHLFIGVLSATNHFAERMAIRKTWMQ  424 (646)
Q Consensus       345 ~~~l~~v~~l~v~GDv~l~sV~a~slP~s~~sf~p~~~~e~~~~~kapp~p~~~v~LlI~V~Sap~~~~rR~aIR~TW~~  424 (646)
                      ++++|.++..+      +.++.+.++|.++++=          .+  +...+++++|+|+|.|+++|++||++||+|||+
T Consensus       103 ~le~el~~~~~------~~~~~~~~~~~~~~~~----------~~--~~~~~~~~~LvIgI~Sap~~~~RR~AIR~TWg~  164 (408)
T PLN03193        103 NLEMELAAARA------AQESILNGSPISEDLK----------KT--QSSGKRRYLMVVGINTAFSSRKRRDSVRATWMP  164 (408)
T ss_pred             HHhHHHHHHHh------hhhhhccCCCcccccc----------cc--CCCCcceEEEEEEEeCCCCCHHHHHHHHHHHcC
Confidence            34677777766      6666778888887741          11  223356799999999999999999999999998


Q ss_pred             cccc-----CCCceEEEEEEeeCC--ChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEec
Q 006408          425 SSKI-----KSSNVVARFFVALNP--RKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCD  497 (646)
Q Consensus       425 ~~~i-----~~~~v~~~FfVG~~~--~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvD  497 (646)
                      ....     ....++++|+||.+.  +..++.+|.+|++.|||||++||+|+|.|||+||+++|+|+.++++++|+||+|
T Consensus       165 ~~~~~~kle~~~gv~vrFVIG~s~~~~~~ldr~Le~Ea~~ygDIL~lDfvDsY~NLT~KTl~~f~wA~~~~dAkF~mK~D  244 (408)
T PLN03193        165 QGEKRKKLEEEKGIIIRFVIGHSATSGGILDRAIEAEDRKHGDFLRLDHVEGYLELSAKTKTYFATAVAMWDADFYVKVD  244 (408)
T ss_pred             CcccccccccCCcEEEEEEeecCCCcchHHHHHHHHHHHHhCCEEEEecccccccchHHHHHHHHHHHHcCCCeEEEEcC
Confidence            6542     136799999999986  568999999999999999999999999999999999999999999999999999


Q ss_pred             CCccccHHHHHHHHhhcCCCcceEEEeeccCCCcccc--ccceeccccC----CCCCCCCCCCCCeEEeCHHHHHHHHHH
Q 006408          498 DDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRT--GKWAVTYEEW----PQEVYPPYANGPGYVISSDIAKFIVLQ  571 (646)
Q Consensus       498 DDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~--sKWyVs~eey----p~~~YPpY~~G~GYVLSrdla~~Iv~~  571 (646)
                      ||+|||+++|+.+|+.......+|+|++..  .|+|+  ++||+++++|    +.+.|||||+|+|||||+|+|+.|+.+
T Consensus       245 DDvfVnv~~L~~~L~~~~~~~rlYiG~m~~--gPvr~~~~~ky~epe~w~~~~~~~~YPpyAsG~gYVlS~DLa~~I~~n  322 (408)
T PLN03193        245 DDVHVNIATLGETLVRHRKKPRVYIGCMKS--GPVLSQKGVRYHEPEYWKFGENGNKYFRHATGQLYAISKDLASYISIN  322 (408)
T ss_pred             CCceEcHHHHHHHHHhcCCCCCEEEEeccc--CccccCCCCcCcCcccccccCccccCCCCCCcceEEehHHHHHHHHhC
Confidence            999999999999998765555799999975  47785  7778888888    568999999999999999999999975


Q ss_pred             hcCCccCCCCCChHHHHHHHHHcCCCCCcccccCCCccc
Q 006408          572 HGNQSLRLFKMEDVSMGMWVEQFNSTMTVRYSHSWKFCQ  610 (646)
Q Consensus       572 ~~~~~l~~f~~EDV~iGi~l~~lgi~~pV~y~h~~r~c~  610 (646)
                        ...++.|++|||+||+|+..++    |+|+|+.+||.
T Consensus       323 --~~~L~~y~~EDV~vG~Wl~~L~----V~~vdd~~fcc  355 (408)
T PLN03193        323 --QHVLHKYANEDVSLGSWFIGLD----VEHIDDRRLCC  355 (408)
T ss_pred             --hhhhcccCcchhhhhhHhccCC----ceeeecccccC
Confidence              4578889999999999997665    66899999985


No 4  
>PF01762 Galactosyl_T:  Galactosyltransferase;  InterPro: IPR002659 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. Glycosyltransferase family 31 (GH31 from CAZY) comprises enzymes with a number of known activities; N-acetyllactosaminide beta-1,3-N-acetylglucosaminyltransferase (2.4.1.149 from EC); beta-1,3-galactosyltransferase (2.4.1 from EC); fucose-specific beta-1,3-N-acetylglucosaminyltransferase (2.4.1 from EC); globotriosylceramide beta-1,3-GalNAc transferase (2.4.1.79 from EC) [, ].; GO: 0008378 galactosyltransferase activity, 0006486 protein glycosylation, 0016020 membrane
Probab=100.00  E-value=7.8e-44  Score=351.16  Aligned_cols=183  Identities=33%  Similarity=0.602  Sum_probs=170.3

Q ss_pred             HHHHHHHHHhhcccccCCCceEEEEEEeeCC--ChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcC-C
Q 006408          413 AERMAIRKTWMQSSKIKSSNVVARFFVALNP--RKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNV-T  489 (646)
Q Consensus       413 ~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~--~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~-~  489 (646)
                      +||++||+||++.....+.+++++|+||.++  +..++..|.+|+++|+|||++||.|+|.|+++||+++++|+.++| +
T Consensus         1 ~rR~~IR~TW~~~~~~~~~~~~~~FvvG~~~~~~~~~~~~l~~E~~~y~Dil~~d~~D~y~nlt~K~~~~~~w~~~~c~~   80 (195)
T PF01762_consen    1 ERRQAIRETWGNQRNFKGVRVKVVFVVGESPNSDSDLQEALQEEAEKYGDILQGDFVDSYRNLTLKTLAGLKWASKHCPN   80 (195)
T ss_pred             ChHHHHHHHHhcccccCCCcEEEEEEEecCCCCcHHHHHHhhhhhhhcCceEeeecccccchhhHHHHHHHHHHHhhCCc
Confidence            5899999999998877778999999999998  778888999999999999999999999999999999999999877 5


Q ss_pred             ceEEEEecCCccccHHHHHHHHhhc--CCCcceEEEeeccCCCcccc--ccceeccccCCCCCCCCCCCCCeEEeCHHHH
Q 006408          490 AAYIMKCDDDTFIRVDAVLKEIEGI--FPKRSLYMGNLNLLHRPLRT--GKWAVTYEEWPQEVYPPYANGPGYVISSDIA  565 (646)
Q Consensus       490 akfvmKvDDDtfVnvd~Ll~~L~~~--~~~~~lY~G~v~~~~~P~R~--sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla  565 (646)
                      ++|++|+|||+|||+++|.++|...  ......++|.+....+|+|+  +|||+++++||.+.|||||+|+||+||+++|
T Consensus        81 ~~~v~k~DDD~~vn~~~l~~~L~~~~~~~~~~~~~g~~~~~~~~~r~~~~kw~v~~~~y~~~~yP~y~~G~~yvls~~~v  160 (195)
T PF01762_consen   81 AKYVLKVDDDVFVNPDRLVSFLKSLKQDPSKNSIYGGCIKNGPPIRDPSSKWYVSEEEYPDDYYPPYCSGGGYVLSSDVV  160 (195)
T ss_pred             hhheeecCcEEEEehHHhhhhhhhcccCccccccccccccCCccccccccCceeeeeecccccCCCcCCCCeEEecHHHH
Confidence            9999999999999999999999987  44566777888888889996  8999999999999999999999999999999


Q ss_pred             HHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          566 KFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       566 ~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +.|+..  +..++++++|||++|+|+.++|++
T Consensus       161 ~~i~~~--~~~~~~~~~eDv~iGi~~~~~~i~  190 (195)
T PF01762_consen  161 KRIYKA--SSHTPFFPLEDVFIGILAEKLGIK  190 (195)
T ss_pred             HHHHHH--hhcCCCCCchHHHHHHHHHHCCCC
Confidence            999997  566799999999999999999987


No 5  
>PTZ00210 UDP-GlcNAc-dependent glycosyltransferase; Provisional
Probab=100.00  E-value=2.3e-35  Score=312.20  Aligned_cols=232  Identities=26%  Similarity=0.308  Sum_probs=191.2

Q ss_pred             hhhccCCCCCCCceEEEEEeCCCCC--HHHHHHHHHHhhcccccC------CCceEEEEEEeeCCCh--hHHHHHHHHHh
Q 006408          387 SKWKAEPLPARPVHLFIGVLSATNH--FAERMAIRKTWMQSSKIK------SSNVVARFFVALNPRK--EVNAVLKKEAA  456 (646)
Q Consensus       387 ~~~kapp~p~~~v~LlI~V~Sap~~--~~rR~aIR~TW~~~~~i~------~~~v~~~FfVG~~~~~--~~~~~L~~Eae  456 (646)
                      ..|+.     ++-.+++||+|..++  +.||+++|+||+++..+.      .+.+.++||+|.+++.  +++++|++|++
T Consensus        73 ~~w~~-----~~~lv~~Gi~S~d~~~r~~rR~lqr~t~w~y~~va~~~n~ftg~~lv~y~l~~H~~~~~~~~~~L~eEA~  147 (382)
T PTZ00210         73 AVWKA-----QRFLAVLGIPSVDNSERSRRRDLQRQTCWKYSGVATRSNNFSGSLLPLYLLAPHQSNSYLISHSLKEEAA  147 (382)
T ss_pred             HHhcc-----CCceEEEeccCCCchHHHHHHHHHHhhhhcchhhhhhccCCchhhhhhhhhccCCccchhhhHHHHHHHH
Confidence            46665     456889999999999  999999999999998876      6788999999999876  99999999999


Q ss_pred             hcCcEEEEee------------------cccccchhHHHHHHHhhhhhcC-CceEEEEecCCccccHHHHHHHHhhcCCC
Q 006408          457 FFGDIVILPF------------------MDRYELVVLKTIAICEFGVQNV-TAAYIMKCDDDTFIRVDAVLKEIEGIFPK  517 (646)
Q Consensus       457 ~ygDII~~df------------------~DsY~nLtlKtl~~l~wa~~~~-~akfvmKvDDDtfVnvd~Ll~~L~~~~~~  517 (646)
                      .|+|||++||                  .|+|.++++||+++|+|+.+.| +++||||+|||+|||+++++++|+..+. 
T Consensus       148 ~~~DIVilpf~d~~~tTnKkiG~~g~WG~e~e~~mT~KT~l~~~wA~~~cP~a~YImKgDDDvFVrVp~lL~~Lr~~pr-  226 (382)
T PTZ00210        148 RTHDIITLPTNDVSPSTRKKIGENGNWGIEAEVAMSRKTYLWLRFALHMFPNVSYIVKGDDDIFIRVPKYLADLRVMPR-  226 (382)
T ss_pred             HhCCEEEEecccCccccccccccCCcccchhhcchhHHHHHHHHHHHHhCCCCCeEEEcCCCeEeeHHHHHHHHhhCCC-
Confidence            9999999999                  6666789999999999999866 8999999999999999999999977654 


Q ss_pred             cceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCcc---------------CCCCC
Q 006408          518 RSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSL---------------RLFKM  582 (646)
Q Consensus       518 ~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l---------------~~f~~  582 (646)
                      +.+|+|.+....+|.|+.             +||||+|+||+||+|+|+.|++.....++               -.+..
T Consensus       227 r~LY~G~v~~~~~p~Rd~-------------~PpY~~G~gYvLSrDVA~~Lvs~~pl~rL~~~pys~~~~~~y~~~~~~~  293 (382)
T PTZ00210        227 HGLYMGRYNYYNRIWRRN-------------QLTYVNGYCITLSRDTAQAIISYKPLERLVNMPFSMWDYFDFLDLGMFY  293 (382)
T ss_pred             CceEEEeeCCCCccccCC-------------CCCccccceeeccHHHHHHHHhhChHhHhhcCCCchHHHHHHHHhhcCc
Confidence            669999999887787753             59999999999999999999986322233               23567


Q ss_pred             ChHHHHHHHH-HcCCCCCcccc-------cCCCc--ccCCcCCceEEEecCCHHHHHHHHHHhcCC
Q 006408          583 EDVSMGMWVE-QFNSTMTVRYS-------HSWKF--CQYGCMEGYYTAHYQSPRQMICLWDKLSRG  638 (646)
Q Consensus       583 EDV~iGi~l~-~lgi~~pV~y~-------h~~r~--c~~~C~~~~it~H~~sP~~M~~lW~~l~~~  638 (646)
                      ||+++|.+++ +++.. ++-|+       |+.+.  |...-..+.|++|...+++-..|-..+++.
T Consensus       294 EDiMvG~vLr~~~k~~-~l~~V~~~~c~Fhd~~~~~~~~~v~~~sVvvHhike~dYa~Lm~~F~n~  358 (382)
T PTZ00210        294 EDVMVGMILREKVVYR-NLISVEMGRCHFHNAGKFGVRKSVRNMSVVIHHIQEADYEMLMDYFPEG  358 (382)
T ss_pred             hHHHHHHHHHHhcCcC-ceeeeccccccceecCCCCCccccccceEEEEecCHHHHHHHHHHhcCC
Confidence            9999999995 44443 44333       22211  111224688999999999999999998853


No 6  
>KOG2288 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=100.00  E-value=6.1e-34  Score=285.83  Aligned_cols=241  Identities=28%  Similarity=0.442  Sum_probs=202.6

Q ss_pred             CCCceEEEEEeCCCCCHHHHHHHHHHhhcccc-----cCCCceEEEEEEee-CCChhHHHHHHHHHhhcCcEEEEe-ecc
Q 006408          396 ARPVHLFIGVLSATNHFAERMAIRKTWMQSSK-----IKSSNVVARFFVAL-NPRKEVNAVLKKEAAFFGDIVILP-FMD  468 (646)
Q Consensus       396 ~~~v~LlI~V~Sap~~~~rR~aIR~TW~~~~~-----i~~~~v~~~FfVG~-~~~~~~~~~L~~Eae~ygDII~~d-f~D  468 (646)
                      .+.+.++|+|.|+++...||+++|+|||....     -....|.++|++|. +...+...+|.+|.++|+|.+++| .+|
T Consensus         8 ~~k~l~vigI~T~f~s~~RR~~vR~TWmp~~~~l~rle~e~gv~~RFvIG~~~~g~~~~r~ie~E~~~~~DfllLd~h~E   87 (274)
T KOG2288|consen    8 RRKVLLVIGINTAFSSRKRRDSVRQTWMPSGEGLKRLEEEKGVIIRFVIGTATLGASLDRALEEENAQHGDFLLLDRHEE   87 (274)
T ss_pred             ccceEEEEEeecccchhhhHHHHHHhhcCCccchhhhccccceEEEEEeccCCccHHHHHHHHHHHHhcCCeEeechhHH
Confidence            45789999999999999999999999998722     13578999999998 567888999999999999999999 999


Q ss_pred             cccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccc-cccceeccccCC-C
Q 006408          469 RYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLR-TGKWAVTYEEWP-Q  546 (646)
Q Consensus       469 sY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R-~sKWyVs~eeyp-~  546 (646)
                      .|.+|+.||+++|.++..+.+++|++|+|||+|||++.|...|........+|+|++..+..+.+ .+|||-|.  |. .
T Consensus        88 ~Y~~Ls~Kt~~~f~~A~~~~daeFyvKvDDDv~v~l~~L~~~la~~r~~pr~YiGcmksg~v~~~~~~kw~Epe--Wkfg  165 (274)
T KOG2288|consen   88 AYEELSAKTKAFFSAAVAHWDAEFYVKVDDDVYVRLARLGTLLARERSHPRLYIGCMKSGPVLTQPGGKWYEPE--WKFG  165 (274)
T ss_pred             HHHHHHHHHHHHHHHHHHhccceEEEEccccceecHHHHHHHHHhhccCCceEEEEecCCccccCCCCcccChh--hhcC
Confidence            99999999999999999999999999999999999999999999877667899999998877777 59999996  64 3


Q ss_pred             CC--CCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCCCCcccccCCCcccCCc--CCceEEEec
Q 006408          547 EV--YPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNSTMTVRYSHSWKFCQYGC--MEGYYTAHY  622 (646)
Q Consensus       547 ~~--YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~~pV~y~h~~r~c~~~C--~~~~it~H~  622 (646)
                      +.  |.+|+.|++|+||+|++..|.-+  ..-++.+..|||.+|-|+..++    |+++|+.++|...|  ....+.++.
T Consensus       166 ~~g~YfrhA~G~~YvlS~dLa~yi~in--~~lL~~y~nEDVSlGaW~~gld----V~h~dd~rlC~~~~~~~~~~~~~~~  239 (274)
T KOG2288|consen  166 DNGNYFRHATGGGYVLSKDLATYISIN--RQLLHKYANEDVSLGAWMIGLD----VEHVDDPRLCCSTPKALAGMVCAAS  239 (274)
T ss_pred             cccccchhccCceEEeeHHHHHHHHHh--HHHHHhhccCCcccceeeeeee----eeEecCCcccccchhhhccceeeee
Confidence            44  99999999999999999999875  3457788999999999998766    66889999987666  223333332


Q ss_pred             C---------CHHHHHHHHHHhc-CCCCCCCC
Q 006408          623 Q---------SPRQMICLWDKLS-RGRAHCCN  644 (646)
Q Consensus       623 ~---------sP~~M~~lW~~l~-~~~~~Cc~  644 (646)
                      .         +..+|..++..=- ...+.||.
T Consensus       240 ~~~kcsglC~~~~rm~~~h~~~~~~~~~~~~~  271 (274)
T KOG2288|consen  240 FDWKCSGLCKSEDRMLEVHKYDWEGKPATCCS  271 (274)
T ss_pred             ecccccccCchHHHHhHHHHhhccCCCcccCc
Confidence            2         3467777776544 35567775


No 7  
>smart00276 GLECT Galectin. Galectin - galactose-binding lectin
Probab=99.97  E-value=8.6e-30  Score=236.52  Aligned_cols=127  Identities=34%  Similarity=0.508  Sum_probs=117.2

Q ss_pred             eEEEcCCCCCCCcEEEEEEEcCCCcccccchhhhccCCCCcceeeeEEEEecCCcCCCCCCCCeeEEEccccCCCCCCCC
Q 006408          157 RLMFLPCGLAAGSSITVVGTPHYAHQEFLPQLTRRRNGDSLVMVSQFMVELQGLKSVDGEDPPKILHLNPRIKGDWSHRP  236 (646)
Q Consensus       157 ~~~~lP~GL~~Gs~itV~G~p~~~~~~~~~~~~~~~~~~~~~~~~~F~i~L~g~~~~~~~~~~i~LH~NpRl~~d~~~~p  236 (646)
                      |...||+||.+|+.|+|.|+|...+.                   +|.|||+.+      .++++|||||||..+     
T Consensus         1 ~~~~lp~~l~~G~~i~i~G~~~~~~~-------------------~F~inl~~~------~~di~lH~n~rf~~~-----   50 (128)
T smart00276        1 FTLPIPGGLKPGQTLTVRGIVLPDAK-------------------RFSINLLTG------GDDIALHFNPRFNEN-----   50 (128)
T ss_pred             CcccCCCCCCCCCEEEEEEEECCCCC-------------------EEEEEeecC------CCCEEEEEeccCCCC-----
Confidence            35689999999999999999998654                   999999973      247999999999975     


Q ss_pred             EEEEecccCCcccceeecCCCCCCCCCCccccchhhhhhccccCccccccccccccccccccccCCCCCCCCCCCCCCCe
Q 006408          237 VIEHNTCYRMQWGTAQRCDGLSSKKDDDMLVDGNLRCEKWMRNDVADSKDSKTASWFKRFIGREQKPEVTWPFPFVEGRL  316 (646)
Q Consensus       237 vIv~Nt~~~~~WG~eeRc~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~  316 (646)
                      +||+||+.+|.||.|||+                                                    ..|||.+|++
T Consensus        51 ~iV~Ns~~~g~Wg~Eer~----------------------------------------------------~~~Pf~~g~~   78 (128)
T smart00276       51 KIVCNSKLNGSWGSEERE----------------------------------------------------GGFPFQPGQP   78 (128)
T ss_pred             EEEEeCccCCccchheEc----------------------------------------------------CCCCCCCCCE
Confidence            999999999999999998                                                    3799999999


Q ss_pred             EEEEEEEccceEEEEeCCeEEEEeecccCcCcccceEEEEecccceeeeec
Q 006408          317 FILTLRAGVEGYHINVGGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVYA  367 (646)
Q Consensus       317 F~lti~~g~egf~v~VnG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~a  367 (646)
                      |+|+|.++.++|+|+|||+|+++|+||.  ++++|+.|.|.||++|++|..
T Consensus        79 F~l~i~~~~~~f~i~vng~~~~~f~~R~--~~~~i~~l~v~Gdv~l~~v~~  127 (128)
T smart00276       79 FDLTIIVQPDHFQIFVNGVHITTFPHRL--PLESIDYLSINGDVQLTSVSF  127 (128)
T ss_pred             EEEEEEEcCCEEEEEECCEeEEEecCCC--CcccEeEEEEeCCEEEEEEEE
Confidence            9999999999999999999999999999  689999999999999999964


No 8  
>PF00337 Gal-bind_lectin:  Galactoside-binding lectin;  InterPro: IPR001079 Galectins (also known as galaptins or S-lectin) are a family of proteins defined by having at least one characteristic carbohydrate recognition domain (CRD) with an affinity for beta-galactosides and sharing certain sequence elements. Members of the galectins family are found in mammals, birds, amphibians, fish, nematodes, sponges, and some fungi. Galectins are known to carry out intra- and extracellular functions through glycoconjugate-mediated recogntion. From the cytosol they may be secreted by non-classical pathways, but they may also be targeted to the nucleus or specific sub-cytosolic sites. Within the same peptide chain some galectins have a CRD with only a few additional amino acids, whereas others have two CRDs joined by a link peptide, and one (galectin-3) has one CRD joined to a different type of domain [, ]. The galectin carbohydrate recognition domain (CRD) is a beta-sandwich of about 135 amino acid. The two sheets are slightly bent with 6 strands forming the concave side and 5 strands forming the convex side. The concave side forms a groove in which carbohydrate is bound, and which is long enough to hold about a linear tetrasaccharide [, ].; GO: 0005529 sugar binding; PDB: 2WSU_B 2WT0_A 2WT1_A 2WT2_B 2WSV_A 1HLC_A 2ZGQ_A 3M3Q_B 1WW5_C 3M3E_A ....
Probab=99.96  E-value=2.2e-29  Score=234.13  Aligned_cols=132  Identities=37%  Similarity=0.578  Sum_probs=119.9

Q ss_pred             CeEEEcCCCCCCCcEEEEEEEcCCCcccccchhhhccCCCCcceeeeEEEEecCCcCCCCCCCCeeEEEccccCC-CCCC
Q 006408          156 DRLMFLPCGLAAGSSITVVGTPHYAHQEFLPQLTRRRNGDSLVMVSQFMVELQGLKSVDGEDPPKILHLNPRIKG-DWSH  234 (646)
Q Consensus       156 ~~~~~lP~GL~~Gs~itV~G~p~~~~~~~~~~~~~~~~~~~~~~~~~F~i~L~g~~~~~~~~~~i~LH~NpRl~~-d~~~  234 (646)
                      ||++.||+||.+|+.|+|.|++...+.                   +|.|||+++.  ..+..+++|||||||.. .   
T Consensus         1 pf~~~l~~~l~~G~~i~i~G~~~~~~~-------------------~f~inl~~~~--~~~~~~i~lH~~~rf~~~~---   56 (133)
T PF00337_consen    1 PFTARLPGGLSPGDSIIIRGTVPPDAK-------------------RFSINLQTGP--NDPDDDIALHFNPRFDEQN---   56 (133)
T ss_dssp             SEEEEETTEEETTEEEEEEEEEBTTSS-------------------BEEEEEEES---STTTTEEEEEEEEECTTEE---
T ss_pred             CceEEcCCCCCCCcEEEEEEEECCCCC-------------------EEEEEecCCC--cCCCCCEEEEEEEEeCCCc---
Confidence            689999999999999999999997654                   9999999864  34567899999999999 5   


Q ss_pred             CCEEEEecccCCcccceeecCCCCCCCCCCccccchhhhhhccccCccccccccccccccccccccCCCCCCCCCCCCCC
Q 006408          235 RPVIEHNTCYRMQWGTAQRCDGLSSKKDDDMLVDGNLRCEKWMRNDVADSKDSKTASWFKRFIGREQKPEVTWPFPFVEG  314 (646)
Q Consensus       235 ~pvIv~Nt~~~~~WG~eeRc~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G  314 (646)
                        +||+||+.+|.||.|||+                                                    ..|||.+|
T Consensus        57 --~iv~Ns~~~g~Wg~Ee~~----------------------------------------------------~~~pf~~g   82 (133)
T PF00337_consen   57 --VIVRNSRINGKWGQEERE----------------------------------------------------SPFPFQPG   82 (133)
T ss_dssp             --EEEEEEEETTEE-SEEEE----------------------------------------------------SSTSSTTT
T ss_pred             --eEEEeceECCEeccceee----------------------------------------------------eeeeecCC
Confidence              999999999999999996                                                    48999999


Q ss_pred             CeEEEEEEEccceEEEEeCCeEEEEeecccCcCcccceEEEEecccceeeeec
Q 006408          315 RLFILTLRAGVEGYHINVGGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVYA  367 (646)
Q Consensus       315 ~~F~lti~~g~egf~v~VnG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~a  367 (646)
                      ++|+|+|.+..++|+|+|||+|+++|+||+  ++++|+.|.|.|||+|++|.+
T Consensus        83 ~~F~i~I~~~~~~f~I~vng~~~~~F~~R~--~~~~i~~l~i~Gdv~i~~v~~  133 (133)
T PF00337_consen   83 QPFEIRIRVEEDGFKIYVNGKHFCSFPHRL--PLSSIDYLQIQGDVQIYSVEF  133 (133)
T ss_dssp             SEEEEEEEEESSEEEEEETTEEEEEEE-SS--CGGGEEEEEEEESEEEEEEEE
T ss_pred             ceEEEEEEEecCeeEEEECCeEEEEeeCcC--CHHHcCEEEEECCEEEEEEEC
Confidence            999999999999999999999999999998  679999999999999999963


No 9  
>cd00070 GLECT Galectin/galactose-binding lectin. This domain exclusively binds beta-galactosides, such as lactose, and does not require metal ions for activity. GLECT domains occur as homodimers or tandemly repeated domains. They are developmentally regulated and may be involved in differentiation, cell-cell interaction and cellular regulation.
Probab=99.96  E-value=2.8e-29  Score=232.53  Aligned_cols=127  Identities=36%  Similarity=0.549  Sum_probs=117.3

Q ss_pred             CeEEEcCCCCCCCcEEEEEEEcCCCcccccchhhhccCCCCcceeeeEEEEecCCcCCCCCCCCeeEEEccccCCCCCCC
Q 006408          156 DRLMFLPCGLAAGSSITVVGTPHYAHQEFLPQLTRRRNGDSLVMVSQFMVELQGLKSVDGEDPPKILHLNPRIKGDWSHR  235 (646)
Q Consensus       156 ~~~~~lP~GL~~Gs~itV~G~p~~~~~~~~~~~~~~~~~~~~~~~~~F~i~L~g~~~~~~~~~~i~LH~NpRl~~d~~~~  235 (646)
                      ++...|||||.+|+.|+|.|+|..++.                   +|.|||+.+     .+ +++|||||||..+    
T Consensus         1 p~~~~l~~~l~~G~~i~i~G~~~~~~~-------------------~f~Inl~~~-----~~-~i~lH~n~rf~~~----   51 (127)
T cd00070           1 PYKLPLPGGLKPGSTLTVKGRVLPNAK-------------------RFSINLGTG-----SS-DIALHFNPRFDEN----   51 (127)
T ss_pred             CcccccCCCCcCCCEEEEEEEECCCCC-------------------EEEEEEecC-----CC-CEEEEEeeeCCCC----
Confidence            466789999999999999999998755                   999999973     22 7999999999986    


Q ss_pred             CEEEEecccCCcccceeecCCCCCCCCCCccccchhhhhhccccCccccccccccccccccccccCCCCCCCCCCCCCCC
Q 006408          236 PVIEHNTCYRMQWGTAQRCDGLSSKKDDDMLVDGNLRCEKWMRNDVADSKDSKTASWFKRFIGREQKPEVTWPFPFVEGR  315 (646)
Q Consensus       236 pvIv~Nt~~~~~WG~eeRc~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~  315 (646)
                       +||+||+.+|.||.|||+                                                    ..|||.+|+
T Consensus        52 -~IV~Ns~~~g~Wg~Eer~----------------------------------------------------~~~pf~~g~   78 (127)
T cd00070          52 -VIVRNSFLNGNWGPEERS----------------------------------------------------GGFPFQPGQ   78 (127)
T ss_pred             -EEEEcCCCCCEecHhhcc----------------------------------------------------CCCCCCCCC
Confidence             999999999999999999                                                    379999999


Q ss_pred             eEEEEEEEccceEEEEeCCeEEEEeecccCcCcccceEEEEecccceeeee
Q 006408          316 LFILTLRAGVEGYHINVGGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVY  366 (646)
Q Consensus       316 ~F~lti~~g~egf~v~VnG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~  366 (646)
                      +|+|+|.++.++|+|+|||+|+++|+||.  ++++|+.|.|.||+.|++|.
T Consensus        79 ~F~l~i~~~~~~f~i~vng~~~~~F~~R~--~~~~i~~l~v~Gdv~i~~v~  127 (127)
T cd00070          79 PFELTILVEEDKFQIFVNGQHFFSFPHRL--PLESIDYLSINGDVSLTSVE  127 (127)
T ss_pred             eEEEEEEEcCCEEEEEECCEeEEEecCcC--ChhhEEEEEEeCCEEEEEeC
Confidence            99999999999999999999999999999  67999999999999999873


No 10 
>KOG3587 consensus Galectin, galactose-binding lectin [Extracellular structures]
Probab=99.92  E-value=8.9e-25  Score=207.13  Aligned_cols=137  Identities=31%  Similarity=0.465  Sum_probs=119.9

Q ss_pred             CCeEEEcCCCCCCCcEEEEEEEcCCCcccccchhhhccCCCCcceeeeEEEEecCCcCCCCCCCCeeEEEccccCCCCCC
Q 006408          155 GDRLMFLPCGLAAGSSITVVGTPHYAHQEFLPQLTRRRNGDSLVMVSQFMVELQGLKSVDGEDPPKILHLNPRIKGDWSH  234 (646)
Q Consensus       155 ~~~~~~lP~GL~~Gs~itV~G~p~~~~~~~~~~~~~~~~~~~~~~~~~F~i~L~g~~~~~~~~~~i~LH~NpRl~~d~~~  234 (646)
                      .++...++++|.+|+.+++.|.+..+..                  .+|.++++..-..+. +.+|+|||||||.+.   
T Consensus         4 ~p~~~~~~~~l~~g~~~~~~g~~~~~~~------------------~~~~~~~~~~~~~~~-~~dia~Hfnprf~~~---   61 (143)
T KOG3587|consen    4 VPFPVPIPSGLPPGSQVTIKGLVLYGIP------------------KRFAVNLRFGTNLDS-DSDIALHFNPRFDEK---   61 (143)
T ss_pred             cccccccccCcCCCcEEEEEEEEcccCC------------------CcceeeeEeecccCC-CCcEEEEEeccCCCC---
Confidence            4677778999999999999999997643                  256666655444334 567999999999998   


Q ss_pred             CCEEEEecccCCcccceeecCCCCCCCCCCccccchhhhhhccccCccccccccccccccccccccCCCCCCCCCCCCCC
Q 006408          235 RPVIEHNTCYRMQWGTAQRCDGLSSKKDDDMLVDGNLRCEKWMRNDVADSKDSKTASWFKRFIGREQKPEVTWPFPFVEG  314 (646)
Q Consensus       235 ~pvIv~Nt~~~~~WG~eeRc~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G  314 (646)
                        .||+||+.+|.||.|||.                                                    ..+||+.|
T Consensus        62 --~VVrNs~~~g~Wg~eE~~----------------------------------------------------~~~PF~~g   87 (143)
T KOG3587|consen   62 --GVVRNSLINGEWGLEERE----------------------------------------------------GGNPFQPG   87 (143)
T ss_pred             --eEEEecccCCccCchhhc----------------------------------------------------CCCCCCCC
Confidence              699999999999999998                                                    47999999


Q ss_pred             CeEEEEEEEccceEEEEeCCeEEEEeecccCcCcccceEEEEecccceeeeeccc
Q 006408          315 RLFILTLRAGVEGYHINVGGRHVTSFPYRTGFTLEDATGLAIKGDVDIHSVYATN  369 (646)
Q Consensus       315 ~~F~lti~~g~egf~v~VnG~h~~sF~yR~~~~l~~v~~l~v~GDv~l~sV~a~s  369 (646)
                      ++|.|+|.++.+.|+|.|||.|+++|+||+  +++.+..|.|.||++|++|....
T Consensus        88 ~~F~l~I~~~~~~~~I~VNg~~f~~y~HR~--p~~~v~~l~i~Gdv~i~~i~~~~  140 (143)
T KOG3587|consen   88 QPFDLTILVEEDKFQIFVNGVHFADYPHRI--PPSSVQTLQINGDVQITSIEFSN  140 (143)
T ss_pred             CeEEEEEEEccCeEEEEECCEEEEeecCCC--CChheeEEEEeeeEEEEEEEEEc
Confidence            999999999999999999999999999999  78999999999999999997653


No 11 
>PF02434 Fringe:  Fringe-like;  InterPro: IPR003378 The Notch receptor is a large, cell surface transmembrane protein involved in a wide variety of developmental processes in higher organisms []. It becomes activated when its extracellular region binds to ligands located on adjacent cells. Much of this extracellular region is composed of EGF-like repeats, many of which can be O-fucosylated. A number of these O-fucosylated repeats can in turn be further modified by the action of a beta-1,3-N-acetylglucosaminyltransferase enzyme known as Fringe []. Fringe potentiates the activation of Notch by Delta ligands, while inhibiting activation by Serrate/Jagged ligands. This regulation of Notch signalling by Fringe is important in many processes []. Four distinct Fringe proteins have so far been studied in detail; Drosophila Fringe (Dfng) and its three mammalian homologues Lunatic Fringe (Lfng), Radical Fringe (Rfng) and Manic Fringe (Mfng). Dfng, Lfng and Rfng have all been shown to play important roles in developmental processes within their host, though the phenotype of mutants can vary between species e.g. Rfng mutants are retarded in wing development in chickens, but have no obvious phenotype in mice [, , ]. Mfng mutants have not, so far, been charcterised. Biochemical studies indicate that the Fringe proteins are fucose-specific transferases requiring manganese for activity and utilising UDP-N-acetylglucosamine as a donor substrate []. The three mammalian proteins show distinct variations in their catalytic efficiencies with different substrates.  Dfng is a glucosaminyltransferase that controls the response of the Notch receptor to specific ligands which is localised to the Golgi apparatus [] (not secreted as previously thought). Modification of Notch occurs through glycosylation by Dfng.  This entry consists of Fringe proteins and related glycosyltransferase enzymes including:   Beta-1,3-glucosyltransferase, which glucosylates O-linked fucosylglycan on thrombospondin type 1 repeat domains [].  Core 1 beta1,3-galactosyltransferase 1, generates the core T antigen, which is a precursor for many extended O-glycans in glycoproteins and plays a central role in many processes, such as angiogenesis, thrombopoiesis and kidney homeostasis development [].  ; GO: 0016757 transferase activity, transferring glycosyl groups, 0016020 membrane; PDB: 2J0B_A 2J0A_A.
Probab=99.74  E-value=4.2e-18  Score=175.66  Aligned_cols=183  Identities=17%  Similarity=0.247  Sum_probs=99.4

Q ss_pred             eEEEEEeCCCCCHHHH-HHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHH
Q 006408          400 HLFIGVLSATNHFAER-MAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTI  478 (646)
Q Consensus       400 ~LlI~V~Sap~~~~rR-~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl  478 (646)
                      +|+|+|+|++.+...| .+|++||++...      ...|++....+..+...      ...+++..+....+...+++.+
T Consensus         7 dI~i~V~T~~k~h~tR~~~I~~TW~~~~~------~~~~ifsd~~d~~l~~~------~~~~l~~~~~~~~~~~~~~~~~   74 (252)
T PF02434_consen    7 DIFIAVKTTKKFHKTRAPAIKQTWAKRCN------KQTFIFSDAEDPSLPTV------TGVHLVNPNCDAGHCRKTLSCK   74 (252)
T ss_dssp             GEEEEEE--GGGTTTTHHHHHHTGGGGSG------GGEEEEESS--HHHHHH------HGGGEEE-------------HH
T ss_pred             cEEEEEEeCHHHHHHHHHHHHHHHHhhcC------CceEEecCccccccccc------cccccccCCCcchhhHHHHHHH
Confidence            6899999999877666 999999999876      22454443444443322      3346677777777766666666


Q ss_pred             HHHhhhhh-cCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCcccc-ccceeccccCCCCCCCCCCCCC
Q 006408          479 AICEFGVQ-NVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRT-GKWAVTYEEWPQEVYPPYANGP  556 (646)
Q Consensus       479 ~~l~wa~~-~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~-sKWyVs~eeyp~~~YPpY~~G~  556 (646)
                      +.++|... ..+++|++++||||||++++|+++|..+++.+++|+|...... |... .+.  .........|....+|+
T Consensus        75 ~~~~y~~~~~~~~~Wf~~~DDDtyv~~~~L~~~L~~~~~~~~~yiG~~~~~~-~~~~~~~~--~~~~~~~~~~~f~~GGa  151 (252)
T PF02434_consen   75 MAYEYDHFLNSDKDWFCFADDDTYVNVENLRRLLSKYDPSEPIYIGRPSGDR-PIEIIHRF--NPNKSKDSGFWFATGGA  151 (252)
T ss_dssp             HHHHHHHHHHHT-SEEEEEETTEEE-HHHHHHHHTTS-TTS--EEE-EE-------------------------EE-GGG
T ss_pred             HHHHHHhhhcCCceEEEEEeCCceecHHHHHHHHhhCCCccCEEeeeeccCc-cceeeccc--cccccCcCceEeeCCCe
Confidence            66666433 3478999999999999999999999999999999999986432 2211 000  00001112232223689


Q ss_pred             eEEeCHHHHHHHHHHhcCCcc-C----CCCCChHHHHHHHHH-cCCC
Q 006408          557 GYVISSDIAKFIVLQHGNQSL-R----LFKMEDVSMGMWVEQ-FNST  597 (646)
Q Consensus       557 GYVLSrdla~~Iv~~~~~~~l-~----~f~~EDV~iGi~l~~-lgi~  597 (646)
                      ||+||+.++++|......... .    .-..||+.||.|++. +|+.
T Consensus       152 G~vlSr~~~~k~~~~~~~~~~~~~~~~~~~~dD~~lG~ci~~~lgv~  198 (252)
T PF02434_consen  152 GYVLSRALLKKMSPWASGCKCPSTDEKIRLPDDMTLGYCIENLLGVP  198 (252)
T ss_dssp             -EEEEHHHHHHHHHHHTT-TTS--TTTTTS-HHHHHHHHHHHTT---
T ss_pred             eHHHhHHHHHHHhhhcccccccCCcCCCCCcccChhhhhHHhcCCcc
Confidence            999999999999654322222 1    234799999999999 8976


No 12 
>KOG2246 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=99.62  E-value=2.3e-15  Score=162.58  Aligned_cols=165  Identities=20%  Similarity=0.305  Sum_probs=127.2

Q ss_pred             CCceEEEEEeCCCCCHHHH-HHHHHHhhcccccCCCceEEEEEE---eeCCChhHHHHHHHHHhhcCcEEEEeecccccc
Q 006408          397 RPVHLFIGVLSATNHFAER-MAIRKTWMQSSKIKSSNVVARFFV---ALNPRKEVNAVLKKEAAFFGDIVILPFMDRYEL  472 (646)
Q Consensus       397 ~~v~LlI~V~Sap~~~~rR-~aIR~TW~~~~~i~~~~v~~~FfV---G~~~~~~~~~~L~~Eae~ygDII~~df~DsY~n  472 (646)
                      .+.+|++.|+|.+.+...| ..+-+||++.+.      +..|+-   ...            ...+. .|..+..|+|++
T Consensus        89 r~~~v~cwv~t~~~~~~~~~~~v~~TW~~rc~------~~~f~s~~~s~~------------~~~f~-~v~~~~~~g~~~  149 (364)
T KOG2246|consen   89 RSGRVLCWVLTSPMRHVTRADAVKETWLKRCD------KGIFFSPTLSKD------------DSRFP-TVYYNLPDGYRS  149 (364)
T ss_pred             CCceEEEEEEecCcCceeehhhhhcccccccC------cceecCccCCCC------------CCcCc-eeeccCCcchHH
Confidence            5679999999998877766 799999999876      334443   221            11222 347888999999


Q ss_pred             hhHHHHHHHhhhhhcC--CceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCC
Q 006408          473 VVLKTIAICEFGVQNV--TAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYP  550 (646)
Q Consensus       473 LtlKtl~~l~wa~~~~--~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YP  550 (646)
                      +..||..+++|...+.  +++|++|+|||||+.++||...|.++++.+++|+|+.....         .      ...  
T Consensus       150 ~~~ktr~~~~yv~~~~~~~~dWf~~aDDDTy~i~eNLr~~L~~yDp~~p~YiG~~~~~~---------~------~~~--  212 (364)
T KOG2246|consen  150 LWRKTRIAFKYVYDHILKDYDWFLKADDDTYFIMENLRYVLSKYDPEKPVYLGYRSKSY---------F------QNG--  212 (364)
T ss_pred             HHHHHHHHHHHHHHhccCCCCeEEeccCCeEEeHHHHHHHHhhcCCCCcEEeccccccc---------c------ccc--
Confidence            9999999999998543  89999999999999999999999999999999999965311         1      111  


Q ss_pred             CCCCCCeEEeCHHHHHHHHHHhcCCc--cC-CC--CCChHHHHHHHHHcCCC
Q 006408          551 PYANGPGYVISSDIAKFIVLQHGNQS--LR-LF--KMEDVSMGMWVEQFNST  597 (646)
Q Consensus       551 pY~~G~GYVLSrdla~~Iv~~~~~~~--l~-~f--~~EDV~iGi~l~~lgi~  597 (646)
                      .-.+|+||++|+.+.+.+++......  .+ -.  ..||.-||.|++.+||.
T Consensus       213 y~~g~ag~~ls~aa~~~la~~l~~~~~~C~~~~~~~~eD~~i~~Cl~~~GV~  264 (364)
T KOG2246|consen  213 YSSGGAGYVLSFAALRRLAERLLNNEDKCPQRYPSYGEDRRIGRCLAEVGVP  264 (364)
T ss_pred             cccCCCCcceeHHHHHHHHHHHhcchhhcccccCCchhHHHHHHHHHHhCCC
Confidence            11279999999999999887532211  12 22  38999999999999986


No 13 
>PLN03153 hypothetical protein; Provisional
Probab=99.10  E-value=9.8e-10  Score=121.85  Aligned_cols=173  Identities=14%  Similarity=0.161  Sum_probs=105.0

Q ss_pred             ceEEEEEeCCCCCHHHH-HHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeeccc----ccch
Q 006408          399 VHLFIGVLSATNHFAER-MAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDR----YELV  473 (646)
Q Consensus       399 v~LlI~V~Sap~~~~rR-~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~Ds----Y~nL  473 (646)
                      -.|+++|.++.+...+| ..|+.+|..... +    -.+|+.....+..       +... ---+.+. .|+    |.|-
T Consensus       122 ~hIvF~I~~s~~~w~~R~~yik~wW~p~~~-r----g~v~ld~~~~~~~-------~~~~-~P~i~is-~d~s~f~y~~~  187 (537)
T PLN03153        122 NHIMFGIAGSSQLWKRRKELVRLWWRPNQM-R----GHVWLEEQVSPEE-------GDDS-LPPIMVS-EDTSRFRYTNP  187 (537)
T ss_pred             ccEEEEEEEchhhhhhhhhhhhhhcCcccc-e----eEEEecccCCCCC-------CcCC-CCCEEeC-CCcccccccCC
Confidence            36788998888876554 888888876432 1    1233332221100       0000 0011111 111    3321


Q ss_pred             -----hHHHHHHHhhhhh--cCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCC
Q 006408          474 -----VLKTIAICEFGVQ--NVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQ  546 (646)
Q Consensus       474 -----tlKtl~~l~wa~~--~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~  546 (646)
                           .+-...+...+.+  .++++|++++|||||+.+++|+..|..+++.++.|+|..........  .       +. 
T Consensus       188 ~Gh~sa~rI~rmv~et~~~~~pd~kWfVf~DDDTyf~~~NLv~~Ls~YDptkp~YIGs~Se~~~qn~--~-------f~-  257 (537)
T PLN03153        188 TGHPSGLRISRIVLESFRLGLPDVRWFVLGDDDTIFNADNLVAVLSKYDPSEMVYVGGPSESHSANS--Y-------FS-  257 (537)
T ss_pred             CCcHHHHHHHHHHHHHHHhhCCCCCEEEEecCCccccHHHHHHHHhhcCCCCCEEeccccccccccc--c-------cc-
Confidence                 1112123333333  46999999999999999999999999999999999998754321100  0       00 


Q ss_pred             CCCCCCCCCCeEEeCHHHHHHHHHHhcCCcc--CCCCCChHHHHHHHHHcCCC
Q 006408          547 EVYPPYANGPGYVISSDIAKFIVLQHGNQSL--RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       547 ~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l--~~f~~EDV~iGi~l~~lgi~  597 (646)
                        |--.-+|+||+||+.+++.|.........  +...-+|..+|.|+.++|+.
T Consensus       258 --~~fA~GGAG~~LSrPLae~L~~~~d~C~~rY~~~~~gD~rL~~CL~elGV~  308 (537)
T PLN03153        258 --HNMAFGGGGIAISYPLAEALSRILDDCLDRYPKLYGSDDRLHACITELGVP  308 (537)
T ss_pred             --cccccCCceEEEcHHHHHHHHHHhhhhhhhcccCCCcHHHHHHHHHHcCCC
Confidence              11123899999999999998876322211  12346999999999999975


No 14 
>KOG3708 consensus Uncharacterized conserved protein [Function unknown]
Probab=97.70  E-value=0.00018  Score=79.74  Aligned_cols=195  Identities=18%  Similarity=0.196  Sum_probs=123.2

Q ss_pred             eEEEEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHH-
Q 006408          400 HLFIGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTI-  478 (646)
Q Consensus       400 ~LlI~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl-  478 (646)
                      +|+++|+|.   ..---+|.+|=+.+-.      ++.||.+...-.             .|.-++..+-.|+.-..|+. 
T Consensus        27 rl~~aVmte---~tlA~a~NrT~ahhvp------rv~~F~~~~~i~-------------~~~a~~~~vs~~d~r~~~~~s   84 (681)
T KOG3708|consen   27 RLMAAVMTE---STLALAINRTLAHHVP------RVHLFADSSRID-------------NDLAQLTNVSPYDLRGQKTHS   84 (681)
T ss_pred             HHHHHHHHH---HHHHHHHHHHHHhhcc------eeEEeecccccc-------------ccHhhccccCccccCccccHH
Confidence            667888872   2556788888776544      567888754311             12222333333333333443 


Q ss_pred             HHHhhhhhcC--CceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCC
Q 006408          479 AICEFGVQNV--TAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGP  556 (646)
Q Consensus       479 ~~l~wa~~~~--~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~  556 (646)
                      +.+.+..++.  +++|++-+-|+|||+...|+..+..++...++|+|.-...                ....   .-.+.
T Consensus        85 ~vl~~l~~~~~~~YDwFll~~D~tYv~a~~L~~l~~hmsin~dlymGEe~~~----------------gs~r---C~l~~  145 (681)
T KOG3708|consen   85 MVLGLLFNMVHNNYDWFLLAKDSTYVNAFVLLRLIDHMSINEDLYMGEEAED----------------GSGR---CRLDT  145 (681)
T ss_pred             HHHHHHHHhhccccceEEEecCcceecHHHHHHHHhhcccccccccchhhhC----------------ccCc---ccccc
Confidence            4455665544  8999999999999999999999999998899999942210                0111   22589


Q ss_pred             eEEeCHHHHHHHHHHhcCCccCCC--CCChHHHHHHHHHc-CCC-CC----c-ccccC---C----Cccc---CCcCCce
Q 006408          557 GYVISSDIAKFIVLQHGNQSLRLF--KMEDVSMGMWVEQF-NST-MT----V-RYSHS---W----KFCQ---YGCMEGY  617 (646)
Q Consensus       557 GYVLSrdla~~Iv~~~~~~~l~~f--~~EDV~iGi~l~~l-gi~-~p----V-~y~h~---~----r~c~---~~C~~~~  617 (646)
                      ||+||+.++.+|-.+- ..+....  .=.|+.+|.|+... |+. .+    + +|.+-   .    ++-.   ..-..+.
T Consensus       146 G~LLS~s~l~~lrnnl-e~C~~~~lsad~d~~lgrCi~~At~v~C~~~hQGvrq~s~~~dspgr~~~~~e~~~s~aFr~A  224 (681)
T KOG3708|consen  146 GMLLSQSLLHALRNNL-EGCRNDILSADPDEWLGRCIQDATGVGCKPLHQGVRQYSEREDSPGRHDSIPEWEGSPAFRSA  224 (681)
T ss_pred             ceeecHHHHHHHHhhH-HHhhcccccCCcHHHHHHHHHHhhcCCccchhhhHHhhhHhhcCCCccccchhhcCChHHhhh
Confidence            9999999999998763 3333332  34789999999853 443 11    1 11110   0    0110   0112467


Q ss_pred             EEEe-cCCHHHHHHHHHHhc
Q 006408          618 YTAH-YQSPRQMICLWDKLS  636 (646)
Q Consensus       618 it~H-~~sP~~M~~lW~~l~  636 (646)
                      +++| -++|.+|+.|.+.+.
T Consensus       225 ~tv~pv~~p~d~yrLH~yfs  244 (681)
T KOG3708|consen  225 LTVHPVLSPADMYRLHKYFS  244 (681)
T ss_pred             hccCccCCHHHHHHHHHHHH
Confidence            8999 558999999988764


No 15 
>PF13641 Glyco_tranf_2_3:  Glycosyltransferase like family 2; PDB: 4FIY_B 4FIX_A.
Probab=95.29  E-value=0.22  Score=49.19  Aligned_cols=184  Identities=12%  Similarity=0.090  Sum_probs=86.5

Q ss_pred             EEEEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcE--EEEeecccccchhHHHH
Q 006408          401 LFIGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDI--VILPFMDRYELVVLKTI  478 (646)
Q Consensus       401 LlI~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDI--I~~df~DsY~nLtlKtl  478 (646)
                      |.|+|.+.-....-++.|+.--.+..    .++.++++.. ..+.++.+.+.+-...|..+  ..+.-.... ....|.-
T Consensus         3 v~Vvip~~~~~~~l~~~l~sl~~~~~----~~~~v~vvd~-~~~~~~~~~~~~~~~~~~~~~v~vi~~~~~~-g~~~k~~   76 (228)
T PF13641_consen    3 VSVVIPAYNEDDVLRRCLESLLAQDY----PRLEVVVVDD-GSDDETAEILRALAARYPRVRVRVIRRPRNP-GPGGKAR   76 (228)
T ss_dssp             EEEE--BSS-HHHHHHHHHHHTTSHH----HTEEEEEEEE--SSS-GCTTHHHHHHTTGG-GEEEEE----H-HHHHHHH
T ss_pred             EEEEEEecCCHHHHHHHHHHHHcCCC----CCeEEEEEEC-CCChHHHHHHHHHHHHcCCCceEEeecCCCC-CcchHHH
Confidence            45555554443444556655544321    2344444443 33333333444444555543  333322111 1122333


Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhc-CCCcceEEEeeccCCCc--cc-ccc-----ceeccccCCCCCC
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGI-FPKRSLYMGNLNLLHRP--LR-TGK-----WAVTYEEWPQEVY  549 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~-~~~~~lY~G~v~~~~~P--~R-~sK-----WyVs~eeyp~~~Y  549 (646)
                       .+.++.+....+||+.+|||+.+..+.|...+..+ .+.-.+..|.+......  .. -..     |+....... ..+
T Consensus        77 -a~n~~~~~~~~d~i~~lD~D~~~~p~~l~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~  154 (228)
T PF13641_consen   77 -ALNEALAAARGDYILFLDDDTVLDPDWLERLLAAFADPGVGAVGGPVFPDNDRNWLTRLQDLFFARWHLRFRSGR-RAL  154 (228)
T ss_dssp             -HHHHHHHH---SEEEEE-SSEEE-CHHHHHHHHHHHBSS--EEEEEEEETTCCCEEEE-TT--S-EETTTS-TT--B--
T ss_pred             -HHHHHHHhcCCCEEEEECCCcEECHHHHHHHHHHHHhCCCCeEeeeEeecCCCCHHHHHHHHHHhhhhhhhhhhh-ccc
Confidence             44666666789999999999999988888877776 34334444555332110  00 011     111100111 111


Q ss_pred             C-CCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          550 P-PYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       550 P-pY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      . .++.|++.++.+++++.+..-  ..   ....||..++..+.+.|..
T Consensus       155 ~~~~~~G~~~~~rr~~~~~~g~f--d~---~~~~eD~~l~~r~~~~G~~  198 (228)
T PF13641_consen  155 GVAFLSGSGMLFRRSALEEVGGF--DP---FILGEDFDLCLRLRAAGWR  198 (228)
T ss_dssp             --S-B--TEEEEEHHHHHHH-S----S---SSSSHHHHHHHHHHHTT--
T ss_pred             ceeeccCcEEEEEHHHHHHhCCC--CC---CCcccHHHHHHHHHHCCCc
Confidence            1 446799999999999999642  11   4445999999999998865


No 16 
>TIGR03472 HpnI hopanoid biosynthesis associated glycosyl transferase protein HpnI. This family of genes include a glycosyl transferase, group 2 domain (pfam00535) which are responsible, generally for the transfer of nucleotide-diphosphate sugars to substrates such as polysaccharides and lipids. The member of this clade from Acidithiobacillus ferrooxidans ATCC 23270 (AFE_0974) is found in the same locus as squalene-hopene cyclase (SHC, TIGR01507) and other genes associated with the biosynthesis of hopanoid natural products. Similarly, in Ralstonia eutropha JMP134 (Reut_B4902) this gene is adjacent to HpnAB, IspH and HpnH (TIGR03470), although SHC itself is elsewhere in the genome. Notably, this gene (here named HpnI) and three others form a conserved set (HpnIJKL) which occur in a subset of all genomes containing the SHC enzyme. This relationship was discerned using the method of partial phylogenetic profiling. This group includes Zymomonas mobilis, the organism where the initial hopano
Probab=94.52  E-value=1.3  Score=48.44  Aligned_cols=158  Identities=14%  Similarity=0.070  Sum_probs=86.8

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCc--EEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGD--IVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLK  509 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygD--II~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~  509 (646)
                      +..++|+...+.+... +.+++=.+.|.+  |..+.-.. -.....|.-+..+ +.+..+.+|++.+|+|+.+..+.|..
T Consensus        70 ~~EIivvdd~s~D~t~-~iv~~~~~~~p~~~i~~v~~~~-~~G~~~K~~~l~~-~~~~a~ge~i~~~DaD~~~~p~~L~~  146 (373)
T TIGR03472        70 GFQMLFGVQDPDDPAL-AVVRRLRADFPDADIDLVIDAR-RHGPNRKVSNLIN-MLPHARHDILVIADSDISVGPDYLRQ  146 (373)
T ss_pred             CeEEEEEeCCCCCcHH-HHHHHHHHhCCCCceEEEECCC-CCCCChHHHHHHH-HHHhccCCEEEEECCCCCcChhHHHH
Confidence            3566665554444322 333332345655  43332111 1222335544433 45567899999999999999998888


Q ss_pred             HHhhcCC-CcceEEEeeccCCCcccc--c---cceeccccCCC------CCCCCCCCCCeEEeCHHHHHHHHHHhcCCcc
Q 006408          510 EIEGIFP-KRSLYMGNLNLLHRPLRT--G---KWAVTYEEWPQ------EVYPPYANGPGYVISSDIAKFIVLQHGNQSL  577 (646)
Q Consensus       510 ~L~~~~~-~~~lY~G~v~~~~~P~R~--s---KWyVs~eeyp~------~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l  577 (646)
                      .+..+.. .-.+..|...  ..+..+  .   ...+....+|.      ..-+.+|.|+++++.+++.+.+---   ...
T Consensus       147 lv~~~~~~~v~~V~~~~~--~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~a~RR~~l~~iGGf---~~~  221 (373)
T TIGR03472       147 VVAPLADPDVGLVTCLYR--GRPVPGFWSRLGAMGINHNFLPSVMVARALGRARFCFGATMALRRATLEAIGGL---AAL  221 (373)
T ss_pred             HHHHhcCCCcceEecccc--CCCCCCHHHHHHHHHhhhhhhHHHHHHHhccCCccccChhhheeHHHHHHcCCh---HHh
Confidence            8777643 2233333211  111111  0   01111111110      0113468899999999999998642   111


Q ss_pred             CCCCCChHHHHHHHHHcCCC
Q 006408          578 RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       578 ~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ...-.||..+|.-+.+.|.+
T Consensus       222 ~~~~~ED~~l~~~i~~~G~~  241 (373)
T TIGR03472       222 AHHLADDYWLGELVRALGLR  241 (373)
T ss_pred             cccchHHHHHHHHHHHcCCe
Confidence            22336999999999998866


No 17 
>cd02520 Glucosylceramide_synthase Glucosylceramide synthase catalyzes the first glycosylation step of glycosphingolipid synthesis. UDP-glucose:N-acylsphingosine D-glucosyltransferase (glucosylceramide synthase or ceramide glucosyltransferase) catalyzes the first glycosylation step of glycosphingolipid synthesis. Its product, glucosylceramide, serves as the core of more than 300 glycosphingolipids (GSL). GSLs are a group of membrane components that have the lipid portion embedded in the outer plasma membrane leaflet and the sugar chains extended to the outer environment. Several lines of evidence suggest the importance of GSLs in various cellular processes such as differentiation, adhesion, proliferation, and cell-cell recognition. In pathogenic fungus Cryptococcus neoformans,  glucosylceramide serves as an antigen that elicits an antibody response in patients and it is essential for fungal growth in host extracellular environment.
Probab=93.95  E-value=0.63  Score=45.38  Aligned_cols=133  Identities=14%  Similarity=0.074  Sum_probs=79.3

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcC--cEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFG--DIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLK  509 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~yg--DII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~  509 (646)
                      .+.++++...+.+.. .+.+++-.+.|.  ++.++...... ....|.- .+..+.+....+|++.+|+|+.+..+.|..
T Consensus        30 ~~eiivVdd~s~d~t-~~~~~~~~~~~~~~~~~~~~~~~~~-g~~~~~~-~~n~g~~~a~~d~i~~~D~D~~~~~~~l~~  106 (196)
T cd02520          30 KYEILFCVQDEDDPA-IPVVRKLIAKYPNVDARLLIGGEKV-GINPKVN-NLIKGYEEARYDILVISDSDISVPPDYLRR  106 (196)
T ss_pred             CeEEEEEeCCCcchH-HHHHHHHHHHCCCCcEEEEecCCcC-CCCHhHH-HHHHHHHhCCCCEEEEECCCceEChhHHHH
Confidence            355666665554432 334444444554  33233221111 1123432 234555667899999999999998888877


Q ss_pred             HHhhcCC-CcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHH
Q 006408          510 EIEGIFP-KRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMG  588 (646)
Q Consensus       510 ~L~~~~~-~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iG  588 (646)
                      .+..+.. .-.+..|.                           ++.|++.++.+++.+.+---   ........||..++
T Consensus       107 l~~~~~~~~~~~v~~~---------------------------~~~g~~~~~r~~~~~~~ggf---~~~~~~~~eD~~l~  156 (196)
T cd02520         107 MVAPLMDPGVGLVTCL---------------------------CAFGKSMALRREVLDAIGGF---EAFADYLAEDYFLG  156 (196)
T ss_pred             HHHHhhCCCCCeEEee---------------------------cccCceeeeEHHHHHhccCh---HHHhHHHHHHHHHH
Confidence            7766422 22222221                           56899999999999987532   11122346999999


Q ss_pred             HHHHHcCCC
Q 006408          589 MWVEQFNST  597 (646)
Q Consensus       589 i~l~~lgi~  597 (646)
                      +-+.+.|..
T Consensus       157 ~rl~~~G~~  165 (196)
T cd02520         157 KLIWRLGYR  165 (196)
T ss_pred             HHHHHcCCe
Confidence            999888855


No 18 
>PF01755 Glyco_transf_25:  Glycosyltransferase family 25 (LPS biosynthesis protein);  InterPro: IPR002654 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. Glycosyltransferase family 25 GT25 from CAZY comprises enzymes with only one known activity; as a lipopolysaccharide biosynthesis protein. These enzymes catalyse the transfer of various sugars onto the growing lipopolysaccharide chain during its biosynthesis [].; GO: 0009103 lipopolysaccharide biosynthetic process
Probab=93.81  E-value=0.96  Score=44.53  Aligned_cols=99  Identities=18%  Similarity=0.190  Sum_probs=53.6

Q ss_pred             EEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEE-----eecccccchhHHH
Q 006408          403 IGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVIL-----PFMDRYELVVLKT  477 (646)
Q Consensus       403 I~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~-----df~DsY~nLtlKt  477 (646)
                      |.|.|-++..+||..+.+.....      ++...||=|..........+...   |..-...     ++.-.----.+-.
T Consensus         4 i~vInL~~~~~Rr~~~~~~~~~~------~~~~e~~~Avdg~~l~~~~~~~~---~~~~~~~~~~~~~lt~gEiGC~lSH   74 (200)
T PF01755_consen    4 IYVINLDRSTERRERIQQQLAKL------GINFEFFDAVDGRDLSEDELFRR---YDPELFKKRYGRPLTPGEIGCALSH   74 (200)
T ss_pred             EEEEECCCCHHHHHHHHHHHHHc------CCceEEEEeecccccchHHHHHH---hhhhhhhccccccCCcceEeehhhH
Confidence            56788899999999998865543      34567777655432211111111   1100000     0011111113445


Q ss_pred             HHHHhhhhhcCCceEEEEecCCccccHHHHHHHHh
Q 006408          478 IAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIE  512 (646)
Q Consensus       478 l~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~  512 (646)
                      +.+++-+++ -+.+|++-..||+.+..+ +.+.|.
T Consensus        75 ~~~w~~~v~-~~~~~~lIlEDDv~~~~~-f~~~l~  107 (200)
T PF01755_consen   75 IKAWQRIVD-SGLEYALILEDDVIFDPD-FKEFLE  107 (200)
T ss_pred             HHHHHHHHH-cCCCeEEEEecccccccc-HHHHHH
Confidence            556665553 257999999999999865 334333


No 19 
>cd04184 GT2_RfbC_Mx_like Myxococcus xanthus RfbC like proteins are required for O-antigen biosynthesis. The rfbC gene encodes a predicted protein of 1,276 amino acids, which is required for O-antigen biosynthesis in Myxococcus xanthus. It is a subfamily of Glycosyltransferase Family GT2, which includes diverse families of glycosyl transferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds.
Probab=93.06  E-value=7.5  Score=37.29  Aligned_cols=154  Identities=14%  Similarity=0.126  Sum_probs=79.7

Q ss_pred             eEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHh
Q 006408          433 VVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIE  512 (646)
Q Consensus       433 v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~  512 (646)
                      +.++++-..+.+..+...+......+.-+.+..... -...    -.++.++.+....+|++..|+|..+..+.|...++
T Consensus        32 ~eiivvd~gs~d~~~~~~~~~~~~~~~~~~~~~~~~-~~g~----~~a~n~g~~~a~~d~i~~ld~D~~~~~~~l~~~~~  106 (202)
T cd04184          32 WELCIADDASTDPEVKRVLKKYAAQDPRIKVVFREE-NGGI----SAATNSALELATGEFVALLDHDDELAPHALYEVVK  106 (202)
T ss_pred             eEEEEEeCCCCChHHHHHHHHHHhcCCCEEEEEccc-CCCH----HHHHHHHHHhhcCCEEEEECCCCcCChHHHHHHHH
Confidence            445444444445444444443334444343332221 1111    23455555566789999999999999988888887


Q ss_pred             hc-C-CCcceEEEeeccCCC-ccccccceeccccCCCCC-CCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHH
Q 006408          513 GI-F-PKRSLYMGNLNLLHR-PLRTGKWAVTYEEWPQEV-YPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMG  588 (646)
Q Consensus       513 ~~-~-~~~~lY~G~v~~~~~-P~R~sKWyVs~eeyp~~~-YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iG  588 (646)
                      .+ . +.-.++++....... ......++.  ..|.... +..-+.|.+-++++++++.+.--  ..  .+...||..++
T Consensus       107 ~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~--~~~~~~~~~~~~~~~~~~~~~r~~~~~iggf--~~--~~~~~eD~~l~  180 (202)
T cd04184         107 ALNEHPDADLIYSDEDKIDEGGKRSEPFFK--PDWSPDLLLSQNYIGHLLVYRRSLVRQVGGF--RE--GFEGAQDYDLV  180 (202)
T ss_pred             HHHhCCCCCEEEccHHhccCCCCEeccccC--CCCCHHHhhhcCCccceEeEEHHHHHHhCCC--Cc--CcccchhHHHH
Confidence            65 2 223444443322110 000001111  1111111 11122455668899998887531  11  23457999999


Q ss_pred             HHHHHcCCC
Q 006408          589 MWVEQFNST  597 (646)
Q Consensus       589 i~l~~lgi~  597 (646)
                      +-+.+.|.+
T Consensus       181 ~rl~~~g~~  189 (202)
T cd04184         181 LRVSEHTDR  189 (202)
T ss_pred             HHHHhccce
Confidence            888887755


No 20 
>cd04196 GT_2_like_d Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=92.46  E-value=2.4  Score=40.88  Aligned_cols=170  Identities=12%  Similarity=0.097  Sum_probs=86.9

Q ss_pred             HHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcC-cEEEEeecccccchhHHHHHHHhhhhhcCCceEEE
Q 006408          416 MAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFG-DIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIM  494 (646)
Q Consensus       416 ~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~yg-DII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvm  494 (646)
                      ..|.+++-+-.......+.++++-..+++. +...+++-...+. .+.......+.- .    ...+..+......+|++
T Consensus        11 ~~l~~~l~sl~~q~~~~~eiiVvddgS~d~-t~~~~~~~~~~~~~~~~~~~~~~~~G-~----~~~~n~g~~~~~g~~v~   84 (214)
T cd04196          11 KYLREQLDSILAQTYKNDELIISDDGSTDG-TVEIIKEYIDKDPFIIILIRNGKNLG-V----ARNFESLLQAADGDYVF   84 (214)
T ss_pred             HHHHHHHHHHHhCcCCCeEEEEEeCCCCCC-cHHHHHHHHhcCCceEEEEeCCCCcc-H----HHHHHHHHHhCCCCEEE
Confidence            344555443322111245555554444433 3333444344443 333333333222 1    12333345567899999


Q ss_pred             EecCCccccHHHHHHHHhh-cC-CCcceEEEeecc---CCCccccccceecc----ccCCCCCCCCCCCCCeEEeCHHHH
Q 006408          495 KCDDDTFIRVDAVLKEIEG-IF-PKRSLYMGNLNL---LHRPLRTGKWAVTY----EEWPQEVYPPYANGPGYVISSDIA  565 (646)
Q Consensus       495 KvDDDtfVnvd~Ll~~L~~-~~-~~~~lY~G~v~~---~~~P~R~sKWyVs~----eeyp~~~YPpY~~G~GYVLSrdla  565 (646)
                      ..|+|.++..+.|...++. .. +...++.|....   .........+....    ..+.......++.|+++++.++++
T Consensus        85 ~ld~Dd~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~  164 (214)
T cd04196          85 FCDQDDIWLPDKLERLLKAFLKDDKPLLVYSDLELVDENGNPIGESFFEYQKIKPGTSFNNLLFQNVVTGCTMAFNRELL  164 (214)
T ss_pred             EECCCcccChhHHHHHHHHHhcCCCceEEecCcEEECCCCCCcccccccccccCCccCHHHHHHhCccCCceeeEEHHHH
Confidence            9999999988888888776 22 223344454321   11111111110000    011111223566899999999999


Q ss_pred             HHHHHHhcCCccCCCCCChHHHHHHHHHcC
Q 006408          566 KFIVLQHGNQSLRLFKMEDVSMGMWVEQFN  595 (646)
Q Consensus       566 ~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lg  595 (646)
                      +.+..-  ..  .....||.++.+.+...+
T Consensus       165 ~~~~~~--~~--~~~~~~D~~~~~~~~~~~  190 (214)
T cd04196         165 ELALPF--PD--ADVIMHDWWLALLASAFG  190 (214)
T ss_pred             Hhhccc--cc--cccccchHHHHHHHHHcC
Confidence            998652  11  115689998887777644


No 21 
>cd04192 GT_2_like_e Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=91.84  E-value=6.5  Score=38.29  Aligned_cols=131  Identities=11%  Similarity=0.011  Sum_probs=74.5

Q ss_pred             CcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcC-CCcceEEEeeccCCCcc----c
Q 006408          459 GDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIF-PKRSLYMGNLNLLHRPL----R  533 (646)
Q Consensus       459 gDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~-~~~~lY~G~v~~~~~P~----R  533 (646)
                      ..+..++.... .+. .|. ..+.++.+....+|++.+|+|+.+..+.|...+..+. .....+.|..... .+.    +
T Consensus        55 ~~v~~~~~~~~-~~~-g~~-~a~n~g~~~~~~d~i~~~D~D~~~~~~~l~~l~~~~~~~~~~~v~~~~~~~-~~~~~~~~  130 (229)
T cd04192          55 FQLKILNNSRV-SIS-GKK-NALTTAIKAAKGDWIVTTDADCVVPSNWLLTFVAFIQKEQIGLVAGPVIYF-KGKSLLAK  130 (229)
T ss_pred             cceEEeeccCc-ccc-hhH-HHHHHHHHHhcCCEEEEECCCcccCHHHHHHHHHHhhcCCCcEEeeeeeec-CCccHHHH
Confidence            34555554431 222 233 2346666677899999999999999887777776443 2334555554332 110    0


Q ss_pred             --cccceecc---ccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCC
Q 006408          534 --TGKWAVTY---EEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNS  596 (646)
Q Consensus       534 --~sKWyVs~---eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi  596 (646)
                        .-.+....   ..+....++..+.|+++++++++.+.+---   ........||..++.-+...+.
T Consensus       131 ~~~~~~~~~~~~~~~~~~~~~~~~~~g~~~~~rr~~~~~~ggf---~~~~~~~~eD~~~~~~~~~~g~  195 (229)
T cd04192         131 FQRLDWLSLLGLIAGSFGLGKPFMCNGANMAYRKEAFFEVGGF---EGNDHIASGDDELLLAKVASKY  195 (229)
T ss_pred             HHHHHHHHHHHHHhhHHHhcCccccccceEEEEHHHHHHhcCC---ccccccccCCHHHHHHHHHhCC
Confidence              00010000   011223456677899999999999998541   1112345688887776665554


No 22 
>cd04186 GT_2_like_c Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=91.52  E-value=6.1  Score=36.10  Aligned_cols=83  Identities=12%  Similarity=0.209  Sum_probs=56.9

Q ss_pred             hhcCCceEEEEecCCccccHHHHHHHHhhcCCC-cceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCeEEeCHH
Q 006408          485 VQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPK-RSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPGYVISSD  563 (646)
Q Consensus       485 ~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~-~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~GYVLSrd  563 (646)
                      .+....+|++.+|||.++..+.+...++.+... .-..++..                           +.|++.+++++
T Consensus        70 ~~~~~~~~i~~~D~D~~~~~~~l~~~~~~~~~~~~~~~~~~~---------------------------~~~~~~~~~~~  122 (166)
T cd04186          70 IREAKGDYVLLLNPDTVVEPGALLELLDAAEQDPDVGIVGPK---------------------------VSGAFLLVRRE  122 (166)
T ss_pred             HhhCCCCEEEEECCCcEECccHHHHHHHHHHhCCCceEEEcc---------------------------CceeeEeeeHH
Confidence            344489999999999999988888777754322 21222221                           58999999999


Q ss_pred             HHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          564 IAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       564 la~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +++.+..-  .... ....||..+.+-+...|.+
T Consensus       123 ~~~~~~~~--~~~~-~~~~eD~~~~~~~~~~g~~  153 (166)
T cd04186         123 VFEEVGGF--DEDF-FLYYEDVDLCLRARLAGYR  153 (166)
T ss_pred             HHHHcCCC--Chhh-hccccHHHHHHHHHHcCCe
Confidence            99987421  1111 1266999998888877754


No 23 
>cd04187 DPM1_like_bac Bacterial DPM1_like enzymes are related to eukaryotic DPM1. A family of  bacterial enzymes related to eukaryotic DPM1; Although the mechanism of eukaryotic enzyme is well studied, the mechanism of the  bacterial enzymes is not well understood. The eukaryotic DPM1 is the catalytic subunit of eukaryotic Dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. The enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. This protein family belongs to Glycosyltransferase 2 superfamily.
Probab=91.28  E-value=2  Score=40.87  Aligned_cols=132  Identities=11%  Similarity=0.055  Sum_probs=73.3

Q ss_pred             eEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHh
Q 006408          433 VVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIE  512 (646)
Q Consensus       433 v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~  512 (646)
                      +.++.+-..+.+. ....++....++..+..+....++.    |. .++..+.+....+|++.+|+|.....+.|...++
T Consensus        30 ~eiivvdd~s~d~-t~~~~~~~~~~~~~i~~i~~~~n~G----~~-~a~n~g~~~a~~d~i~~~D~D~~~~~~~l~~l~~  103 (181)
T cd04187          30 YEIIFVDDGSTDR-TLEILRELAARDPRVKVIRLSRNFG----QQ-AALLAGLDHARGDAVITMDADLQDPPELIPEMLA  103 (181)
T ss_pred             eEEEEEeCCCCcc-HHHHHHHHHhhCCCEEEEEecCCCC----cH-HHHHHHHHhcCCCEEEEEeCCCCCCHHHHHHHHH
Confidence            4444444434333 2233444444566666655443332    22 3344455556679999999999998887777777


Q ss_pred             hcCCCcceEEEeeccCCCcc-cc--ccceeccccCCCCCCCCCCCCCeEEeCHHHHHHHHH
Q 006408          513 GIFPKRSLYMGNLNLLHRPL-RT--GKWAVTYEEWPQEVYPPYANGPGYVISSDIAKFIVL  570 (646)
Q Consensus       513 ~~~~~~~lY~G~v~~~~~P~-R~--sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~  570 (646)
                      .......+.+|.......+. +.  ++.+...........-+...|+.+++++.+++.+..
T Consensus       104 ~~~~~~~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~i~~  164 (181)
T cd04187         104 KWEEGYDVVYGVRKNRKESWLKRLTSKLFYRLINKLSGVDIPDNGGDFRLMDRKVVDALLL  164 (181)
T ss_pred             HHhCCCcEEEEEecCCcchHHHHHHHHHHHHHHHHHcCCCCCCCCCCEEEEcHHHHHHHHh
Confidence            65554566667655332111 10  111111011111223345678889999999999875


No 24 
>cd02510 pp-GalNAc-T pp-GalNAc-T initiates the formation of mucin-type O-linked glycans. UDP-GalNAc: polypeptide alpha-N-acetylgalactosaminyltransferases (pp-GalNAc-T) initiate the formation of mucin-type, O-linked glycans by catalyzing the transfer of alpha-N-acetylgalactosamine (GalNAc) from UDP-GalNAc to hydroxyl groups of Ser or Thr residues of core proteins to form the Tn antigen (GalNAc-a-1-O-Ser/Thr). These enzymes are type II membrane proteins with a GT-A type catalytic domain and a lectin domain located on the lumen side of the Golgi apparatus. In human, there are 15 isozymes of pp-GalNAc-Ts, representing the largest of all glycosyltransferase families. Each isozyme has unique but partially redundant substrate specificity for glycosylation sites on acceptor proteins.
Probab=90.62  E-value=12  Score=39.11  Aligned_cols=116  Identities=15%  Similarity=0.157  Sum_probs=67.7

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCC-cceEEEeeccC---------CCc-ccc-------ccceecc
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPK-RSLYMGNLNLL---------HRP-LRT-------GKWAVTY  541 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~-~~lY~G~v~~~---------~~P-~R~-------sKWyVs~  541 (646)
                      +...+.+....+||+.+|+|+.+..+-|-.++..+... ..+..+.+...         ..+ .+.       ..|....
T Consensus        74 a~N~g~~~A~gd~i~fLD~D~~~~~~wL~~ll~~l~~~~~~~v~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  153 (299)
T cd02510          74 ARIAGARAATGDVLVFLDSHCEVNVGWLEPLLARIAENRKTVVCPIIDVIDADTFEYRGSSGDARGGFDWSLHFKWLPLP  153 (299)
T ss_pred             HHHHHHHHccCCEEEEEeCCcccCccHHHHHHHHHHhCCCeEEEeeeccccCCCeeEecCCCceeEEecccceeccccCC
Confidence            45555556678999999999999877777776654321 22333322110         000 010       0111110


Q ss_pred             cc-----CC-CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          542 EE-----WP-QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       542 ee-----yp-~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ..     .+ ....-+++.|+++++++++...+---  ...+.....||+-+..=+.+.|..
T Consensus       154 ~~~~~~~~~~~~~~~~~~~g~~~~irr~~~~~vGgf--De~~~~~~~ED~Dl~~R~~~~G~~  213 (299)
T cd02510         154 EEERRRESPTAPIRSPTMAGGLFAIDREWFLELGGY--DEGMDIWGGENLELSFKVWQCGGS  213 (299)
T ss_pred             HHHhhhcCCCCCccCccccceeeEEEHHHHHHhCCC--CCcccccCchhHHHHHHHHHcCCe
Confidence            00     01 12334677899999999999998531  223333346999998888888865


No 25 
>cd06423 CESA_like CESA_like is  the cellulose synthase superfamily. The cellulose synthase (CESA) superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains. The members include cellulose synthase catalytic subunit, chitin synthase, glucan biosynthesis protein and other families of CESA-like proteins. Cellulose synthase catalyzes the polymerization reaction of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues in  plants, most algae, some bacteria and fungi, and even some animals. In bacteria, algae and lower eukaryotes, there is a second unrelated type of cellulose synthase (Type II), which produces acylated cellulose, a derivative of cellulose. Chitin synthase catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin, which is a linear homopolymer of beta-(1,4)-linked GlcNAc residues and Glucan Biosynthesis protein catalyzes the
Probab=90.32  E-value=3.4  Score=37.34  Aligned_cols=92  Identities=12%  Similarity=0.022  Sum_probs=51.6

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC--CcceEEEeeccCCC---cccc------ccceeccccC-CC
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP--KRSLYMGNLNLLHR---PLRT------GKWAVTYEEW-PQ  546 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~--~~~lY~G~v~~~~~---P~R~------sKWyVs~eey-p~  546 (646)
                      ..+.++.+..+.+|++.+|+|.++..+.|...+.....  .-.++.|.......   ....      ..+......+ ..
T Consensus        68 ~~~n~~~~~~~~~~i~~~D~D~~~~~~~l~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  147 (180)
T cd06423          68 GALNAGLRHAKGDIVVVLDADTILEPDALKRLVVPFFADPKVGAVQGRVRVRNGSENLLTRLQAIEYLSIFRLGRRAQSA  147 (180)
T ss_pred             HHHHHHHHhcCCCEEEEECCCCCcChHHHHHHHHHhccCCCeeeEeeeEEEecCcCcceeccchheecceeeeeeehhhe
Confidence            34455556668999999999999987776666454322  22233344332111   1110      0011110000 12


Q ss_pred             CCCCCCCCCCeEEeCHHHHHHHHH
Q 006408          547 EVYPPYANGPGYVISSDIAKFIVL  570 (646)
Q Consensus       547 ~~YPpY~~G~GYVLSrdla~~Iv~  570 (646)
                      ..+..++.|.+++++++++..+-.
T Consensus       148 ~~~~~~~~g~~~~~~~~~~~~~gg  171 (180)
T cd06423         148 LGGVLVLSGAFGAFRREALREVGG  171 (180)
T ss_pred             ecceeecCchHHHHHHHHHHHhCC
Confidence            234567789999999999988753


No 26 
>PRK11204 N-glycosyltransferase; Provisional
Probab=90.12  E-value=7.3  Score=42.85  Aligned_cols=146  Identities=14%  Similarity=0.132  Sum_probs=84.1

Q ss_pred             EEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcC-
Q 006408          437 FFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIF-  515 (646)
Q Consensus       437 FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~-  515 (646)
                      +++....+++..+.+++..+.+..+..+...+   |.. |. ..+..+.+..+.+|++..|+|+.+..+.|...++... 
T Consensus        87 iVvdD~s~d~t~~~l~~~~~~~~~v~~i~~~~---n~G-ka-~aln~g~~~a~~d~i~~lDaD~~~~~d~L~~l~~~~~~  161 (420)
T PRK11204         87 IAINDGSSDNTGEILDRLAAQIPRLRVIHLAE---NQG-KA-NALNTGAAAARSEYLVCIDGDALLDPDAAAYMVEHFLH  161 (420)
T ss_pred             EEEECCCCccHHHHHHHHHHhCCcEEEEEcCC---CCC-HH-HHHHHHHHHcCCCEEEEECCCCCCChhHHHHHHHHHHh
Confidence            34444334444555555566676666655333   222 43 3456666667899999999999999998888887662 


Q ss_pred             -CCcceEEEeeccCCCcccc-ccceec--cccCC---------CC--CCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCC
Q 006408          516 -PKRSLYMGNLNLLHRPLRT-GKWAVT--YEEWP---------QE--VYPPYANGPGYVISSDIAKFIVLQHGNQSLRLF  580 (646)
Q Consensus       516 -~~~~lY~G~v~~~~~P~R~-sKWyVs--~eeyp---------~~--~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f  580 (646)
                       +.-....|....     ++ ..|.-.  ..+|.         ..  ..+..++|++.++.+++++.+---  ..   ..
T Consensus       162 ~~~v~~v~g~~~~-----~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~~~rr~~l~~vgg~--~~---~~  231 (420)
T PRK11204        162 NPRVGAVTGNPRI-----RNRSTLLGRIQVGEFSSIIGLIKRAQRVYGRVFTVSGVITAFRKSALHEVGYW--ST---DM  231 (420)
T ss_pred             CCCeEEEECCcee-----ccchhHHHHHHHHHHHHhhhHHHHHHHHhCCceEecceeeeeeHHHHHHhCCC--CC---Cc
Confidence             222233332211     11 000000  00010         00  112245799999999999887431  11   13


Q ss_pred             CCChHHHHHHHHHcCCC
Q 006408          581 KMEDVSMGMWVEQFNST  597 (646)
Q Consensus       581 ~~EDV~iGi~l~~lgi~  597 (646)
                      -.||+.++.-+.+.|..
T Consensus       232 ~~ED~~l~~rl~~~G~~  248 (420)
T PRK11204        232 ITEDIDISWKLQLRGWD  248 (420)
T ss_pred             ccchHHHHHHHHHcCCe
Confidence            46999999999988865


No 27 
>cd06433 GT_2_WfgS_like WfgS and WfeV are involved in O-antigen biosynthesis. Escherichia coli WfgS and Shigella dysenteriae WfeV are glycosyltransferase 2 family enzymes involved in O-antigen biosynthesis. GT-2 enzymes have GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=90.01  E-value=7.3  Score=36.75  Aligned_cols=115  Identities=11%  Similarity=0.014  Sum_probs=69.5

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhc--CCCcceEEEeeccCCCccc-cccceeccccCCCCCCCCCCCC
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGI--FPKRSLYMGNLNLLHRPLR-TGKWAVTYEEWPQEVYPPYANG  555 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~--~~~~~lY~G~v~~~~~P~R-~sKWyVs~eeyp~~~YPpY~~G  555 (646)
                      ..+..+.+....+|++.+|+|.++..+.+...+...  .+...+..|.......... ...+.........-....++.+
T Consensus        65 ~a~n~~~~~a~~~~v~~ld~D~~~~~~~~~~~~~~~~~~~~~~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  144 (202)
T cd06433          65 DAMNKGIALATGDIIGFLNSDDTLLPGALLAVVAAFAEHPEVDVVYGDVLLVDENGRVIGRRRPPPFLDKFLLYGMPICH  144 (202)
T ss_pred             HHHHHHHHHcCCCEEEEeCCCcccCchHHHHHHHHHHhCCCccEEEeeeEEEcCCCCcccCCCCcchhhhHHhhcCcccC
Confidence            345556666789999999999999988888877433  2334456666532111111 1111111111122234456788


Q ss_pred             CeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          556 PGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       556 ~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ++.++++++.+.+.. + ..  .+...||..+..-+.+.|..
T Consensus       145 ~~~~~~~~~~~~~~~-f-~~--~~~~~~D~~~~~r~~~~g~~  182 (202)
T cd06433         145 QATFFRRSLFEKYGG-F-DE--SYRIAADYDLLLRLLLAGKI  182 (202)
T ss_pred             cceEEEHHHHHHhCC-C-ch--hhCchhhHHHHHHHHHcCCc
Confidence            899999999998853 1 11  23346899888888877754


No 28 
>cd06421 CESA_CelA_like CESA_CelA_like are involved in the elongation of the glucan chain of cellulose. Family of proteins related to  Agrobacterium tumefaciens CelA and  Gluconacetobacter xylinus BscA. These proteins are involved in the elongation of the glucan chain of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues. They are putative catalytic subunit of cellulose synthase, which is a glycosyltransferase using UDP-glucose as the substrate. The catalytic subunit is an integral membrane protein with 6 transmembrane segments and it is postulated that the protein is anchored in the membrane at the N-terminal end.
Probab=89.93  E-value=1.6  Score=42.89  Aligned_cols=112  Identities=11%  Similarity=0.026  Sum_probs=67.0

Q ss_pred             HhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC-Cc-ceEEEeecc-CCCc----ccc----ccceeccccCC-CCC
Q 006408          481 CEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP-KR-SLYMGNLNL-LHRP----LRT----GKWAVTYEEWP-QEV  548 (646)
Q Consensus       481 l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~-~~-~lY~G~v~~-~~~P----~R~----sKWyVs~eeyp-~~~  548 (646)
                      +..+.+....+|++.+|+|+++..+.|...+..... .+ .+..|.... ....    .+.    ...+....... ...
T Consensus        76 ~n~~~~~a~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  155 (234)
T cd06421          76 LNNALAHTTGDFVAILDADHVPTPDFLRRTLGYFLDDPKVALVQTPQFFYNPDPFDWLADGAPNEQELFYGVIQPGRDRW  155 (234)
T ss_pred             HHHHHHhCCCCEEEEEccccCcCccHHHHHHHHHhcCCCeEEEecceEEecCCcchhHHHHHHHHHHHHHHHHHHHHhhc
Confidence            344555558999999999999999988888876643 22 222232211 1111    110    01111100001 012


Q ss_pred             CCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          549 YPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       549 YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ...++.|++.++++++++.+..-  .   .....||..++.-+.+.|..
T Consensus       156 ~~~~~~g~~~~~r~~~~~~ig~~--~---~~~~~eD~~l~~r~~~~g~~  199 (234)
T cd06421         156 GAAFCCGSGAVVRREALDEIGGF--P---TDSVTEDLATSLRLHAKGWR  199 (234)
T ss_pred             CCceecCceeeEeHHHHHHhCCC--C---ccceeccHHHHHHHHHcCce
Confidence            24567899999999999987541  1   12347999999999988865


No 29 
>PF00535 Glycos_transf_2:  Glycosyl transferase family 2;  InterPro: IPR001173 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. This domain is found in a diverse family of glycosyl transferases that transfer the sugar from UDP-glucose, UDP-N-acetyl-galactosamine, GDP-mannose or CDP-abequose, to a range of substrates including cellulose, dolichol phosphate and teichoic acids.; PDB: 2Z87_A 2Z86_B 2D7R_A 2D7I_A 3CKN_A 3CKQ_A 3CKJ_A 3CKV_A 3CKO_A 2FFU_A ....
Probab=89.77  E-value=3  Score=37.75  Aligned_cols=154  Identities=14%  Similarity=0.118  Sum_probs=76.7

Q ss_pred             EEEEeCCCCCHHHH-HHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHH
Q 006408          402 FIGVLSATNHFAER-MAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAI  480 (646)
Q Consensus       402 lI~V~Sap~~~~rR-~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~  480 (646)
                      +|.+.-.+....+- ..+++.  .     .....+.+ +-...+.+..+.+.+-.+....+..+...++. .+    -..
T Consensus         3 vip~~n~~~~l~~~l~sl~~q--~-----~~~~eiiv-vdd~s~d~~~~~~~~~~~~~~~i~~i~~~~n~-g~----~~~   69 (169)
T PF00535_consen    3 VIPTYNEAEYLERTLESLLKQ--T-----DPDFEIIV-VDDGSTDETEEILEEYAESDPNIRYIRNPENL-GF----SAA   69 (169)
T ss_dssp             EEEESS-TTTHHHHHHHHHHH--S-----GCEEEEEE-EECS-SSSHHHHHHHHHCCSTTEEEEEHCCCS-HH----HHH
T ss_pred             EEEeeCCHHHHHHHHHHHhhc--c-----CCCEEEEE-eccccccccccccccccccccccccccccccc-cc----ccc
Confidence            34444444444443 556665  1     12233433 33333444444555444445666666665543 22    233


Q ss_pred             HhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC-CcceEEEeeccCCCcccc-----c--cceec---cccCCCCCC
Q 006408          481 CEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP-KRSLYMGNLNLLHRPLRT-----G--KWAVT---YEEWPQEVY  549 (646)
Q Consensus       481 l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~-~~~lY~G~v~~~~~P~R~-----s--KWyVs---~eeyp~~~Y  549 (646)
                      +..+.+....+|++.+|||.++..+.|..+++.+.. ...+.+|.........+.     .  .|...   ........-
T Consensus        70 ~n~~~~~a~~~~i~~ld~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  149 (169)
T PF00535_consen   70 RNRGIKHAKGEYILFLDDDDIISPDWLEELVEALEKNPPDVVIGSVIYIDDDNRYPDRRLRFSFWNRFERKIFNNIRFWK  149 (169)
T ss_dssp             HHHHHHH--SSEEEEEETTEEE-TTHHHHHHHHHHHCTTEEEEEEEEEEECTTETEECCCTSEEEECCHCHHHHTTHSTT
T ss_pred             ccccccccceeEEEEeCCCceEcHHHHHHHHHHHHhCCCcEEEEEEEEecCCccccccccchhhhhhhhhHHHHhhhcCC
Confidence            444555556779999999999998766666655432 233455554422111110     0  01000   011112334


Q ss_pred             CCCCCCCeEEeCHHHHHHH
Q 006408          550 PPYANGPGYVISSDIAKFI  568 (646)
Q Consensus       550 PpY~~G~GYVLSrdla~~I  568 (646)
                      -+++.|++.++++++.+++
T Consensus       150 ~~~~~~~~~~~rr~~~~~~  168 (169)
T PF00535_consen  150 ISFFIGSCALFRRSVFEEI  168 (169)
T ss_dssp             SSEESSSCEEEEEHHHHHC
T ss_pred             cccccccEEEEEHHHHHhh
Confidence            4677899999999998875


No 30 
>PF13506 Glyco_transf_21:  Glycosyl transferase family 21
Probab=89.62  E-value=0.42  Score=46.96  Aligned_cols=117  Identities=14%  Similarity=0.049  Sum_probs=72.1

Q ss_pred             HHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC-CcceEEEeeccCCCcccc-----ccceec--cccCCCC
Q 006408          476 KTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP-KRSLYMGNLNLLHRPLRT-----GKWAVT--YEEWPQE  547 (646)
Q Consensus       476 Ktl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~-~~~lY~G~v~~~~~P~R~-----sKWyVs--~eeyp~~  547 (646)
                      |.-.+..-.....++++++..|+|+.|..+.|.+.+..+.. .-.+.-|.. . ..|.++     ..-++.  ...+..-
T Consensus        18 Kv~nL~~~~~~~a~~d~~~~~DsDi~v~p~~L~~lv~~l~~p~vglVt~~~-~-~~~~~~~~~~l~~~~~~~~~~~~~a~   95 (175)
T PF13506_consen   18 KVNNLAQGLEAGAKYDYLVISDSDIRVPPDYLRELVAPLADPGVGLVTGLP-R-GVPARGFWSRLEAAFFNFLPGVLQAL   95 (175)
T ss_pred             HHHHHHHHHHhhCCCCEEEEECCCeeECHHHHHHHHHHHhCCCCcEEEecc-c-ccCCcCHHHHHHHHHHhHHHHHHHHh
Confidence            44444332222368999999999999999999888877643 333332221 1 122222     111110  0000011


Q ss_pred             CCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          548 VYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       548 ~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .-.++|.|+.+++.+++++.+---   ..+.-.-.||..+|..+.+.|.+
T Consensus        96 ~~~~~~~G~~m~~rr~~L~~~GG~---~~l~~~ladD~~l~~~~~~~G~~  142 (175)
T PF13506_consen   96 GGAPFAWGGSMAFRREALEEIGGF---EALADYLADDYALGRRLRARGYR  142 (175)
T ss_pred             cCCCceecceeeeEHHHHHHcccH---HHHhhhhhHHHHHHHHHHHCCCe
Confidence            246789999999999999987321   12233568999999999999976


No 31 
>cd06420 GT2_Chondriotin_Pol_N N-terminal domain of Chondroitin polymerase functions as a GalNAc transferase. Chondroitin polymerase is a two domain, bi-functional protein. The N-terminal domain functions as a GalNAc transferase. The bacterial chondroitin polymerase catalyzes elongation of the chondroitin chain by alternatively transferring the GlcUA and GalNAc moiety from UDP-GlcUA and UDP-GalNAc to the non-reducing ends of the chondroitin chain. The enzyme consists of N-terminal and C-terminal domains in which the two active sites catalyze the addition of GalNAc and GlcUA, respectively. Chondroitin chains range from 40 to over 100 repeating units of the disaccharide. Sulfated chondroitins are involved in the regulation of various biological functions such as central nervous system development, wound repair, infection, growth factor signaling, and morphogenesis, in addition to its conventional structural roles. In Caenorhabditis elegans, chondroitin is an essential factor for the worm 
Probab=89.26  E-value=7.2  Score=36.73  Aligned_cols=99  Identities=15%  Similarity=0.077  Sum_probs=62.8

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCeEE
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPGYV  559 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~GYV  559 (646)
                      .+..+.+....+|++..|+|..+..+-|...++...+ .....|.........                -.....|++++
T Consensus        70 ~~n~g~~~a~g~~i~~lD~D~~~~~~~l~~~~~~~~~-~~~v~g~~~~~~~~~----------------~~~~~~~~~~~  132 (182)
T cd06420          70 IRNKAIAAAKGDYLIFIDGDCIPHPDFIADHIELAEP-GVFLSGSRVLLNEKL----------------TERGIRGCNMS  132 (182)
T ss_pred             HHHHHHHHhcCCEEEEEcCCcccCHHHHHHHHHHhCC-CcEEecceeeccccc----------------ceeEeccceEE
Confidence            3455556668999999999999998888777776643 223334322111100                01344688888


Q ss_pred             eCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          560 ISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       560 LSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +.+..+..+..-  .........||+.++.-+.+.|+.
T Consensus       133 ~~r~~~~~~ggf--~~~~~~~~~eD~~l~~r~~~~g~~  168 (182)
T cd06420         133 FWKKDLLAVNGF--DEEFTGWGGEDSELVARLLNSGIK  168 (182)
T ss_pred             EEHHHHHHhCCC--CcccccCCcchHHHHHHHHHcCCc
Confidence            888888765431  222222347999999999988844


No 32 
>cd06439 CESA_like_1 CESA_like_1 is a member of the cellulose synthase (CESA) superfamily. This is a subfamily of cellulose synthase (CESA) superfamily.  CESA superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains.  The members of the superfamily include cellulose synthase catalytic subunit, chitin synthase, glucan biosynthesis protein and other families of CESA-like proteins.
Probab=89.26  E-value=10  Score=37.90  Aligned_cols=180  Identities=11%  Similarity=0.062  Sum_probs=89.0

Q ss_pred             eEEEEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHH
Q 006408          400 HLFIGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIA  479 (646)
Q Consensus       400 ~LlI~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~  479 (646)
                      .+-|+|.+--....-...|+.-..|...  .....++++...+.+ .....+.+-.+.  .+.++...++.   . |. .
T Consensus        30 ~isVvip~~n~~~~l~~~l~si~~q~~~--~~~~eiivvdd~s~d-~t~~~~~~~~~~--~v~~i~~~~~~---g-~~-~   99 (251)
T cd06439          30 TVTIIIPAYNEEAVIEAKLENLLALDYP--RDRLEIIVVSDGSTD-GTAEIAREYADK--GVKLLRFPERR---G-KA-A   99 (251)
T ss_pred             EEEEEEecCCcHHHHHHHHHHHHhCcCC--CCcEEEEEEECCCCc-cHHHHHHHHhhC--cEEEEEcCCCC---C-hH-H
Confidence            4555555443332234555555554321  112344444333333 233333322222  34444332221   1 32 3


Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC-CcceEEEeeccCCCc--ccccc--ceecc--ccCC-CCCCCC
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP-KRSLYMGNLNLLHRP--LRTGK--WAVTY--EEWP-QEVYPP  551 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~-~~~lY~G~v~~~~~P--~R~sK--WyVs~--eeyp-~~~YPp  551 (646)
                      .+..+.+....+|++.+|+|+++..+-|.+.+..+.. .-.+..|........  .+...  |....  ..+. ....+.
T Consensus       100 a~n~gi~~a~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  179 (251)
T cd06439         100 ALNRALALATGEIVVFTDANALLDPDALRLLVRHFADPSVGAVSGELVIVDGGGSGSGEGLYWKYENWLKRAESRLGSTV  179 (251)
T ss_pred             HHHHHHHHcCCCEEEEEccccCcCHHHHHHHHHHhcCCCccEEEeEEEecCCcccchhHHHHHHHHHHHHHHHHhcCCee
Confidence            3455555566799999999999997777777777643 234445554432111  01111  10000  0000 112234


Q ss_pred             CCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          552 YANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       552 Y~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .+.|+++.+.+++..    .. .   .....||..++..+.+.|..
T Consensus       180 ~~~g~~~~~rr~~~~----~~-~---~~~~~eD~~l~~~~~~~G~~  217 (251)
T cd06439         180 GANGAIYAIRRELFR----PL-P---ADTINDDFVLPLRIARQGYR  217 (251)
T ss_pred             eecchHHHhHHHHhc----CC-C---cccchhHHHHHHHHHHcCCe
Confidence            567888878877766    11 1   12346999999999888854


No 33 
>cd02525 Succinoglycan_BP_ExoA ExoA is involved in the biosynthesis of succinoglycan. Succinoglycan Biosynthesis Protein ExoA catalyzes the formation of a beta-1,3 linkage of the second sugar (glucose) of the succinoglycan with the galactose on the lipid carrie. Succinoglycan is an acidic exopolysaccharide that is important for invasion of the nodules. Succinoglycan is a high-molecular-weight polymer composed of repeating octasaccharide units. These units are synthesized on membrane-bound isoprenoid lipid carriers, beginning with galactose followed by seven glucose molecules, and modified by the addition of acetate, succinate, and pyruvate. ExoA is a membrane protein with a transmembrance domain at c-terminus.
Probab=89.18  E-value=23  Score=34.82  Aligned_cols=155  Identities=10%  Similarity=0.072  Sum_probs=81.2

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEI  511 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L  511 (646)
                      +..++++-..+. .++...++...+.+..+..+.-...    . +. .++..+.+....+|++.+|+|..+..+.|...+
T Consensus        31 ~~evivvd~~s~-d~~~~~~~~~~~~~~~v~~i~~~~~----~-~~-~a~N~g~~~a~~d~v~~lD~D~~~~~~~l~~~~  103 (249)
T cd02525          31 LIEIIVVDGGST-DGTREIVQEYAAKDPRIRLIDNPKR----I-QS-AGLNIGIRNSRGDIIIRVDAHAVYPKDYILELV  103 (249)
T ss_pred             ccEEEEEeCCCC-ccHHHHHHHHHhcCCeEEEEeCCCC----C-ch-HHHHHHHHHhCCCEEEEECCCccCCHHHHHHHH
Confidence            344444444333 3334444444444444444432211    1 11 346666666689999999999999887777777


Q ss_pred             hhcCC-CcceEEEeeccC-CCccc-c------ccceeccccCCC--CCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCC
Q 006408          512 EGIFP-KRSLYMGNLNLL-HRPLR-T------GKWAVTYEEWPQ--EVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLF  580 (646)
Q Consensus       512 ~~~~~-~~~lY~G~v~~~-~~P~R-~------sKWyVs~eeyp~--~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f  580 (646)
                      ..... ...+..|..... ..+.. .      ..+......+..  ...-.++.|++.++++++.+.+.--  ..  .+.
T Consensus       104 ~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~--~~--~~~  179 (249)
T cd02525         104 EALKRTGADNVGGPMETIGESKFQKAIAVAQSSPLGSGGSAYRGGAVKIGYVDTVHHGAYRREVFEKVGGF--DE--SLV  179 (249)
T ss_pred             HHHhcCCCCEEecceecCCCChHHHHHHHHhhchhccCCccccccccccccccccccceEEHHHHHHhCCC--Cc--ccC
Confidence            55432 223444443221 11110 0      000000000111  1001255788889999998887431  11  234


Q ss_pred             CCChHHHHHHHHHcCCC
Q 006408          581 KMEDVSMGMWVEQFNST  597 (646)
Q Consensus       581 ~~EDV~iGi~l~~lgi~  597 (646)
                      ..||..++.-+.+.|..
T Consensus       180 ~~eD~~l~~r~~~~G~~  196 (249)
T cd02525         180 RNEDAELNYRLRKAGYK  196 (249)
T ss_pred             ccchhHHHHHHHHcCcE
Confidence            57999999888888855


No 34 
>cd04185 GT_2_like_b Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=89.18  E-value=7  Score=37.74  Aligned_cols=92  Identities=15%  Similarity=0.086  Sum_probs=59.7

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcC-CCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCe
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIF-PKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPG  557 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~-~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~G  557 (646)
                      .+++++. ....+|++..|+|..+..+.|...++... +.-.++.|......     +                  .+.|
T Consensus        70 ~~~~~a~-~~~~d~v~~ld~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~-----~------------------~~~~  125 (202)
T cd04185          70 EGVRRAY-ELGYDWIWLMDDDAIPDPDALEKLLAYADKDNPQFLAPLVLDPD-----G------------------SFVG  125 (202)
T ss_pred             HHHHHHh-ccCCCEEEEeCCCCCcChHHHHHHHHHHhcCCceEecceeEcCC-----C------------------ceEE
Confidence            3455555 45789999999999999887777766654 22234433322110     0                  3467


Q ss_pred             EEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          558 YVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       558 YVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .++.+++++.+--.  .... ....||+.+..-+.+.|..
T Consensus       126 ~~~~~~~~~~~g~~--~~~~-~~~~eD~~~~~r~~~~G~~  162 (202)
T cd04185         126 VLISRRVVEKIGLP--DKEF-FIWGDDTEYTLRASKAGPG  162 (202)
T ss_pred             EEEeHHHHHHhCCC--Chhh-hccchHHHHHHHHHHcCCc
Confidence            89999999887321  1111 2346999999999988865


No 35 
>cd06435 CESA_NdvC_like NdvC_like  proteins in this family are putative bacterial beta-(1,6)-glucosyltransferase. NdvC_like  proteins in this family are putative bacterial beta-(1,6)-glucosyltransferase. Bradyrhizobium japonicum synthesizes periplasmic cyclic beta-(1,3),beta-(1,6)-D-glucans during growth under hypoosmotic conditions. Two genes (ndvB, ndvC) are involved in the beta-(1, 3), beta-(1,6)-glucan synthesis. The ndvC mutant strain resulted in synthesis of altered cyclic beta-glucans composed almost entirely of beta-(1, 3)-glycosyl linkages. The periplasmic cyclic beta-(1,3),beta-(1,6)-D-glucans function for osmoregulation. The ndvC mutation also affects the ability of the bacteria to establish a successful symbiotic interaction with host plant. Thus, the beta-glucans may function as suppressors of a host defense response.
Probab=88.53  E-value=8  Score=38.31  Aligned_cols=113  Identities=11%  Similarity=0.014  Sum_probs=65.1

Q ss_pred             HHhhhhhcC--CceEEEEecCCccccHHHHHHHHhhcCCCc-ceEEEeeccC---CCcccc-ccce-----eccccCCCC
Q 006408          480 ICEFGVQNV--TAAYIMKCDDDTFIRVDAVLKEIEGIFPKR-SLYMGNLNLL---HRPLRT-GKWA-----VTYEEWPQE  547 (646)
Q Consensus       480 ~l~wa~~~~--~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~-~lY~G~v~~~---~~P~R~-sKWy-----Vs~eeyp~~  547 (646)
                      ++.++.+..  +.+||+.+|+|+.+..+.|...+..+.... .+..|.....   ..+... ..|.     .........
T Consensus        73 a~n~g~~~a~~~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  152 (236)
T cd06435          73 ALNYALERTAPDAEIIAVIDADYQVEPDWLKRLVPIFDDPRVGFVQAPQDYRDGEESLFKRMCYAEYKGFFDIGMVSRNE  152 (236)
T ss_pred             HHHHHHHhcCCCCCEEEEEcCCCCcCHHHHHHHHHHhcCCCeeEEecCccccCCCccHHHHHHhHHHHHHHHHHhccccc
Confidence            456665543  479999999999999999888887764322 2222221110   001100 0110     000000000


Q ss_pred             CCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          548 VYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       548 ~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .--.++.|++.+++++++..+---  ..   .+..||+-++.-+.+.|..
T Consensus       153 ~~~~~~~g~~~~~rr~~~~~iGgf--~~---~~~~eD~dl~~r~~~~G~~  197 (236)
T cd06435         153 RNAIIQHGTMCLIRRSALDDVGGW--DE---WCITEDSELGLRMHEAGYI  197 (236)
T ss_pred             cCceEEecceEEEEHHHHHHhCCC--CC---ccccchHHHHHHHHHCCcE
Confidence            001356799999999999998531  11   1347999999999888865


No 36 
>TIGR03469 HonB hopene-associated glycosyltransferase HpnB. This family of genes include a glycosyl transferase, group 2 domain (pfam00535) which are responsible, generally for the transfer of nucleotide-diphosphate sugars to substrates such as polysaccharides and lipids. The genes of this family are often found in the same genetic locus with squalene-hopene cyclase genes, and are never associated with genes for the metabolism of phytoene. Indeed, the members of this family appear to never be found in a genome lacking squalene-hopene cyclase (SHC), although not all genomes encoding SHC have this glycosyl transferase. In the organism Zymomonas mobilis the linkage of this gene to hopanoid biosynthesis has been noted and the gene named HpnB. Hopanoids are known to feature polar glycosyl head groups in many organisms.
Probab=88.40  E-value=5.1  Score=43.95  Aligned_cols=105  Identities=15%  Similarity=0.123  Sum_probs=61.2

Q ss_pred             CceEEEEecCCccccHHHHHHHHhhcCCC-cceEEEeeccCCCccccccceec------cccCC----C--CCCCCCCCC
Q 006408          489 TAAYIMKCDDDTFIRVDAVLKEIEGIFPK-RSLYMGNLNLLHRPLRTGKWAVT------YEEWP----Q--EVYPPYANG  555 (646)
Q Consensus       489 ~akfvmKvDDDtfVnvd~Ll~~L~~~~~~-~~lY~G~v~~~~~P~R~sKWyVs------~eeyp----~--~~YPpY~~G  555 (646)
                      +.+|++.+|+|+.+..+.|.+.+...... ..+..|......... ..+..++      ...|+    .  .....++.|
T Consensus       133 ~gd~llflDaD~~~~p~~l~~lv~~~~~~~~~~vs~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G  211 (384)
T TIGR03469       133 PADYLLLTDADIAHGPDNLARLVARARAEGLDLVSLMVRLRCESF-WEKLLIPAFVFFFQKLYPFRWVNDPRRRTAAAAG  211 (384)
T ss_pred             CCCEEEEECCCCCCChhHHHHHHHHHHhCCCCEEEecccccCCCH-HHHHHHHHHHHHHHHhcchhhhcCCCccceeecc
Confidence            38999999999999998888887765322 233322221100000 0000000      00011    0  112345679


Q ss_pred             CeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          556 PGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       556 ~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ++.++++++.+.+--.   ........||+.++.-+.+.|..
T Consensus       212 ~~~lirr~~~~~vGGf---~~~~~~~~ED~~L~~r~~~~G~~  250 (384)
T TIGR03469       212 GCILIRREALERIGGI---AAIRGALIDDCTLAAAVKRSGGR  250 (384)
T ss_pred             eEEEEEHHHHHHcCCH---HHHhhCcccHHHHHHHHHHcCCc
Confidence            9999999999998432   11122358999999999998854


No 37 
>PRK14583 hmsR N-glycosyltransferase; Provisional
Probab=88.34  E-value=8.3  Score=43.18  Aligned_cols=153  Identities=14%  Similarity=0.127  Sum_probs=85.5

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEI  511 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L  511 (646)
                      +..+ +++....+.++.+.+.+..+.+..+..+....   |.. |. .+++.+....+.+|++..|.|+.+..+.|...+
T Consensus       104 ~~eI-ivVdDgs~D~t~~~~~~~~~~~~~v~vv~~~~---n~G-ka-~AlN~gl~~a~~d~iv~lDAD~~~~~d~L~~lv  177 (444)
T PRK14583        104 NIEV-IAINDGSSDDTAQVLDALLAEDPRLRVIHLAH---NQG-KA-IALRMGAAAARSEYLVCIDGDALLDKNAVPYLV  177 (444)
T ss_pred             CeEE-EEEECCCCccHHHHHHHHHHhCCCEEEEEeCC---CCC-HH-HHHHHHHHhCCCCEEEEECCCCCcCHHHHHHHH
Confidence            4443 33433333344455555556676665554332   222 43 456667677789999999999999999888887


Q ss_pred             hhc--CCCcceEEEeeccCCCccccccceeccccCCC---------CC--CCCCCCCCeEEeCHHHHHHHHHHhcCCccC
Q 006408          512 EGI--FPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQ---------EV--YPPYANGPGYVISSDIAKFIVLQHGNQSLR  578 (646)
Q Consensus       512 ~~~--~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~---------~~--YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~  578 (646)
                      +..  ++.-....|......+..--++....  +|..         ..  -+..++|.+.++.+++++.+--.  ..   
T Consensus       178 ~~~~~~~~~g~v~g~~~~~~~~~~~~~~~~~--e~~~~~~~~~~~~~~~g~~~~~sG~~~~~rr~al~~vGg~--~~---  250 (444)
T PRK14583        178 APLIANPRTGAVTGNPRIRTRSTLIGRVQVG--EFSSIIGLIKRTQRVYGQVFTVSGVVAAFRRRALADVGYW--SP---  250 (444)
T ss_pred             HHHHhCCCeEEEEccceecCCCcchhhHHHH--HHHHHHHHHHHHHHHhCCceEecCceeEEEHHHHHHcCCC--CC---
Confidence            755  22222333332211100000111000  1100         01  12245789999999999887431  11   


Q ss_pred             CCCCChHHHHHHHHHcCCC
Q 006408          579 LFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       579 ~f~~EDV~iGi~l~~lgi~  597 (646)
                      ..-.||..++.-+...|.+
T Consensus       251 ~~i~ED~dl~~rl~~~G~~  269 (444)
T PRK14583        251 DMITEDIDISWKLQLKHWS  269 (444)
T ss_pred             CcccccHHHHHHHHHcCCe
Confidence            1236999999999988865


No 38 
>cd06532 Glyco_transf_25 Glycosyltransferase family 25 [lipooligosaccharide (LOS) biosynthesis protein] is a family of glycosyltransferases involved in LOS biosynthesis. The members include the beta(1,4) galactosyltransferases: Lgt2 of Moraxella catarrhalis, LgtB and LgtE of Neisseria gonorrhoeae and Lic2A of Haemophilus influenzae. M. catarrhalis Lgt2 catalyzes the addition of galactose (Gal) to the growing chain of LOS on the cell surface. N. gonorrhoeae LgtB and LgtE link Gal-beta(1,4)  to GlcNAc (N-acetylglucosamine) and Glc (glucose), respectively. The genes encoding LgtB and LgtE are two genes of a five gene locus involved in the synthesis of gonococcal LOS. LgtE is believed to perform the first step in LOS biosynthesis.
Probab=88.18  E-value=3.1  Score=38.61  Aligned_cols=110  Identities=18%  Similarity=0.204  Sum_probs=65.4

Q ss_pred             EEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHh-----hcCcEEEEeecccccchhHHH
Q 006408          403 IGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAA-----FFGDIVILPFMDRYELVVLKT  477 (646)
Q Consensus       403 I~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae-----~ygDII~~df~DsY~nLtlKt  477 (646)
                      |.|.+-++..+||..+++.....      ++...||-|..........+.....     .++    .+....----.+..
T Consensus         2 i~vInL~~~~~Rr~~~~~~~~~~------~~~~~~~~Avd~~~~~~~~~~~~~~~~~~~~~~----~~l~~gEiGC~lSH   71 (128)
T cd06532           2 IFVINLDRSTDRRERMEAQLAAL------GLDFEFFDAVDGKDLSEEELAALYDALFLPRYG----RPLTPGEIGCFLSH   71 (128)
T ss_pred             EEEEECCCCHHHHHHHHHHHHHc------CCCeEEEeccccccCCHHHHHHHhHHHhhhhcC----CCCChhhHHHHHHH
Confidence            45788899999999999855433      3456677665443222222222111     111    00111111112333


Q ss_pred             HHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCe
Q 006408          478 IAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPG  557 (646)
Q Consensus       478 l~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~G  557 (646)
                      +.+++-+.+ -+.++.+-..||+.+..+                                                +..|
T Consensus        72 ~~~w~~~~~-~~~~~alIlEDDv~~~~~------------------------------------------------~~~~  102 (128)
T cd06532          72 YKLWQKIVE-SNLEYALILEDDAILDPD------------------------------------------------GTAG  102 (128)
T ss_pred             HHHHHHHHH-cCCCeEEEEccCcEECCC------------------------------------------------CceE
Confidence            444444432 256899999999999876                                                5679


Q ss_pred             EEeCHHHHHHHHHH
Q 006408          558 YVISSDIAKFIVLQ  571 (646)
Q Consensus       558 YVLSrdla~~Iv~~  571 (646)
                      |+||+..|++|++.
T Consensus       103 Y~vs~~~A~~ll~~  116 (128)
T cd06532         103 YLVSRKGAKKLLAA  116 (128)
T ss_pred             EEeCHHHHHHHHHh
Confidence            99999999999996


No 39 
>cd04191 Glucan_BSP_ModH Glucan_BSP_ModH catalyzes the elongation of beta-1,2 polyglucose chains of glucan. Periplasmic Glucan Biosynthesis protein ModH is a glucosyltransferase that catalyzes the elongation of beta-1,2 polyglucose chains of glucan, requiring a beta-glucoside as a primer and UDP-glucose as a substrate. Glucans are composed of 5 to 10 units of glucose forming a highly branched structure, where beta-1,2-linked glucose constitutes a linear backbone to which branches are attached by beta-1,6 linkages. In Escherichia coli, glucans are located in the periplasmic space, functioning as regulator of osmolarity. It is synthesized at a maximum when cells are grown in a medium with low osmolarity. It has been shown to span the cytoplasmic membrane.
Probab=87.99  E-value=6.2  Score=41.09  Aligned_cols=187  Identities=12%  Similarity=0.075  Sum_probs=94.6

Q ss_pred             EEEeCCCCCHH-HHHHHHHHhhcccccC-CCceEEEEEEeeCCChhHHHH-------HHHHHhhcCcEEEEeecccccch
Q 006408          403 IGVLSATNHFA-ERMAIRKTWMQSSKIK-SSNVVARFFVALNPRKEVNAV-------LKKEAAFFGDIVILPFMDRYELV  473 (646)
Q Consensus       403 I~V~Sap~~~~-rR~aIR~TW~~~~~i~-~~~v~~~FfVG~~~~~~~~~~-------L~~Eae~ygDII~~df~DsY~nL  473 (646)
                      |+|++--.... -...++..+....... ..++.+ |++..+.++++...       |.+|   +..-+.+-+...-.|.
T Consensus         3 IliP~~ne~~~~l~~~l~~~~~~~~~~~~~~~~eI-~vldD~~d~~~~~~~~~~~~~l~~~---~~~~~~v~~~~r~~~~   78 (254)
T cd04191           3 IVMPVYNEDPARVFAGLRAMYESLAKTGLADHFDF-FILSDTRDPDIWLAEEAAWLDLCEE---LGAQGRIYYRRRRENT   78 (254)
T ss_pred             EEEeCCCCCHHHHHHHHHHHHHHHHhcCCcCceEE-EEECCCCChHHHHHHHHHHHHHHHH---hCCCCcEEEEEcCCCC
Confidence            44555444444 4566666653110000 123455 77765555443221       2223   3322223333333344


Q ss_pred             hHHHHHHHhhhhhc-CCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCcc-cc---ccce----------
Q 006408          474 VLKTIAICEFGVQN-VTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPL-RT---GKWA----------  538 (646)
Q Consensus       474 tlKtl~~l~wa~~~-~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~-R~---sKWy----------  538 (646)
                      -+|+-.+-...... .+.+||+-.|.|+.+..+.|...+..+.....  +|-+....... ++   .++.          
T Consensus        79 g~Kag~l~~~~~~~~~~~~~i~~~DaD~~~~p~~l~~~v~~~~~~~~--vg~vq~~~~~~n~~~~~~~~~~~~~~~~~~~  156 (254)
T cd04191          79 GRKAGNIADFCRRWGSRYDYMVVLDADSLMSGDTIVRLVRRMEANPR--AGIIQTAPKLIGAETLFARLQQFANRLYGPV  156 (254)
T ss_pred             CccHHHHHHHHHHhCCCCCEEEEEeCCCCCCHHHHHHHHHHHHhCCC--EEEEeCCceeECCCCHHHHHHHHHHHHHHHH
Confidence            44555444433322 47899999999999999999998887632111  23332111100 00   1110          


Q ss_pred             --eccccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhc---CCcc-CCCCCChHHHHHHHHHcCCC
Q 006408          539 --VTYEEWPQEVYPPYANGPGYVISSDIAKFIVLQHG---NQSL-RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       539 --Vs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~---~~~l-~~f~~EDV~iGi~l~~lgi~  597 (646)
                        .....|..  .-.+|.|...++.++++..+..-..   .... .-.-.||..+|+.+...|.+
T Consensus       157 ~~~~~~~~~~--~~~~~~G~~~~~Rr~al~~~~~~~~i~g~g~~~~~~l~eD~~l~~~~~~~G~r  219 (254)
T cd04191         157 FGRGLAAWQG--GEGNYWGHNAIIRVAAFMEHCALPVLPGRPPFGGHILSHDFVEAALMRRAGWE  219 (254)
T ss_pred             HHHHHHHhcC--CccCccceEEEEEHHHHHHhcCCccccCCCCCCCCeecHHHHHHHHHHHcCCE
Confidence              00011211  1135679999999999887632100   0011 12357999999999988865


No 40 
>cd06434 GT2_HAS Hyaluronan synthases catalyze polymerization of hyaluronan. Hyaluronan synthases (HASs) are bi-functional glycosyltransferases that catalyze polymerization of hyaluronan. HASs transfer both GlcUA and GlcNAc in beta-(1,3) and beta-(1,4) linkages, respectively to the hyaluronan chain using UDP-GlcNAc and UDP-GlcUA as substrates. HA is made as a free glycan, not attached to a protein or lipid. HASs do not need a primer for HA synthesis; they initiate HA biosynthesis de novo with only UDP-GlcNAc, UDP-GlcUA, and Mg2+. Hyaluronan (HA) is a linear heteropolysaccharide composed of (1-3)-linked beta-D-GlcUA-beta-D-GlcNAc disaccharide repeats. It can be found in vertebrates and a few microbes and is typically on the cell surface or in the extracellular space, but is also found inside mammalian cells. Hyaluronan has several physiochemical and biological functions such as space filling, lubrication, and providing a hydrated matrix through which cells can migrate.
Probab=87.91  E-value=12  Score=36.80  Aligned_cols=157  Identities=15%  Similarity=0.081  Sum_probs=80.1

Q ss_pred             eEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHh
Q 006408          433 VVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIE  512 (646)
Q Consensus       433 v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~  512 (646)
                      ..++++...+.+ .....+ ++...+..+.+.. .+.    .-|.- .+..+.+....+|++.+|+|+.+..+.|...++
T Consensus        29 ~eiivvdd~s~d-~~~~~l-~~~~~~~~~~v~~-~~~----~g~~~-a~n~g~~~a~~d~v~~lD~D~~~~~~~l~~l~~  100 (235)
T cd06434          29 LEIIVVTDGDDE-PYLSIL-SQTVKYGGIFVIT-VPH----PGKRR-ALAEGIRHVTTDIVVLLDSDTVWPPNALPEMLK  100 (235)
T ss_pred             CEEEEEeCCCCh-HHHHHH-HhhccCCcEEEEe-cCC----CChHH-HHHHHHHHhCCCEEEEECCCceeChhHHHHHHH
Confidence            344444433333 333333 3445566666654 221    12332 234455555899999999999999999888887


Q ss_pred             hcCC-CcceEEEeeccCC---Ccccc-ccceec---cccCCC-C--CCCCCCCCCeEEeCHHHHHHHHHHhc-----CCc
Q 006408          513 GIFP-KRSLYMGNLNLLH---RPLRT-GKWAVT---YEEWPQ-E--VYPPYANGPGYVISSDIAKFIVLQHG-----NQS  576 (646)
Q Consensus       513 ~~~~-~~~lY~G~v~~~~---~P~R~-sKWyVs---~eeyp~-~--~YPpY~~G~GYVLSrdla~~Iv~~~~-----~~~  576 (646)
                      .+.. .-.+..|......   .+... ...+..   ...++. .  .--+++.|++.++.+++++.+.-...     -..
T Consensus       101 ~~~~~~v~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~~~rr~~l~~~~~~~~~~~~~~~~  180 (235)
T cd06434         101 PFEDPKVGGVGTNQRILRPRDSKWSFLAAEYLERRNEEIRAAMSYDGGVPCLSGRTAAYRTEILKDFLFLEEFTNETFMG  180 (235)
T ss_pred             hccCCCEeEEcCceEeecCcccHHHHHHHHHHHHHHHHHHHHHhhCCCEEEccCcHHHHHHHHHhhhhhHHHhhhhhhcC
Confidence            7742 2222223222111   11100 000000   000000 0  01124567888888888877543210     011


Q ss_pred             cCCCCCChHHHHHHHHHcCCC
Q 006408          577 LRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       577 l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .+...-||..++.-+.+.|..
T Consensus       181 ~~~~~~eD~~l~~~~~~~g~~  201 (235)
T cd06434         181 RRLNAGDDRFLTRYVLSHGYK  201 (235)
T ss_pred             CCCCcCchHHHHHHHHHCCCe
Confidence            134456999999888887765


No 41 
>COG1215 Glycosyltransferases, probably involved in cell wall biogenesis [Cell envelope biogenesis, outer membrane]
Probab=87.24  E-value=29  Score=37.87  Aligned_cols=186  Identities=11%  Similarity=0.051  Sum_probs=106.0

Q ss_pred             ceEEEEEeCCCCCH-HHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHH
Q 006408          399 VHLFIGVLSATNHF-AERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKT  477 (646)
Q Consensus       399 v~LlI~V~Sap~~~-~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKt  477 (646)
                      ..+-|+|.+--.+. --.+.++..=.+.    ..+..+.++.. ..+++.-+.+.+-...+++.+.+...   ..-...-
T Consensus        54 p~vsviiP~ynE~~~~~~~~l~s~~~~d----yp~~evivv~d-~~~d~~~~~~~~~~~~~~~~~~~~~~---~~~~~gK  125 (439)
T COG1215          54 PKVSVIIPAYNEEPEVLEETLESLLSQD----YPRYEVIVVDD-GSTDETYEILEELGAEYGPNFRVIYP---EKKNGGK  125 (439)
T ss_pred             CceEEEEecCCCchhhHHHHHHHHHhCC----CCCceEEEECC-CCChhHHHHHHHHHhhcCcceEEEec---cccCccc
Confidence            45566666654444 2234444333222    22344444444 33344445555555666533333311   1112223


Q ss_pred             HHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcce-EEEeeccCCCcc-cc--ccc----eec--c--ccCC
Q 006408          478 IAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSL-YMGNLNLLHRPL-RT--GKW----AVT--Y--EEWP  545 (646)
Q Consensus       478 l~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~l-Y~G~v~~~~~P~-R~--sKW----yVs--~--eeyp  545 (646)
                      ..++.++......++++..|-|+.+..|.|.+.+..+...... +.|.......+. .+  ++-    |..  .  ..+.
T Consensus       126 ~~al~~~l~~~~~d~V~~~DaD~~~~~d~l~~~~~~f~~~~~~~v~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~  205 (439)
T COG1215         126 AGALNNGLKRAKGDVVVILDADTVPEPDALRELVSPFEDPPVGAVVGTPRIRNRPDPSNLLGRIQAIEYLSAFYFRLRAA  205 (439)
T ss_pred             hHHHHHHHhhcCCCEEEEEcCCCCCChhHHHHHHhhhcCCCeeEEeCCceeeecCChhhhcchhcchhhhhhHHHhhhhh
Confidence            4567777777789999999999999999999999887543333 445442111110 00  000    000  0  0001


Q ss_pred             -CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          546 -QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       546 -~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                       .......|.|++.++.+++++.+...     ....--||..+++.+...|..
T Consensus       206 ~~~g~~~~~~G~~~~~rr~aL~~~g~~-----~~~~i~ED~~lt~~l~~~G~~  253 (439)
T COG1215         206 SKGGLISFLSGSSSAFRRSALEEVGGW-----LEDTITEDADLTLRLHLRGYR  253 (439)
T ss_pred             hhcCCeEEEcceeeeEEHHHHHHhCCC-----CCCceeccHHHHHHHHHCCCe
Confidence             12257789999999999999998732     123456999999999988866


No 42 
>cd04195 GT2_AmsE_like GT2_AmsE_like is involved in exopolysaccharide amylovora biosynthesis. AmsE is a glycosyltransferase involved in exopolysaccharide amylovora biosynthesis in Erwinia amylovora. Amylovara is one of the three exopolysaccharide produced by E. amylovora. Amylovara-deficient mutants are non-pathogenic. It is a subfamily of Glycosyltransferase Family GT2, which includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds.
Probab=86.87  E-value=6.7  Score=37.66  Aligned_cols=150  Identities=13%  Similarity=0.090  Sum_probs=78.7

Q ss_pred             EEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhh
Q 006408          434 VARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEG  513 (646)
Q Consensus       434 ~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~  513 (646)
                      .++++.-.+.+..+...+.+-.+.+. +..+....+.-    + -..+..+......+|++.+|+|.++..+.|...++.
T Consensus        31 eiiivdd~ss~d~t~~~~~~~~~~~~-i~~i~~~~n~G----~-~~a~N~g~~~a~gd~i~~lD~Dd~~~~~~l~~~~~~  104 (201)
T cd04195          31 EVVLVKDGPVTQSLNEVLEEFKRKLP-LKVVPLEKNRG----L-GKALNEGLKHCTYDWVARMDTDDISLPDRFEKQLDF  104 (201)
T ss_pred             EEEEEECCCCchhHHHHHHHHHhcCC-eEEEEcCcccc----H-HHHHHHHHHhcCCCEEEEeCCccccCcHHHHHHHHH
Confidence            34333333334444444544445555 54444333211    1 123555566668999999999999998888887776


Q ss_pred             cC--CCcceEEEeeccCCCcccc--ccceecc-----ccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCCh
Q 006408          514 IF--PKRSLYMGNLNLLHRPLRT--GKWAVTY-----EEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMED  584 (646)
Q Consensus       514 ~~--~~~~lY~G~v~~~~~P~R~--sKWyVs~-----eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~ED  584 (646)
                      +.  +.-.++.|.........+.  .+. .+.     ..+....- + ..+++.++.+.++..+..-  .   .....||
T Consensus       105 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~-~-~~~~~~~~rr~~~~~~g~~--~---~~~~~eD  176 (201)
T cd04195         105 IEKNPEIDIVGGGVLEFDSDGNDIGKRR-LPTSHDDILKFARRRS-P-FNHPTVMFRKSKVLAVGGY--Q---DLPLVED  176 (201)
T ss_pred             HHhCCCeEEEcccEEEECCCCCeecccc-CCCCHHHHHHHhccCC-C-CCChHHhhhHHHHHHcCCc--C---CCCCchH
Confidence            53  2334555554321110000  000 000     00100011 1 2466778888877765331  1   1256899


Q ss_pred             HHHHHHHHHcCCC
Q 006408          585 VSMGMWVEQFNST  597 (646)
Q Consensus       585 V~iGi~l~~lgi~  597 (646)
                      ..+...+...|..
T Consensus       177 ~~~~~r~~~~g~~  189 (201)
T cd04195         177 YALWARMLANGAR  189 (201)
T ss_pred             HHHHHHHHHcCCc
Confidence            9999988877754


No 43 
>COG1216 Predicted glycosyltransferases [General function prediction only]
Probab=85.51  E-value=29  Score=36.69  Aligned_cols=135  Identities=13%  Similarity=0.105  Sum_probs=80.4

Q ss_pred             cCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCC-cceEEEeeccCCC----cc
Q 006408          458 FGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPK-RSLYMGNLNLLHR----PL  532 (646)
Q Consensus       458 ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~-~~lY~G~v~~~~~----P~  532 (646)
                      +.++..+...++.---. =.-.+++++.... .+|++-.++|+++..+.|.+.++..... ...+.|.......    +.
T Consensus        55 ~~~v~~i~~~~NlG~ag-g~n~g~~~a~~~~-~~~~l~LN~D~~~~~~~l~~ll~~~~~~~~~~~~~~~i~~~~~~~~~~  132 (305)
T COG1216          55 FPNVRLIENGENLGFAG-GFNRGIKYALAKG-DDYVLLLNPDTVVEPDLLEELLKAAEEDPAAGVVGPLIRNYDESLYID  132 (305)
T ss_pred             CCcEEEEEcCCCccchh-hhhHHHHHHhcCC-CcEEEEEcCCeeeChhHHHHHHHHHHhCCCCeEeeeeEecCCCCcchh
Confidence            78888877666542111 0013555554322 2299999999999999888888775432 2333444332110    11


Q ss_pred             cc--------ccc-eeccccCCC-----CCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          533 RT--------GKW-AVTYEEWPQ-----EVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       533 R~--------sKW-yVs~eeyp~-----~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +-        ..| .....+...     ...-.++.|++.++++++++++-- + .. --+...||+-++.=+.+.|..
T Consensus       133 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~li~~~~~~~vG~-~-de-~~F~y~eD~D~~~R~~~~G~~  208 (305)
T COG1216         133 RRGGESDGLTGGWRASPLLEIAPDLSSYLEVVASLSGACLLIRREAFEKVGG-F-DE-RFFIYYEDVDLCLRARKAGYK  208 (305)
T ss_pred             eeccccccccccceecccccccccccchhhhhhhcceeeeEEcHHHHHHhCC-C-Cc-ccceeehHHHHHHHHHHcCCe
Confidence            10        122 222222221     112225799999999999999975 1 12 124578999999999999965


No 44 
>cd02526 GT2_RfbF_like RfbF is a putative dTDP-rhamnosyl transferase. Shigella flexneri RfbF protein is a putative dTDP-rhamnosyl transferase. dTDP rhamnosyl  transferases of Shigella flexneri  add rhamnose sugars to N-acetyl-glucosamine in the O-antigen tetrasaccharide repeat. Lipopolysaccharide O antigens are important virulence determinants for many bacteria. The variations of sugar composition, the sequence of the sugars and the linkages in the O antigen provide structural diversity of the O antigen.
Probab=84.41  E-value=44  Score=32.89  Aligned_cols=106  Identities=14%  Similarity=0.064  Sum_probs=58.4

Q ss_pred             CceEEEEecCCccccHHHHHHHH--hh-cCCC-cceEEEeeccC-CCcc-----ccccceeccccCCCCC--CCCCCCCC
Q 006408          489 TAAYIMKCDDDTFIRVDAVLKEI--EG-IFPK-RSLYMGNLNLL-HRPL-----RTGKWAVTYEEWPQEV--YPPYANGP  556 (646)
Q Consensus       489 ~akfvmKvDDDtfVnvd~Ll~~L--~~-~~~~-~~lY~G~v~~~-~~P~-----R~sKWyVs~eeyp~~~--YPpY~~G~  556 (646)
                      +++|++..|+|+.+..+.|...+  .. .... .-..+|..... ....     +...|...........  -..++.|+
T Consensus        75 ~~d~v~~lD~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  154 (237)
T cd02526          75 GADYVLLFDQDSVPPPDMVEKLLAYKILSDKNSNIGAVGPRIIDRRTGENSPGVRKSGYKLRIQKEGEEGLKEVDFLITS  154 (237)
T ss_pred             CCCEEEEECCCCCcCHhHHHHHHHHHHhhccCCCeEEEeeeEEcCCCCeeccceeccCccceecccccCCceEeeeeecc
Confidence            67999999999999988887774  22 2211 11222332211 1100     0011111000111111  12345678


Q ss_pred             eEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          557 GYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       557 GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      |.++++++.+.+---  .... +...||+.+.+-+.+.|..
T Consensus       155 ~~~~rr~~~~~~ggf--d~~~-~~~~eD~d~~~r~~~~G~~  192 (237)
T cd02526         155 GSLISLEALEKVGGF--DEDL-FIDYVDTEWCLRARSKGYK  192 (237)
T ss_pred             ceEEcHHHHHHhCCC--CHHH-cCccchHHHHHHHHHcCCc
Confidence            889999999987531  1111 2456899999999988865


No 45 
>PLN02726 dolichyl-phosphate beta-D-mannosyltransferase
Probab=83.55  E-value=47  Score=33.46  Aligned_cols=111  Identities=7%  Similarity=-0.080  Sum_probs=64.6

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcC-CCcceEEEeeccCCC------cccc--c---cceeccccCCCC
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIF-PKRSLYMGNLNLLHR------PLRT--G---KWAVTYEEWPQE  547 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~-~~~~lY~G~v~~~~~------P~R~--s---KWyVs~eeyp~~  547 (646)
                      ++..+......+|++.+|+|..+.++.|...+.... ....+.+|.......      ..|.  +   ++.... ... .
T Consensus        84 a~n~g~~~a~g~~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~g~r~~~~~~~~~~~~~r~~~~~~~~~~~~~-~~~-~  161 (243)
T PLN02726         84 AYIHGLKHASGDFVVIMDADLSHHPKYLPSFIKKQRETGADIVTGTRYVKGGGVHGWDLRRKLTSRGANVLAQT-LLW-P  161 (243)
T ss_pred             HHHHHHHHcCCCEEEEEcCCCCCCHHHHHHHHHHHHhcCCcEEEEccccCCCCcCCccHHHHHHHHHHHHHHHH-HhC-C
Confidence            444555556789999999999999998888777653 234566676432110      1121  1   111111 111 1


Q ss_pred             CCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          548 VYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       548 ~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .. ..+.|++.++++++++.|......    .....|.-+...+...|..
T Consensus       162 ~~-~d~~g~~~~~rr~~~~~i~~~~~~----~~~~~~~el~~~~~~~g~~  206 (243)
T PLN02726        162 GV-SDLTGSFRLYKRSALEDLVSSVVS----KGYVFQMEIIVRASRKGYR  206 (243)
T ss_pred             CC-CcCCCcccceeHHHHHHHHhhccC----CCcEEehHHHHHHHHcCCc
Confidence            11 235788889999999999753211    1223466666666666655


No 46 
>cd06427 CESA_like_2 CESA_like_2 is a member of the cellulose synthase superfamily. The cellulose synthase (CESA) superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains.  The members include cellulose synthase catalytic subunit, chitin synthase, Glucan Biosynthesis protein and other families of CESA-like proteins. Cellulose synthase catalyzes the polymerization reaction of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues in  plants, most algae, some bacteria and fungi, and even some animals. In bacteria, algae and lower eukaryotes, there is a second unrelated type of cellulose synthase (Type II), which produces acylated cellulose, a derivative of cellulose.  Chitin synthase catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin, which is a linear homopolymer of beta-(1,4)-linked GlcNAc residues and Glucan Biosynthesis prot
Probab=83.47  E-value=20  Score=36.01  Aligned_cols=114  Identities=12%  Similarity=0.168  Sum_probs=68.4

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCC-cc-eEE-EeeccCCCccc-ccccee-cc--------ccCC
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPK-RS-LYM-GNLNLLHRPLR-TGKWAV-TY--------EEWP  545 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~-~~-lY~-G~v~~~~~P~R-~sKWyV-s~--------eeyp  545 (646)
                      ..+.++.+....+||+.+|+|+.+..+.|.+.++.+... .. .++ |.+.....+.. -.+++. ..        ....
T Consensus        74 ~a~n~g~~~a~gd~i~~~DaD~~~~~~~l~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  153 (241)
T cd06427          74 KACNYALAFARGEYVVIYDAEDAPDPDQLKKAVAAFARLDDKLACVQAPLNYYNARENWLTRMFALEYAAWFDYLLPGLA  153 (241)
T ss_pred             HHHHHHHHhcCCCEEEEEcCCCCCChHHHHHHHHHHHhcCCCEEEEeCceEeeCCCccHHHHHHHHHHHHHHHHHHHHHH
Confidence            356667766788999999999999999998888876422 22 232 22211111100 011100 00        0001


Q ss_pred             CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          546 QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       546 ~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ....+..++|++.++++++++.+...  .   .....||..+++-+.+.|.+
T Consensus       154 ~~~~~~~~~g~~~~~rr~~~~~vgg~--~---~~~~~eD~~l~~rl~~~G~r  200 (241)
T cd06427         154 RLGLPIPLGGTSNHFRTDVLRELGGW--D---PFNVTEDADLGLRLARAGYR  200 (241)
T ss_pred             hcCCeeecCCchHHhhHHHHHHcCCC--C---cccchhhHHHHHHHHHCCce
Confidence            11233456899999999999998542  1   12346999999988887765


No 47 
>cd04188 DPG_synthase DPG_synthase is involved in protein N-linked glycosylation. UDP-glucose:dolichyl-phosphate glucosyltransferase (DPG_synthase) is a transmembrane-bound enzyme of the endoplasmic reticulum involved in protein N-linked glycosylation. This enzyme catalyzes the transfer of glucose from UDP-glucose to dolichyl phosphate.
Probab=80.62  E-value=20  Score=34.99  Aligned_cols=154  Identities=14%  Similarity=0.033  Sum_probs=80.6

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCcE-EEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGDI-VILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKE  510 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygDI-I~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~  510 (646)
                      ...++++-..+.+ .....+++..+.++.. ..+....+.-    |. .++..+.+....+|++.+|+|.....+.+...
T Consensus        30 ~~eiivvdd~S~D-~t~~~~~~~~~~~~~~i~~i~~~~n~G----~~-~a~~~g~~~a~gd~i~~ld~D~~~~~~~l~~l  103 (211)
T cd04188          30 SYEIIVVDDGSKD-GTAEVARKLARKNPALIRVLTLPKNRG----KG-GAVRAGMLAARGDYILFADADLATPFEELEKL  103 (211)
T ss_pred             CEEEEEEeCCCCC-chHHHHHHHHHhCCCcEEEEEcccCCC----cH-HHHHHHHHHhcCCEEEEEeCCCCCCHHHHHHH
Confidence            3444444444433 3334455555556654 3333332221    21 23344445556799999999999999988888


Q ss_pred             Hhh-cCCCcceEEEeeccCC-------Ccccc--ccc--eeccccCCCCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccC
Q 006408          511 IEG-IFPKRSLYMGNLNLLH-------RPLRT--GKW--AVTYEEWPQEVYPPYANGPGYVISSDIAKFIVLQHGNQSLR  578 (646)
Q Consensus       511 L~~-~~~~~~lY~G~v~~~~-------~P~R~--sKW--yVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~  578 (646)
                      ++. ......+.+|......       ...|.  ++.  +...... ...+. -+..+..++++.++..+....  . ..
T Consensus       104 ~~~~~~~~~~~v~g~r~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~-d~~~g~~~~~r~~~~~~~~~~--~-~~  178 (211)
T cd04188         104 EEALKTSGYDIAIGSRAHLASAAVVKRSWLRNLLGRGFNFLVRLLL-GLGIK-DTQCGFKLFTRDAARRLFPRL--H-LE  178 (211)
T ss_pred             HHHHhccCCcEEEEEeeccCCcccccccHHHHHHHHHHHHHHHHHc-CCCCc-ccccCceeEcHHHHHHHHhhh--h-cc
Confidence            886 3344456677654321       11111  110  0000000 11111 123456899999999987431  1 11


Q ss_pred             CCCCChHHHHHHHHHcCCC
Q 006408          579 LFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       579 ~f~~EDV~iGi~l~~lgi~  597 (646)
                       ...+|.-+-.-+.+.|..
T Consensus       179 -~~~~d~el~~r~~~~g~~  196 (211)
T cd04188         179 -RWAFDVELLVLARRLGYP  196 (211)
T ss_pred             -ceEeeHHHHHHHHHcCCe
Confidence             224588777777777754


No 48 
>cd04179 DPM_DPG-synthase_like DPM_DPG-synthase_like is a member of the Glycosyltransferase 2 superfamily. DPM1 is the catalytic subunit of eukaryotic dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. In higher eukaryotes,the enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. In lower eukaryotes, such as Saccharomyces cerevisiae and Trypanosoma brucei, DPM synthase consists of a single component (Dpm1p and TbDpm1, respectively) that possesses one predicted transmembrane region near the C terminus for anchoring to the ER membrane. In contrast, the Dpm1 homologues of higher eukaryotes, namely fission yeast, fungi, and animals, have no transmembrane region, suggesting the ex
Probab=80.27  E-value=13  Score=35.07  Aligned_cols=118  Identities=11%  Similarity=0.087  Sum_probs=65.4

Q ss_pred             HHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhh-cCCCcceEEEee
Q 006408          447 VNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEG-IFPKRSLYMGNL  525 (646)
Q Consensus       447 ~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~-~~~~~~lY~G~v  525 (646)
                      +...++.-...+..+..+....+...     -..+..+.+....+|++.+|+|..+..+.|..++.. ......+.+|..
T Consensus        42 ~~~~~~~~~~~~~~~~~~~~~~n~G~-----~~a~n~g~~~a~gd~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~g~~  116 (185)
T cd04179          42 TAEIARELAARVPRVRVIRLSRNFGK-----GAAVRAGFKAARGDIVVTMDADLQHPPEDIPKLLEKLLEGGADVVIGSR  116 (185)
T ss_pred             hHHHHHHHHHhCCCeEEEEccCCCCc-----cHHHHHHHHHhcCCEEEEEeCCCCCCHHHHHHHHHHHhccCCcEEEEEe
Confidence            34444444455666655555444321     134444555555699999999999998888888876 333445666665


Q ss_pred             ccCCC-----cccc-ccceeccccCC-CCCCCCCCCCCeEEeCHHHHHHHH
Q 006408          526 NLLHR-----PLRT-GKWAVTYEEWP-QEVYPPYANGPGYVISSDIAKFIV  569 (646)
Q Consensus       526 ~~~~~-----P~R~-sKWyVs~eeyp-~~~YPpY~~G~GYVLSrdla~~Iv  569 (646)
                      .....     ..+. ..+........ ...-.....|+.+++++++++.+.
T Consensus       117 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~i~  167 (185)
T cd04179         117 FVRGGGAGMPLLRRLGSRLFNFLIRLLLGVRISDTQSGFRLFRREVLEALL  167 (185)
T ss_pred             ecCCCcccchHHHHHHHHHHHHHHHHHcCCCCcCCCCceeeeHHHHHHHHH
Confidence            43221     1111 11111000000 111223456778899999999996


No 49 
>PF13632 Glyco_trans_2_3:  Glycosyl transferase family group 2
Probab=79.79  E-value=7.4  Score=37.51  Aligned_cols=100  Identities=14%  Similarity=0.132  Sum_probs=63.7

Q ss_pred             EEEEecCCccccHHHHHHHHhhcC-CCcceEEEeeccCCCcccc--ccceecccc---------CCCCCCCCCCCCCeEE
Q 006408          492 YIMKCDDDTFIRVDAVLKEIEGIF-PKRSLYMGNLNLLHRPLRT--GKWAVTYEE---------WPQEVYPPYANGPGYV  559 (646)
Q Consensus       492 fvmKvDDDtfVnvd~Ll~~L~~~~-~~~~lY~G~v~~~~~P~R~--sKWyVs~ee---------yp~~~YPpY~~G~GYV  559 (646)
                      ||+-+|+|+-+..+.|.+.+..+. +.-.+.-|.+...  +..+  .++......         ...-..+.++.|++.+
T Consensus         1 ~v~~~DaDt~~~~d~l~~~~~~~~~~~~~~vq~~~~~~--~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~~   78 (193)
T PF13632_consen    1 YVLFLDADTRLPPDFLERLVAALEDPKVDAVQGPIIFR--NRGSLLTRLQDFEYAISHGLSRLSQSSLGRPLFLSGSGML   78 (193)
T ss_pred             CEEEEcCCCCCChHHHHHHHHHHhCCCceEEEccEEec--CCCChhheeehhhhhhhhhhhHHHHHhcCCCccccCccee
Confidence            689999999999998888877665 2223333433321  1111  111111100         0123356788999999


Q ss_pred             eCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          560 ISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       560 LSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +++++++.+.--  .  -.....||..++.-+.+.|.+
T Consensus        79 ~r~~~l~~vg~~--~--~~~~~~ED~~l~~~l~~~G~~  112 (193)
T PF13632_consen   79 FRREALREVGGF--D--DPFSIGEDMDLGFRLRRAGYR  112 (193)
T ss_pred             eeHHHHHHhCcc--c--ccccccchHHHHHHHHHCCCE
Confidence            999999988532  1  234556999999999988865


No 50 
>cd06442 DPM1_like DPM1_like represents putative enzymes similar to eukaryotic DPM1. Proteins similar to eukaryotic DPM1, including enzymes from bacteria and archaea; DPM1 is the catalytic subunit of eukaryotic dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. In higher eukaryotes,the enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. In lower eukaryotes, such as Saccharomyces cerevisiae and Trypanosoma brucei, DPM synthase consists of a single component (Dpm1p and TbDpm1, respectively) that possesses one predicted transmembrane region near the C terminus for anchoring to the ER membrane. In contrast, the Dpm1 homologues of higher eukaryotes, namely fission yeast, fungi, 
Probab=73.25  E-value=33  Score=33.38  Aligned_cols=89  Identities=8%  Similarity=-0.030  Sum_probs=50.4

Q ss_pred             HhhhhhcCCceEEEEecCCccccHHHHHHHHhh-cCCCcceEEEeeccCCCccccccc---eecc--cc---CCCCCCCC
Q 006408          481 CEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEG-IFPKRSLYMGNLNLLHRPLRTGKW---AVTY--EE---WPQEVYPP  551 (646)
Q Consensus       481 l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~-~~~~~~lY~G~v~~~~~P~R~sKW---yVs~--ee---yp~~~YPp  551 (646)
                      +..+.+....+|++.+|+|..+..+.|...++. ..+...+..|...........-.+   +.+.  ..   +....-..
T Consensus        70 ~n~g~~~a~gd~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  149 (224)
T cd06442          70 YIEGFKAARGDVIVVMDADLSHPPEYIPELLEAQLEGGADLVIGSRYVEGGGVEGWGLKRKLISRGANLLARLLLGRKVS  149 (224)
T ss_pred             HHHHHHHcCCCEEEEEECCCCCCHHHHHHHHHHHhcCCCCEEEEeeeecCCccCCCcHHHHHHHHHHHHHHHHHcCCCCC
Confidence            334444455699999999999998888888876 333345555654322111100000   0000  00   00011134


Q ss_pred             CCCCCeEEeCHHHHHHHH
Q 006408          552 YANGPGYVISSDIAKFIV  569 (646)
Q Consensus       552 Y~~G~GYVLSrdla~~Iv  569 (646)
                      .+.|++.++++++++.+.
T Consensus       150 ~~~~~~~~~~r~~~~~ig  167 (224)
T cd06442         150 DPTSGFRAYRREVLEKLI  167 (224)
T ss_pred             CCCCccchhhHHHHHHHh
Confidence            567888899999999997


No 51 
>PF10111 Glyco_tranf_2_2:  Glycosyltransferase like family 2;  InterPro: IPR019290 This conserved domain is found in a set of prokaryotic proteins including putative glucosyltransferases, which are involved in bacterial capsule biosynthesis [, ]. 
Probab=72.78  E-value=1.1e+02  Score=31.98  Aligned_cols=160  Identities=13%  Similarity=0.040  Sum_probs=89.3

Q ss_pred             CceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEE--eecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHH
Q 006408          431 SNVVARFFVALNPRKEVNAVLKKEAAFFGDIVIL--PFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVL  508 (646)
Q Consensus       431 ~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~--df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll  508 (646)
                      .++.++++=+.+ .......|.+-.+.++-+..+  +......+.+    .+..-+.+....+||+.+|.|+++..+.+.
T Consensus        33 ~~~eiIvvd~~s-~~~~~~~l~~~~~~~~~~~~i~~~~~~~~f~~a----~arN~g~~~A~~d~l~flD~D~i~~~~~i~  107 (281)
T PF10111_consen   33 PDFEIIVVDDGS-SDEFDEELKKLCEKNGFIRYIRHEDNGEPFSRA----KARNIGAKYARGDYLIFLDADCIPSPDFIE  107 (281)
T ss_pred             CCEEEEEEECCC-chhHHHHHHHHHhccCceEEEEcCCCCCCcCHH----HHHHHHHHHcCCCEEEEEcCCeeeCHHHHH
Confidence            344444443333 233446677766777766222  2222222333    234445556689999999999999999988


Q ss_pred             HHHh---hcCC-CcceEEEeeccCCCcccc-----ccceeccc---cC---CCCCCC-CCCCCCeEEeCHHHHHHHHHHh
Q 006408          509 KEIE---GIFP-KRSLYMGNLNLLHRPLRT-----GKWAVTYE---EW---PQEVYP-PYANGPGYVISSDIAKFIVLQH  572 (646)
Q Consensus       509 ~~L~---~~~~-~~~lY~G~v~~~~~P~R~-----sKWyVs~e---ey---p~~~YP-pY~~G~GYVLSrdla~~Iv~~~  572 (646)
                      +.++   .+.. ...++++-+.....+.-.     .+......   ..   ..+.+. .+..|++.+++++.-..|.-- 
T Consensus       108 ~~~~~~~~l~~~~~~~~~~p~~yl~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~~~~i~r~~f~~iGGf-  186 (281)
T PF10111_consen  108 KLLNHVKKLDKNPNAFLVYPCLYLSEEGSEKFYSQFKNLWDHEFLESFISGKNSLWEFIAFASSCFLINREDFLEIGGF-  186 (281)
T ss_pred             HHHHHHHHHhcCCCceEEEeeeeccchhhHHHhhcchhcchHHHHHHHhhccccccccccccceEEEEEHHHHHHhCCC-
Confidence            8888   4432 234444443332222110     10000000   00   111221 233569999999999998652 


Q ss_pred             cCCccCCCCCChHHHHHHHHHcCCC
Q 006408          573 GNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       573 ~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                       .........||.-++.=+.+.+..
T Consensus       187 -DE~f~G~G~ED~D~~~RL~~~~~~  210 (281)
T PF10111_consen  187 -DERFRGWGYEDIDFGYRLKKAGYK  210 (281)
T ss_pred             -CccccCCCcchHHHHHHHHHcCCc
Confidence             233334568999999999988865


No 52 
>cd06437 CESA_CaSu_A2 Cellulose synthase catalytic subunit A2 (CESA2) is a catalytic subunit or a catalytic subunit substitute of the cellulose synthase complex. Cellulose synthase (CESA) catalyzes the polymerization reaction of cellulose using UDP-glucose as the substrate. Cellulose is an aggregate of unbranched polymers of beta-1,4-linked glucose residues, which is an abundant polysaccharide produced by plants and in varying degrees by several other organisms including algae, bacteria, fungi, and even some animals. Genomes from higher plants harbor multiple CESA genes. There are ten in Arabidopsis. At least three different CESA proteins are required to form a functional complex. In Arabidopsis, CESA1, 3 and 6 and CESA4, 7 and 8, are required for cellulose biosynthesis during primary and secondary cell wall formation. CESA2 is very closely related to CESA6 and is viewed as a prime substitute for CESA6. They functionally compensate each other. The cesa2 and cesa6 double mutant plants we
Probab=71.70  E-value=98  Score=30.60  Aligned_cols=113  Identities=14%  Similarity=0.014  Sum_probs=60.9

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCc-ceEEEeeccCC---Ccc-cc----ccceeccccCC--CCC
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKR-SLYMGNLNLLH---RPL-RT----GKWAVTYEEWP--QEV  548 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~-~lY~G~v~~~~---~P~-R~----sKWyVs~eeyp--~~~  548 (646)
                      .+..+.+..+.+||+.+|.|+.+..+.|...+......+ .+..|.+....   ..+ +-    ..++...+.+.  ...
T Consensus        78 a~n~g~~~a~~~~i~~~DaD~~~~~~~l~~~~~~~~~~~v~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  157 (232)
T cd06437          78 ALAEGMKVAKGEYVAIFDADFVPPPDFLQKTPPYFADPKLGFVQTRWGHINANYSLLTRVQAMSLDYHFTIEQVARSSTG  157 (232)
T ss_pred             HHHHHHHhCCCCEEEEEcCCCCCChHHHHHhhhhhcCCCeEEEecceeeEcCCCchhhHhhhhhHHhhhhHhHhhHhhcC
Confidence            455666667899999999999999988887554443222 22333222110   000 00    00000000000  011


Q ss_pred             CCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          549 YPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       549 YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      ....+.|++-++.+++++.+---  ..   ....||+.++.-+...|.+
T Consensus       158 ~~~~~~g~~~~~rr~~~~~vgg~--~~---~~~~ED~~l~~rl~~~G~~  201 (232)
T cd06437         158 LFFNFNGTAGVWRKECIEDAGGW--NH---DTLTEDLDLSYRAQLKGWK  201 (232)
T ss_pred             CeEEeccchhhhhHHHHHHhCCC--CC---CcchhhHHHHHHHHHCCCe
Confidence            11123566667888888877421  11   1347999999988877754


No 53 
>PRK10714 undecaprenyl phosphate 4-deoxy-4-formamido-L-arabinose transferase; Provisional
Probab=71.61  E-value=63  Score=34.78  Aligned_cols=130  Identities=12%  Similarity=0.020  Sum_probs=70.6

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCc-EEEEeecccccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHH
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGD-IVILPFMDRYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKE  510 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygD-II~~df~DsY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~  510 (646)
                      ...++++-..+++... +.+++-++.+++ ++.+....++-    |.- ++.-+.++...+|++.+|.|.-.+++.+.+.
T Consensus        38 ~~EIIvVDDgS~D~T~-~il~~~~~~~~~~v~~i~~~~n~G----~~~-A~~~G~~~A~gd~vv~~DaD~q~~p~~i~~l  111 (325)
T PRK10714         38 EYEILLIDDGSSDNSA-EMLVEAAQAPDSHIVAILLNRNYG----QHS-AIMAGFSHVTGDLIITLDADLQNPPEEIPRL  111 (325)
T ss_pred             CEEEEEEeCCCCCcHH-HHHHHHHhhcCCcEEEEEeCCCCC----HHH-HHHHHHHhCCCCEEEEECCCCCCCHHHHHHH
Confidence            4566666655555432 233333334443 44444333332    222 2334445567899999999999999999888


Q ss_pred             HhhcCCCcceEEEeecc-CCCcccc--cc---ceeccccCCCCCCCCCCCCCeEEeCHHHHHHHHH
Q 006408          511 IEGIFPKRSLYMGNLNL-LHRPLRT--GK---WAVTYEEWPQEVYPPYANGPGYVISSDIAKFIVL  570 (646)
Q Consensus       511 L~~~~~~~~lY~G~v~~-~~~P~R~--sK---WyVs~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~  570 (646)
                      ++.......+..|.... ...+.|.  ++   +.+.  ......++.+..| .-++++++++.+..
T Consensus       112 ~~~~~~~~DvV~~~r~~~~~~~~r~~~s~~~~~l~~--~~~g~~~~d~~~g-fr~~~r~~~~~l~~  174 (325)
T PRK10714        112 VAKADEGYDVVGTVRQNRQDSWFRKTASKMINRLIQ--RTTGKAMGDYGCM-LRAYRRHIVDAMLH  174 (325)
T ss_pred             HHHHHhhCCEEEEEEcCCCCcHHHHHHHHHHHHHHH--HHcCCCCCCCCcC-eEEEcHHHHHHHHH
Confidence            88764433454454322 2233342  22   1111  1112234444333 34899999999965


No 54 
>PF04646 DUF604:  Protein of unknown function, DUF604;  InterPro: IPR006740 This family includes a conserved region found in several uncharacterised plant proteins.
Probab=71.58  E-value=5.5  Score=41.79  Aligned_cols=43  Identities=16%  Similarity=0.263  Sum_probs=33.4

Q ss_pred             CCCeEEeCHHHHHHHHHHhcCCcc---CCCCCChHHHHHHHHHcCCC
Q 006408          554 NGPGYVISSDIAKFIVLQHGNQSL---RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       554 ~G~GYVLSrdla~~Iv~~~~~~~l---~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +|+|++||..+|+.|.+... ..+   +.+.--|-.+..|+.++|+.
T Consensus        12 GGgG~~iS~pLa~~L~~~~d-~C~~r~~~~~g~D~~i~~C~~~lgv~   57 (255)
T PF04646_consen   12 GGGGFAISYPLAKALAKMQD-DCIERYPHLYGGDQRIQACIAELGVP   57 (255)
T ss_pred             cCceeEEcHHHHHHHHHHHH-HHHHhcCCCCCchHHHHHHHHHhCCC
Confidence            89999999999999987632 222   23334799999999999864


No 55 
>TIGR01556 rhamnosyltran L-rhamnosyltransferase. Rhamnolipids are glycolipids containing mono- or di- L-rhamnose molecules. Rhamnolipid synthesis occurs by sequential glycosyltransferase reactions involving two distinct rhamnosyltransferase enzymes. In P.aeruginosa, the synthesis of mono-rhamnolipids is catalyzed by rhamnosyltransferase 1, and proceeds by a glycosyltransfer reaction catalyzed by rhamnosyltransferase 2 to yield di-rhamnolipids.
Probab=69.43  E-value=49  Score=34.08  Aligned_cols=114  Identities=7%  Similarity=0.077  Sum_probs=60.9

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCC--cceEEEeeccCCC-----c-cccccceeccc--cCCCC-C
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPK--RSLYMGNLNLLHR-----P-LRTGKWAVTYE--EWPQE-V  548 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~--~~lY~G~v~~~~~-----P-~R~sKWyVs~e--eyp~~-~  548 (646)
                      +++++.+ ..++||+..|||+.+..+.|...++.....  .-.++|.......     | .+...+.....  ..... .
T Consensus        65 Gi~~a~~-~~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  143 (281)
T TIGR01556        65 GLDASFR-RGVQGVLLLDQDSRPGNAFLAAQWKLLSAENGQACALGPRFFDRGTSRRLPAIHLDGLLLRQISLDGLTTPQ  143 (281)
T ss_pred             HHHHHHH-CCCCEEEEECCCCCCCHHHHHHHHHHHHhcCCceEEECCeEEcCCCcccCCceeecccceeeecccccCCce
Confidence            4555543 278999999999999987777766654322  2223332211100     0 01001111100  00111 1


Q ss_pred             CCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          549 YPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       549 YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      -..++.++|.++++++++.+---  ...+ ++..||+-+.+=+.+.|..
T Consensus       144 ~~~~~~~sg~li~~~~~~~iG~f--de~~-fi~~~D~e~~~R~~~~G~~  189 (281)
T TIGR01556       144 KTSFLISSGCLITREVYQRLGMM--DEEL-FIDHVDTEWSLRAQNYGIP  189 (281)
T ss_pred             eccEEEcCcceeeHHHHHHhCCc--cHhh-cccchHHHHHHHHHHCCCE
Confidence            11344566778999999988431  1111 3456899888878887764


No 56 
>PRK14716 bacteriophage N4 adsorption protein B; Provisional
Probab=68.80  E-value=49  Score=38.24  Aligned_cols=106  Identities=16%  Similarity=0.101  Sum_probs=60.3

Q ss_pred             CceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCcccc--ccceeccccCCC---------C--CCCCCCCC
Q 006408          489 TAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRT--GKWAVTYEEWPQ---------E--VYPPYANG  555 (646)
Q Consensus       489 ~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~--sKWyVs~eeyp~---------~--~YPpY~~G  555 (646)
                      ++++++..|-|+.+..+.|....... +...+.-..+....++...  +..|.  .+|.+         +  .-+-.+.|
T Consensus       158 ~~d~vvi~DAD~~v~Pd~Lr~~~~~~-~~~~~VQ~pv~~~~~~~~~~~ag~y~--~ef~~~~~~~l~~r~~LG~~~~~~G  234 (504)
T PRK14716        158 RFAIIVLHDAEDVIHPLELRLYNYLL-PRHDFVQLPVFSLPRDWGEWVAGTYM--DEFAESHLKDLPVREALGGLIPSAG  234 (504)
T ss_pred             CcCEEEEEcCCCCcCccHHHHHHhhc-CCCCEEecceeccCCchhHHHHHHHH--HHHHHHHHHHHHHHHhcCCccccCC
Confidence            46999999999999999876543332 2222211111111111110  11111  11110         1  12345689


Q ss_pred             CeEEeCHHHHHHHHHHhcCCcc-CCCCCChHHHHHHHHHcCCC
Q 006408          556 PGYVISSDIAKFIVLQHGNQSL-RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       556 ~GYVLSrdla~~Iv~~~~~~~l-~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .|+++++++++.|.....-... .-.-.||.-+|+-+...|.+
T Consensus       235 tg~afRR~aLe~l~~~~GG~~fd~~sLTED~dLglRL~~~G~r  277 (504)
T PRK14716        235 VGTAFSRRALERLAAERGGQPFDSDSLTEDYDIGLRLKRAGFR  277 (504)
T ss_pred             eeEEeEHHHHHHHHhhcCCCCCCCCCcchHHHHHHHHHHCCCE
Confidence            9999999999999653100001 12357999999999999976


No 57 
>PRK05454 glucosyltransferase MdoH; Provisional
Probab=64.66  E-value=85  Score=37.74  Aligned_cols=198  Identities=12%  Similarity=0.023  Sum_probs=102.2

Q ss_pred             CceEEEEEeCCCCCHHH-HHHHHHHhhcccccC-CCceEEEEEEeeCCChhHHH----HHHHHHhhcC---cEEEEeecc
Q 006408          398 PVHLFIGVLSATNHFAE-RMAIRKTWMQSSKIK-SSNVVARFFVALNPRKEVNA----VLKKEAAFFG---DIVILPFMD  468 (646)
Q Consensus       398 ~v~LlI~V~Sap~~~~r-R~aIR~TW~~~~~i~-~~~v~~~FfVG~~~~~~~~~----~L~~Eae~yg---DII~~df~D  468 (646)
                      ..++-|+|.+--...++ +..|+.++.+-.... ..++.+ |++....++++..    .+.+=.++|+   .|...   .
T Consensus       123 ~~~VaVliP~yNEd~~~v~~~L~a~~~Sl~~~~~~~~~e~-~vLdD~~d~~~~~~e~~~~~~L~~~~~~~~~i~yr---~  198 (691)
T PRK05454        123 EARTAILMPIYNEDPARVFAGLRAMYESLAATGHGAHFDF-FILSDTRDPDIAAAEEAAWLELRAELGGEGRIFYR---R  198 (691)
T ss_pred             CCceEEEEeCCCCChHHHHHHHHHHHHHHHhcCCCCCEEE-EEEECCCChhHHHHHHHHHHHHHHhcCCCCcEEEE---E
Confidence            44566666655544332 467777775432211 123444 7777665554321    1112223343   34433   3


Q ss_pred             cccchhHHHHHHHhhhhhc-CCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceec-------
Q 006408          469 RYELVVLKTIAICEFGVQN-VTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVT-------  540 (646)
Q Consensus       469 sY~nLtlKtl~~l~wa~~~-~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs-------  540 (646)
                      .-.|.-.|.-.+-.|.... .+++|++-.|-|+.+..|.|.+.+..+..+..  +|-+.....+.....++--       
T Consensus       199 R~~n~~~KaGNl~~~~~~~~~~~eyivvLDADs~m~~d~L~~lv~~m~~dP~--vGlVQt~~~~~n~~slfaR~qqf~~~  276 (691)
T PRK05454        199 RRRNVGRKAGNIADFCRRWGGAYDYMVVLDADSLMSGDTLVRLVRLMEANPR--AGLIQTLPVAVGADTLFARLQQFATR  276 (691)
T ss_pred             CCcCCCccHHHHHHHHHhcCCCcCEEEEEcCCCCCCHHHHHHHHHHHhhCcC--EEEEeCCccCcCCCCHHHHHHHHHHH
Confidence            3344455766655554432 47899999999999999999998876532111  3444322222111111100       


Q ss_pred             ---------cccCCCCCCCCCCCCCeEEeCHHHHHHHHHHh-cCCccC---CCCCChHHHHHHHHHcCCCCCcccccC
Q 006408          541 ---------YEEWPQEVYPPYANGPGYVISSDIAKFIVLQH-GNQSLR---LFKMEDVSMGMWVEQFNSTMTVRYSHS  605 (646)
Q Consensus       541 ---------~eeyp~~~YPpY~~G~GYVLSrdla~~Iv~~~-~~~~l~---~f~~EDV~iGi~l~~lgi~~pV~y~h~  605 (646)
                               ..-|-. .-- .+.|...|+.+++...+..-. ....-+   -.--||..+|..+...|.+  +.|..+
T Consensus       277 ~y~~~~~~G~~~w~~-~~g-~f~G~naIiR~~af~~~~glp~L~g~~p~~~~~LseD~~~a~~l~~~Gyr--V~~~pd  350 (691)
T PRK05454        277 VYGPLFAAGLAWWQG-GEG-NYWGHNAIIRVKAFAEHCGLPPLPGRGPFGGHILSHDFVEAALMRRAGWG--VWLAPD  350 (691)
T ss_pred             HHHHHHHhhhhhhcc-Ccc-ccccceEEEEHHHHHHhcCCccccccCCCCCCcccHHHHHHHHHHHCCCE--EEEcCc
Confidence                     000110 011 124777788888777653100 001111   2345899999999999876  444443


No 58 
>TIGR03030 CelA cellulose synthase catalytic subunit (UDP-forming). Cellulose synthase catalyzes the beta-1,4 polymerization of glucose residues in the formation of cellulose. In bacteria, the substrate is UDP-glucose. The synthase consists of two subunits (or domains in the frequent cases where it is encoded as a single polypeptide), the catalytic domain modelled here and the regulatory domain (pfam03170). The regulatory domain binds the allosteric activator cyclic di-GMP. The protein is membrane-associated and probably assembles into multimers such that the individual cellulose strands can self-assemble into multi-strand fibrils.
Probab=59.05  E-value=2e+02  Score=34.66  Aligned_cols=120  Identities=13%  Similarity=0.084  Sum_probs=69.1

Q ss_pred             chhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcce-EEEeec--cCCCcc-cc-cc-ceeccc--c
Q 006408          472 LVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSL-YMGNLN--LLHRPL-RT-GK-WAVTYE--E  543 (646)
Q Consensus       472 nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~l-Y~G~v~--~~~~P~-R~-sK-WyVs~e--e  543 (646)
                      |...|.- .+..+.++.+.+|++..|.|+.+..+.|...+..+..+..+ +++...  .+..|+ |+ +. ..++.+  .
T Consensus       212 n~~~KAg-nLN~al~~a~gd~Il~lDAD~v~~pd~L~~~v~~f~~dp~v~~Vqtp~~f~~p~~~~~nl~~~~~~~~e~~~  290 (713)
T TIGR03030       212 NVHAKAG-NINNALKHTDGELILIFDADHVPTRDFLQRTVGWFVEDPKLFLVQTPHFFVSPDPIERNLGTFRRMPNENEL  290 (713)
T ss_pred             CCCCChH-HHHHHHHhcCCCEEEEECCCCCcChhHHHHHHHHHHhCCCEEEEeCCeeccCCCHHhhhhHHHHHhhhHHHH
Confidence            3334533 35666667788999999999999999888877665221121 222111  111221 11 00 000000  0


Q ss_pred             -C----C--CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          544 -W----P--QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       544 -y----p--~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                       |    +  ...-..++.|.+.++.+++++.+---  ..   ..-.||..+++-+.+.|.+
T Consensus       291 f~~~i~~g~~~~~~~~~~Gs~~~iRR~al~~iGGf--~~---~~vtED~~l~~rL~~~G~~  346 (713)
T TIGR03030       291 FYGLIQDGNDFWNAAFFCGSAAVLRREALDEIGGI--AG---ETVTEDAETALKLHRRGWN  346 (713)
T ss_pred             HHHHHHHHHhhhCCeeecCceeEEEHHHHHHcCCC--CC---CCcCcHHHHHHHHHHcCCe
Confidence             0    0  00112456799999999999987431  11   1237999999999998876


No 59 
>PRK11498 bcsA cellulose synthase catalytic subunit; Provisional
Probab=56.05  E-value=1.4e+02  Score=36.97  Aligned_cols=112  Identities=13%  Similarity=0.089  Sum_probs=65.9

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhc--CCCcceEEEeec--cCCCcc-cc-ccc-eeccc-c--C----C
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGI--FPKRSLYMGNLN--LLHRPL-RT-GKW-AVTYE-E--W----P  545 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~--~~~~~lY~G~v~--~~~~P~-R~-sKW-yVs~e-e--y----p  545 (646)
                      .+..+.++.+.+|++..|.|+.+..+-|...+..+  +++-.+ ++...  .+..|. |+ +.. ..+.+ +  |    +
T Consensus       330 nLN~aL~~a~GEyIavlDAD~ip~pdfL~~~V~~f~~dP~Vgl-VQtp~~f~n~dp~~rnl~~~~~~~~e~~~fy~~iq~  408 (852)
T PRK11498        330 NINNALKYAKGEFVAIFDCDHVPTRSFLQMTMGWFLKDKKLAM-MQTPHHFFSPDPFERNLGRFRKTPNEGTLFYGLVQD  408 (852)
T ss_pred             HHHHHHHhCCCCEEEEECCCCCCChHHHHHHHHHHHhCCCeEE-EEcceeccCCchHHHhhHHHhhcccchhHHHHHHHh
Confidence            45666667789999999999999988877766542  222122 22111  111121 11 100 00000 0  0    0


Q ss_pred             --CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          546 --QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       546 --~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                        ...--.++.|++.++.+++++.+---  ...   ...||..+++-+...|.+
T Consensus       409 g~~~~~a~~~~Gs~aviRReaLeeVGGf--d~~---titED~dlslRL~~~Gyr  457 (852)
T PRK11498        409 GNDMWDATFFCGSCAVIRRKPLDEIGGI--AVE---TVTEDAHTSLRLHRRGYT  457 (852)
T ss_pred             HHHhhcccccccceeeeEHHHHHHhcCC--CCC---ccCccHHHHHHHHHcCCE
Confidence              00012457899999999999998542  111   246999999999998875


No 60 
>cd02522 GT_2_like_a GT_2_like_a represents a glycosyltransferase family-2 subfamily with unknown function. Glycosyltransferase family 2 (GT-2) subfamily of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=55.86  E-value=2e+02  Score=27.78  Aligned_cols=106  Identities=17%  Similarity=0.122  Sum_probs=60.5

Q ss_pred             HhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeecc----CCCccc--cccceeccccCCCCCCCCCCC
Q 006408          481 CEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNL----LHRPLR--TGKWAVTYEEWPQEVYPPYAN  554 (646)
Q Consensus       481 l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~----~~~P~R--~sKWyVs~eeyp~~~YPpY~~  554 (646)
                      +..+......+|++.+|+|..+..+.+...+........ .+|....    .....+  ..++...    ......+| +
T Consensus        64 ~n~g~~~a~~~~i~~~D~D~~~~~~~l~~l~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~----~~~~~~~~-~  137 (221)
T cd02522          64 MNAGAAAARGDWLLFLHADTRLPPDWDAAIIETLRADGA-VAGAFRLRFDDPGPRLRLLELGANLR----SRLFGLPY-G  137 (221)
T ss_pred             HHHHHHhccCCEEEEEcCCCCCChhHHHHHHHHhhcCCc-EEEEEEeeecCCccchhhhhhcccce----ecccCCCc-C
Confidence            344555566899999999999988777776655443322 3333221    111111  0111111    00111122 4


Q ss_pred             CCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcCCC
Q 006408          555 GPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       555 G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +.+.++++++.+.+..-  ...   +..||.-++.-+.+.|..
T Consensus       138 ~~~~~~r~~~~~~~G~f--d~~---~~~ED~d~~~r~~~~G~~  175 (221)
T cd02522         138 DQGLFIRRELFEELGGF--PEL---PLMEDVELVRRLRRRGRP  175 (221)
T ss_pred             CceEEEEHHHHHHhCCC--Ccc---ccccHHHHHHHHHhCCCE
Confidence            56889999998887531  111   278999998888888854


No 61 
>PF00853 Runt:  Runt domain;  InterPro: IPR013524 The AML1 gene is rearranged by the t(8;21) translocation in acute myeloid leukemia []. The gene is highly similar to the Drosophila melanogaster segmentation gene runt and to the mouse transcription factor PEBP2 alpha subunit gene []. The region of shared similarity, known as the Runt domain, is responsible for DNA-binding and protein-protein interaction.  In addition to the highly-conserved Runt domain, the AML-1 gene product carries a putative ATP-binding site (GRSGRGKS), and has a C-terminal region rich in proline and serine residues. The protein (known as acute myeloid leukemia 1 protein, oncogene AML-1, core-binding factor (CBF), alpha-B subunit, etc.) binds to the core site, 5'-pygpyggt-3', of a number of enhancers and promoters.  The protein is a heterodimer of alpha- and beta-subunits. The alpha-subunit binds DNA as a monomer, and appears to have a role in the development of normal hematopoiesis. CBF is a nuclear protein expressed in numerous tissue types, except brain and heart; highest levels have been found to occur in thymus, bone marrow and peripheral blood. This domain occurs towards the N terminus of the proteins in this entry.; GO: 0003677 DNA binding, 0003700 sequence-specific DNA binding transcription factor activity, 0006355 regulation of transcription, DNA-dependent; PDB: 1E50_E 1LJM_A 1CO1_A 1H9D_C 1CMO_A 1EAO_B 1HJC_D 1HJB_F 2J6W_B 1EAN_A ....
Probab=54.24  E-value=16  Score=34.46  Aligned_cols=31  Identities=32%  Similarity=0.595  Sum_probs=20.7

Q ss_pred             cccccccCCCCCCCCCCCCCCCeEEEEEEEccc---------eEEEEeCCe
Q 006408          294 KRFIGREQKPEVTWPFPFVEGRLFILTLRAGVE---------GYHINVGGR  335 (646)
Q Consensus       294 ~~~~~~~~~~~~~~~fPF~~G~~F~lti~~g~e---------gf~v~VnG~  335 (646)
                      -||+||..           .|+.|+|||.+...         .++|+|||-
T Consensus        87 LRFvGRSG-----------RGKsFtltItv~t~PpqvAty~~AIKVTVDGP  126 (135)
T PF00853_consen   87 LRFVGRSG-----------RGKSFTLTITVFTNPPQVATYHRAIKVTVDGP  126 (135)
T ss_dssp             -EECST-T-----------TTSEEEEEEEE-SSS-EEEEECCEEEEESS-S
T ss_pred             cccccccC-----------CccceEEEEEEeCCCchHHhheeeEEEEecCC
Confidence            37899865           59999999988654         556677763


No 62 
>cd00761 Glyco_tranf_GTA_type Glycosyltransferase family A (GT-A) includes diverse families of glycosyl transferases with a common GT-A type structural fold. Glycosyltransferases (GTs) are enzymes that synthesize oligosaccharides, polysaccharides, and glycoconjugates by transferring the sugar moiety from an activated nucleotide-sugar donor to an acceptor molecule, which may be a growing oligosaccharide, a lipid, or a protein.  Based on the stereochemistry of the donor and acceptor molecules, GTs are classified as either retaining or inverting enzymes. To date, all GT structures adopt one of two possible folds, termed GT-A fold and GT-B fold.  This hierarchy includes diverse families of glycosyl transferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. The majority of the proteins in this superfamily are Glycosyltransferase family 2 (GT-2) proteins. But it als
Probab=49.77  E-value=1.7e+02  Score=25.25  Aligned_cols=82  Identities=15%  Similarity=0.135  Sum_probs=51.8

Q ss_pred             HHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcC--CCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCe
Q 006408          480 ICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIF--PKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPG  557 (646)
Q Consensus       480 ~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~--~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~G  557 (646)
                      .+.++.+....+|++.+|+|..+..+.+...+....  +...+..|.                               ++
T Consensus        68 ~~~~~~~~~~~d~v~~~d~D~~~~~~~~~~~~~~~~~~~~~~~v~~~-------------------------------~~  116 (156)
T cd00761          68 ARNAGLKAARGEYILFLDADDLLLPDWLERLVAELLADPEADAVGGP-------------------------------GN  116 (156)
T ss_pred             HHHHHHHHhcCCEEEEECCCCccCccHHHHHHHHHhcCCCceEEecc-------------------------------ch
Confidence            334444444899999999999998888777644322  212222111                               88


Q ss_pred             EEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHHcC
Q 006408          558 YVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQFN  595 (646)
Q Consensus       558 YVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~lg  595 (646)
                      +++++++.+.+....   ......-||..+...+.+.+
T Consensus       117 ~~~~~~~~~~~~~~~---~~~~~~~ed~~~~~~~~~~g  151 (156)
T cd00761         117 LLFRRELLEEIGGFD---EALLSGEEDDDFLLRLLRGG  151 (156)
T ss_pred             heeeHHHHHHhCCcc---hHhcCCcchHHHHHHHHhhc
Confidence            999999999886421   11122268888877776655


No 63 
>cd02514 GT13_GLCNAC-TI GT13_GLCNAC-TI is involved in an essential step in the synthesis of complex or hybrid-type N-linked oligosaccharides. Alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase (GLCNAC-T I , GNT-I)  transfers N-acetyl-D-glucosamine from UDP to high-mannose glycoprotein N-oligosaccharide, an essential step in the synthesis of complex or hybrid-type N-linked oligosaccharides. The enzyme is an integral membrane protein localized to the Golgi apparatus. The catalytic domain is located at the C-terminus. These proteins are members of the glycosy transferase family 13.
Probab=48.78  E-value=1.1e+02  Score=33.58  Aligned_cols=84  Identities=15%  Similarity=0.205  Sum_probs=49.1

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHH---HHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCC-CCCC
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVD---AVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYP-PYAN  554 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd---~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YP-pY~~  554 (646)
                      .++.|+....++++++.+|||..+.++   -+.+.|..+.....++  .+....   .+|+....... +...|- .|+.
T Consensus        87 ~aln~vF~~~~~~~vIILEDDl~~sPdFf~yf~~~l~~y~~D~~v~--~ISa~N---dnG~~~~~~~~-~~~lyrs~ff~  160 (334)
T cd02514          87 WALTQTFNLFGYSFVIILEDDLDIAPDFFSYFQATLPLLEEDPSLW--CISAWN---DNGKEHFVDDT-PSLLYRTDFFP  160 (334)
T ss_pred             HHHHHHHHhcCCCEEEEECCCCccCHhHHHHHHHHHHHHhcCCCEE--EEEeec---cCCcccccCCC-cceEEEecCCC
Confidence            366666655579999999999999888   3344444444444443  222111   12222111011 223333 5778


Q ss_pred             CCeEEeCHHHHHHH
Q 006408          555 GPGYVISSDIAKFI  568 (646)
Q Consensus       555 G~GYVLSrdla~~I  568 (646)
                      |.|.++.+++-+.+
T Consensus       161 glGWml~r~~W~e~  174 (334)
T cd02514         161 GLGWMLTRKLWKEL  174 (334)
T ss_pred             chHHHHHHHHHHHh
Confidence            99999999888777


No 64 
>KOG1594 consensus Uncharacterized enzymes related to aldose 1-epimerase [Carbohydrate transport and metabolism]
Probab=46.40  E-value=73  Score=33.96  Aligned_cols=119  Identities=18%  Similarity=0.294  Sum_probs=70.5

Q ss_pred             ecCCcCCCCCCCCeeEEEccccCCCCCCCCEEEEecccC-CcccceeecCCCCCCCCCCccccchhhhhhccccCccccc
Q 006408          207 LQGLKSVDGEDPPKILHLNPRIKGDWSHRPVIEHNTCYR-MQWGTAQRCDGLSSKKDDDMLVDGNLRCEKWMRNDVADSK  285 (646)
Q Consensus       207 L~g~~~~~~~~~~i~LH~NpRl~~d~~~~pvIv~Nt~~~-~~WG~eeRc~~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~  285 (646)
                      |.+-+...|.   |.+.| |-|.. |+   .+.|--+-| .-|--+..-+..++..+.  +||-.+|-+.-.+.      
T Consensus        65 f~ppKpIRGG---IP~~F-PQFG~-~g---~l~qHGFaRn~~W~v~~~p~~lp~~~~a--~Vdl~Lk~~~~~~k------  128 (305)
T KOG1594|consen   65 FKPPKPIRGG---IPICF-PQFGN-FG---SLPQHGFARNRFWEVENNPPPLPSLGKA--TVDLILKSSEDDLK------  128 (305)
T ss_pred             cCCCCcccCC---cceEe-eccCC-CC---cccccccccceeeEeccCCCCCCcCCce--eEEEEecCChhhhh------
Confidence            3444444442   55656 77764 22   455555554 578877766655543332  46655554411111      


Q ss_pred             cccccccccccccccCCCCCCCCCCCCCCCeEEEEEEEccceEEEE-----eCCeEE-EEeecccCcCcccceEEEEecc
Q 006408          286 DSKTASWFKRFIGREQKPEVTWPFPFVEGRLFILTLRAGVEGYHIN-----VGGRHV-TSFPYRTGFTLEDATGLAIKGD  359 (646)
Q Consensus       286 ~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~lti~~g~egf~v~-----VnG~h~-~sF~yR~~~~l~~v~~l~v~GD  359 (646)
                                         + |+|-|    .|.++|..+....+.+     .|++.+ .+|+|++=|...||++++|.|=
T Consensus       129 -------------------i-Wp~~F----e~~lrv~l~~g~Lt~~~rV~Ntd~KpFsF~~alHtYf~vsdisevrveGL  184 (305)
T KOG1594|consen  129 -------------------I-WPHSF----ELRLRVSLGDGELTLTSRVRNTDSKPFSFSFALHTYFRVSDISEVRVEGL  184 (305)
T ss_pred             -------------------h-CCcce----EEEEEEEEcCCceEEEEEeecCCCCceEEEeEeeeeEeecccceEEEecc
Confidence                               1 56655    4677777775444432     377766 5889999888899999999995


Q ss_pred             cceeee
Q 006408          360 VDIHSV  365 (646)
Q Consensus       360 v~l~sV  365 (646)
                      -.+..+
T Consensus       185 ~tldyl  190 (305)
T KOG1594|consen  185 ETLDYL  190 (305)
T ss_pred             cccccc
Confidence            554443


No 65 
>TIGR03111 glyc2_xrt_Gpos1 putative glycosyltransferase TIGR03111. Members of this protein family probable glycosyltransferases of family 2, whose genes are near those for Gram-positive proteins (TIGR03110) related to the proposed exosortase (TIGR02602).
Probab=43.52  E-value=5.1e+02  Score=28.98  Aligned_cols=110  Identities=15%  Similarity=0.065  Sum_probs=63.7

Q ss_pred             HHHhhhhhcCCceEEEEecCCccccHHHHHHHHhhcCC--CcceEEEeeccCCCcc-ccc---cceeccc---cCC----
Q 006408          479 AICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGIFP--KRSLYMGNLNLLHRPL-RTG---KWAVTYE---EWP----  545 (646)
Q Consensus       479 ~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~--~~~lY~G~v~~~~~P~-R~s---KWyVs~e---eyp----  545 (646)
                      .++.++.+..+.+|++.+|+|..+..+.|.+.++....  .-....|.+....... +..   .+.+...   +|.    
T Consensus       121 ~AlN~gl~~s~g~~v~~~DaD~~~~~d~L~~l~~~f~~~~~v~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~l  200 (439)
T TIGR03111       121 KALNAAIYNSIGKYIIHIDSDGKLHKDAIKNMVTRFENNPDIHAMTGVILTDKELIEKTKGRFLKLIRRCEYFEYAQAFL  200 (439)
T ss_pred             HHHHHHHHHccCCEEEEECCCCCcChHHHHHHHHHHHhCCCeEEEEeEEecCchhhhhhcchhhhHhHHhHHHHHHHHHH
Confidence            35566777778999999999999999998888876632  2223335443211100 000   1111110   110    


Q ss_pred             -------CCCCCCCCCCCeEEeCHHHHHHHHHHhcCCccCCCCCChHHHHHHHHH
Q 006408          546 -------QEVYPPYANGPGYVISSDIAKFIVLQHGNQSLRLFKMEDVSMGMWVEQ  593 (646)
Q Consensus       546 -------~~~YPpY~~G~GYVLSrdla~~Iv~~~~~~~l~~f~~EDV~iGi~l~~  593 (646)
                             ....+..++|++.++.++++.++.--  ..   ..-.||..++.-+..
T Consensus       201 ~~r~~~s~~~~~~~~sGa~~~~Rr~~l~~vggf--~~---~~i~ED~~l~~rl~~  250 (439)
T TIGR03111       201 AGRNFESQVNSLFTLSGAFSAFRRETILKTQLY--NS---ETVGEDTDMTFQIRE  250 (439)
T ss_pred             hhhHHHHhcCCeEEEccHHHhhhHHHHHHhCCC--CC---CCcCccHHHHHHHHH
Confidence                   11123346788889999998876431  11   123799999877654


No 66 
>KOG3982 consensus Runt and related transcription factors [Transcription]
Probab=33.75  E-value=40  Score=37.18  Aligned_cols=30  Identities=33%  Similarity=0.618  Sum_probs=22.0

Q ss_pred             cccccccCCCCCCCCCCCCCCCeEEEEEEEcc---------ceEEEEeCC
Q 006408          294 KRFIGREQKPEVTWPFPFVEGRLFILTLRAGV---------EGYHINVGG  334 (646)
Q Consensus       294 ~~~~~~~~~~~~~~~fPF~~G~~F~lti~~g~---------egf~v~VnG  334 (646)
                      -||.||..           .|+.|+|||.+-.         ..++|+|||
T Consensus       184 LRFVGRSG-----------RGKsFtLTIti~TnP~qvATy~kaIKVTVDG  222 (475)
T KOG3982|consen  184 LRFVGRSG-----------RGKSFTLTITIFTNPPQVATYHKAIKVTVDG  222 (475)
T ss_pred             ceeecccC-----------CCcceEEEEEEecCCcceeeeeceEEEeccC
Confidence            47788865           7899999998754         345566666


No 67 
>cd04190 Chitin_synth_C C-terminal domain of Chitin Synthase catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin. Chitin synthase, also called UDP-N-acetyl-D-glucosamine:chitin 4-beta-N-acetylglucosaminyltransferase, catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin, which is a linear homopolymer of GlcNAc residues formed by covalent beta-1,4 linkages. Chitin is an important component of the cell wall of fungi and bacteria and it is synthesized on the cytoplasmic surface of the cell membrane by  membrane bound chitin synthases. Studies with fungi have revealed that most of them contain more than one chitin synthase gene. At least five subclasses of chitin synthases have been identified.
Probab=31.92  E-value=59  Score=32.98  Aligned_cols=110  Identities=15%  Similarity=0.081  Sum_probs=63.3

Q ss_pred             CCceEEEEecCCccccHHHHHHHHhhcC--CCcceEEEeeccCCC---cc-c--cccceec----cccCCCCCCCCCCCC
Q 006408          488 VTAAYIMKCDDDTFIRVDAVLKEIEGIF--PKRSLYMGNLNLLHR---PL-R--TGKWAVT----YEEWPQEVYPPYANG  555 (646)
Q Consensus       488 ~~akfvmKvDDDtfVnvd~Ll~~L~~~~--~~~~lY~G~v~~~~~---P~-R--~sKWyVs----~eeyp~~~YPpY~~G  555 (646)
                      .+.+|++.+|.|+.+..+.|...+..+.  +.-....|.+.....   ++ +  +--|...    ......-.+..++.|
T Consensus        72 a~~e~i~~~DaD~~~~~~~l~~l~~~~~~~p~vg~v~g~~~~~~~~~~~~~~~q~~ey~~~~~~~~~~~s~~g~~~~~~G  151 (244)
T cd04190          72 DDPEFILLVDADTKFDPDSIVQLYKAMDKDPEIGGVCGEIHPMGKKQGPLVMYQVFEYAISHWLDKAFESVFGFVTCLPG  151 (244)
T ss_pred             CCCCEEEEECCCCcCCHhHHHHHHHHHHhCCCEEEEEeeeEEcCCcchhHHHhHheehhhhhhhcccHHHcCCceEECCC
Confidence            4899999999999999998888877652  222234455432111   00 0  0000000    000111234667889


Q ss_pred             CeEEeCHHHHHHHHHHhcC--------Ccc-------CCCCCChHHHHHHHHHcCCC
Q 006408          556 PGYVISSDIAKFIVLQHGN--------QSL-------RLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       556 ~GYVLSrdla~~Iv~~~~~--------~~l-------~~f~~EDV~iGi~l~~lgi~  597 (646)
                      +++++.+++++.+......        ..+       .....||..++..+...|..
T Consensus       152 ~~~~~R~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ED~~l~~~l~~~G~~  208 (244)
T cd04190         152 CFSMYRIEALKGDNGGKGPLLDYAYLTNTVDSLHKKNNLDLGEDRILCTLLLKAGPK  208 (244)
T ss_pred             ceEEEEehhhcCCccccccchhhccccCcccchHHHHHHhHhcccceeHHHhccCCc
Confidence            9999999998876332100        000       12246999998888777754


No 68 
>cd06438 EpsO_like EpsO protein participates in the methanolan synthesis. The Methylobacillus sp EpsO protein is predicted to participate in the methanolan synthesis. Methanolan is an exopolysaccharide (EPS), composed of glucose, mannose and galactose.  A 21 genes cluster was predicted to participate in the methanolan synthesis. Gene disruption analysis revealed that EpsO is one of the glycosyltransferase enzymes involved in the synthesis of repeating sugar units onto the lipid carrier.
Probab=30.35  E-value=4.7e+02  Score=24.70  Aligned_cols=77  Identities=12%  Similarity=0.078  Sum_probs=47.8

Q ss_pred             CCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccce---------ec----cccCCCCCCCCCCC
Q 006408          488 VTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWA---------VT----YEEWPQEVYPPYAN  554 (646)
Q Consensus       488 ~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWy---------Vs----~eeyp~~~YPpY~~  554 (646)
                      .+.+|++.+|.|+.+..+.|...+..+.....+..|...... +.  ..|.         ..    ...+..-..+.++.
T Consensus        80 ~~~d~v~~~DaD~~~~p~~l~~l~~~~~~~~~~v~g~~~~~~-~~--~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  156 (183)
T cd06438          80 DDPDAVVVFDADNLVDPNALEELNARFAAGARVVQAYYNSKN-PD--DSWITRLYAFAFLVFNRLRPLGRSNLGLSCQLG  156 (183)
T ss_pred             CCCCEEEEEcCCCCCChhHHHHHHHHHhhCCCeeEEEEeeeC-Cc--cCHHHHHHHHHHHHHHHHHHHHHHHcCCCeeec
Confidence            368999999999999988888887776544445556543211 11  1111         00    00000112344678


Q ss_pred             CCeEEeCHHHHHH
Q 006408          555 GPGYVISSDIAKF  567 (646)
Q Consensus       555 G~GYVLSrdla~~  567 (646)
                      |.++++++++++.
T Consensus       157 G~~~~~rr~~l~~  169 (183)
T cd06438         157 GTGMCFPWAVLRQ  169 (183)
T ss_pred             CchhhhHHHHHHh
Confidence            9999999999988


No 69 
>cd06913 beta3GnTL1_like Beta 1, 3-N-acetylglucosaminyltransferase is essential for the formation of poly-N-acetyllactosamine . This family includes human Beta3GnTL1 and related eukaryotic proteins. Human Beta3GnTL1 is a putative beta-1,3-N-acetylglucosaminyltransferase. Beta3GnTL1 is expressed at various levels in most of tissues examined. Beta 1, 3-N-acetylglucosaminyltransferase has been found to be essential for the formation of poly-N-acetyllactosamine. Poly-N-acetyllactosamine is a unique carbohydrate composed of N-acetyllactosamine repeats. It is often an important part of cell-type-specific oligosaccharide structures and some functional oligosaccharides. It has been shown that the structure and biosynthesis of poly-N-acetyllactosamine display a dramatic change during development and oncogenesis. Several members of beta-1, 3-N-acetylglucosaminyltransferase have been identified.
Probab=28.94  E-value=2.2e+02  Score=27.74  Aligned_cols=34  Identities=12%  Similarity=0.172  Sum_probs=26.2

Q ss_pred             HhhhhhcCCceEEEEecCCccccHHHHHHHHhhc
Q 006408          481 CEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIEGI  514 (646)
Q Consensus       481 l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~~~  514 (646)
                      ...+.+....+|++.+|+|.++..+.+...+...
T Consensus        76 ~N~g~~~a~gd~i~~lD~D~~~~~~~l~~~~~~~  109 (219)
T cd06913          76 KNQAIAQSSGRYLCFLDSDDVMMPQRIRLQYEAA  109 (219)
T ss_pred             HHHHHHhcCCCEEEEECCCccCChhHHHHHHHHH
Confidence            3455566678999999999999988877666554


No 70 
>COG4092 Predicted glycosyltransferase involved in capsule biosynthesis [Cell envelope biogenesis, outer membrane]
Probab=25.60  E-value=2.2e+02  Score=30.59  Aligned_cols=65  Identities=11%  Similarity=0.164  Sum_probs=47.5

Q ss_pred             HHHHHHHHhhcCcEEEEeecc--cccchhHHHHHHHhhhhhcCCceEEEEecCCccccHHHHHHHHh
Q 006408          448 NAVLKKEAAFFGDIVILPFMD--RYELVVLKTIAICEFGVQNVTAAYIMKCDDDTFIRVDAVLKEIE  512 (646)
Q Consensus       448 ~~~L~~Eae~ygDII~~df~D--sY~nLtlKtl~~l~wa~~~~~akfvmKvDDDtfVnvd~Ll~~L~  512 (646)
                      ...|.+=.....-++.+++.+  .+..-+.--.++..|+++.|...+++.+|-|+|.-.|+..+.|+
T Consensus        51 d~~i~~~i~~~~~~~yl~~~s~~~F~s~~~c~n~ga~Ysh~~~~Sn~vlFlDvDc~~S~dnF~k~l~  117 (346)
T COG4092          51 DRLIRSYIDPMPRVLYLDFGSPEPFASETICANNGADYSHEKCESNLVLFLDVDCFGSSDNFAKMLS  117 (346)
T ss_pred             HHHHHHHhccccceEEEecCCCccccchhhhhhccchhhhccccccEEEEEeccccccHHHHHHHHH
Confidence            345555555555666677654  44443444556778888889999999999999999999998883


No 71 
>COG3306 Glycosyltransferase involved in LPS biosynthesis [Cell envelope biogenesis, outer membrane]
Probab=25.18  E-value=1.8e+02  Score=30.72  Aligned_cols=170  Identities=15%  Similarity=0.137  Sum_probs=81.5

Q ss_pred             EEEeCCCCCHHHHHHHHHHhhcccccCCCceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHh
Q 006408          403 IGVLSATNHFAERMAIRKTWMQSSKIKSSNVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICE  482 (646)
Q Consensus       403 I~V~Sap~~~~rR~aIR~TW~~~~~i~~~~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~  482 (646)
                      +.|.|-.+..+|+..+.++-....    + +...||-+.++..+....+..|.. .+      +...+.-...+.--+|-
T Consensus         5 ~~vIsL~~s~~R~~~~~~~f~~~~----~-~~f~~~~av~~~~~~~~~~~~~~~-~~------~~~~~~~~ls~gEiGC~   72 (255)
T COG3306           5 IHVISLKSSQERLEHVAETFEALG----G-LPFQRFDAVNGKSEDEKDLIAELD-AG------HLLYEGRRLSPGEIGCY   72 (255)
T ss_pred             eehhhhhhhHHHHHHHHHHHhhcc----C-CCceEeeccCccccCHHHHhcccc-ch------hhhhhccccCchhHHHH
Confidence            456777788889999999887543    2 566777777764222122222200 11      11111111112222221


Q ss_pred             hhh----h-cC--CceEEEEecCCccccHHHHHHHHhhcC-CCcceEEEeeccCCCcccc----ccceecc-ccCCCCCC
Q 006408          483 FGV----Q-NV--TAAYIMKCDDDTFIRVDAVLKEIEGIF-PKRSLYMGNLNLLHRPLRT----GKWAVTY-EEWPQEVY  549 (646)
Q Consensus       483 wa~----~-~~--~akfvmKvDDDtfVnvd~Ll~~L~~~~-~~~~lY~G~v~~~~~P~R~----sKWyVs~-eeyp~~~Y  549 (646)
                      -.+    + +.  +..|++-..||+.+.-+ ....|+... ..... .|.-..   .+|.    .+..+.. ..+-...|
T Consensus        73 lSH~~lw~~~~~~~~~yi~I~EDDV~l~~~-f~~~l~~~~~~~~~~-~~~~~~---~~~~~~~~~~~~~~~~~~~~~~~~  147 (255)
T COG3306          73 LSHLKLWKKALEENLPYILILEDDVVLGED-FEEFLEDDLKLPVRF-LGDDID---IHRLETFLSPNPLAFNAVFIGRNF  147 (255)
T ss_pred             HHHHHHHHHHHhCCCCeEEEeccccccccc-HHHHHHHHHhhhhhc-cchHHH---HHHHHHhcccceeecccccccccc
Confidence            111    1 22  67799999999998544 333343311 11111 122111   0110    0001110 11112222


Q ss_pred             ----CCCCCCCeEEeCHHHHHHHHHHhcCCccCC-CCCChHHHHHHH
Q 006408          550 ----PPYANGPGYVISSDIAKFIVLQHGNQSLRL-FKMEDVSMGMWV  591 (646)
Q Consensus       550 ----PpY~~G~GYVLSrdla~~Iv~~~~~~~l~~-f~~EDV~iGi~l  591 (646)
                          ..+.+-+||++|+.+++.+++....  .+. .+.|+.+.--+.
T Consensus       148 ~~~~~~~~gt~gYiis~~aAk~fl~~~~~--~~~~~pvD~~~~~~~~  192 (255)
T COG3306         148 PLLNSYHLGTAGYIISRKAAKKFLELTES--FKVVLPVDWFMFLEFL  192 (255)
T ss_pred             hhhhhcccCccceeecHHHHHHHHHHhhh--cccccChhHHHhhhhc
Confidence                2347889999999999999997422  233 345555444444


No 72 
>PRK11234 nfrB bacteriophage N4 adsorption protein B; Provisional
Probab=24.93  E-value=1.3e+03  Score=28.08  Aligned_cols=156  Identities=12%  Similarity=-0.010  Sum_probs=83.0

Q ss_pred             ceEEEEEEeeCCChhHHHHHHHHHhhcCcEEEEeecccccchhHHHHHHHhhhhhcC---------CceEEEEecCCccc
Q 006408          432 NVVARFFVALNPRKEVNAVLKKEAAFFGDIVILPFMDRYELVVLKTIAICEFGVQNV---------TAAYIMKCDDDTFI  502 (646)
Q Consensus       432 ~v~~~FfVG~~~~~~~~~~L~~Eae~ygDII~~df~DsY~nLtlKtl~~l~wa~~~~---------~akfvmKvDDDtfV  502 (646)
                      +..+.|++. +.+..+...+.+=.+.|.++..+.... ..| +-|.- .++|+....         .++.++-.|-|+.|
T Consensus        93 ~~eI~vi~~-~nD~~T~~~~~~l~~~~p~~~~v~~~~-~g~-~gKa~-aLN~~l~~~~~~e~~~~~~~~vvvi~DAD~~v  168 (727)
T PRK11234         93 NYHIFVGTY-PNDPATQADVDAVCARFPNVHKVVCAR-PGP-TSKAD-CLNNVLDAITQFERSANFAFAGFILHDAEDVI  168 (727)
T ss_pred             CeEEEEEec-CCChhHHHHHHHHHHHCCCcEEEEeCC-CCC-CCHHH-HHHHHHHHHHhhhcccCCcccEEEEEcCCCCC
Confidence            344444433 334444555665567788764433332 112 33544 334443321         34567779999999


Q ss_pred             cHHHHHHHHhhcCCCcceEEEeeccCCCcccc-----ccceeccccCC----C-----C--CCCCCCCCCeEEeCHHHHH
Q 006408          503 RVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRT-----GKWAVTYEEWP----Q-----E--VYPPYANGPGYVISSDIAK  566 (646)
Q Consensus       503 nvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~-----sKWyVs~eeyp----~-----~--~YPpY~~G~GYVLSrdla~  566 (646)
                      ..+.|. .+..+.....+.-+...   +..|+     ++-|+.  +|.    .     .  .-+-.++|.|..+|+.+++
T Consensus       169 ~pd~L~-~~~~l~~~~~~VQ~p~~---p~~~~~~~~~~~~~~~--EFa~~~~~~~~~~~~lgg~~~l~G~~~af~Rr~l~  242 (727)
T PRK11234        169 SPMELR-LFNYLVERKDLIQIPVY---PFEREWTHFTSGTYID--EFAELHGKDVPVREALAGQVPSAGVGTCFSRRAVT  242 (727)
T ss_pred             ChhHHH-HHHhhcCCCCeEeeccc---CCCccHHHHHHHHHHH--HHHHHhhhhhHHHHHcCCCcccCCceEEEecccHH
Confidence            999986 44444332233222111   11122     121121  111    0     1  1244678999999988777


Q ss_pred             HHHHHhcC-CccCCCCCChHHHHHHHHHcCCC
Q 006408          567 FIVLQHGN-QSLRLFKMEDVSMGMWVEQFNST  597 (646)
Q Consensus       567 ~Iv~~~~~-~~l~~f~~EDV~iGi~l~~lgi~  597 (646)
                      .+.+.... .-..-.--||.-+|+-+...|..
T Consensus       243 al~~~ggg~~~~~~~lTED~dlg~rL~~~G~~  274 (727)
T PRK11234        243 ALLEDGDGIAFDVQSLTEDYDIGFRLKEKGMR  274 (727)
T ss_pred             HHHHhcCCCCcCCCcchHHHHHHHHHHHCCCE
Confidence            66664201 11123346999999999999976


No 73 
>PHA01631 hypothetical protein
Probab=24.13  E-value=1.4e+02  Score=29.79  Aligned_cols=65  Identities=15%  Similarity=0.222  Sum_probs=40.8

Q ss_pred             cCCceEEEEecCCccccHHHHHHHHhhcCCCcceEEEeeccCCCccccccceeccccCCCCCCCCCCCCCeEEeCHHHHH
Q 006408          487 NVTAAYIMKCDDDTFIRVDAVLKEIEGIFPKRSLYMGNLNLLHRPLRTGKWAVTYEEWPQEVYPPYANGPGYVISSDIAK  566 (646)
Q Consensus       487 ~~~akfvmKvDDDtfVnvd~Ll~~L~~~~~~~~lY~G~v~~~~~P~R~sKWyVs~eeyp~~~YPpY~~G~GYVLSrdla~  566 (646)
                      +.+-+.++.+|.|++|+.-.  ..+    +...++-=+              +|--.+|...+-+||.|.-|++.+..+.
T Consensus        69 ~i~DDi~~iIDSDV~ipn~~--~~~----~~~~v~t~C--------------iPA~~kp~~~v~~FC~sTNf~~pr~~l~  128 (176)
T PHA01631         69 NIEDDIIAIIDSDLIIPNLR--EII----PNERVFTPC--------------YWLYYDWANEIRPFCSGTNYIFRKSLLP  128 (176)
T ss_pred             cCCccEEEEeccceEecCcc--ccc----cCCCcccee--------------eeeeecCCCcEEEEEccccEEeeHHHhH
Confidence            45788899999999986432  111    111122111              1111233455668999999999999999


Q ss_pred             HHHHH
Q 006408          567 FIVLQ  571 (646)
Q Consensus       567 ~Iv~~  571 (646)
                      .+...
T Consensus       129 ~l~~v  133 (176)
T PHA01631        129 YLEYT  133 (176)
T ss_pred             HHHHH
Confidence            98764


No 74 
>PF04666 Glyco_transf_54:  N-Acetylglucosaminyltransferase-IV (GnT-IV) conserved region;  InterPro: IPR006759 The complex-type of oligosaccharides are synthesised through elongation by glycosyltransferases after trimming of the precursor oligosaccharides transferred to proteins in the endoplasmic reticulum. N-Acetylglucosaminyltransferases (GnTs) take part in the formation of branches in the biosynthesis of complex-type sugar chains.  In vertebrates, six GnTs, designated as GnT-I to -VI, which catalyse the transfer of GlcNAc to the core mannose residues of Asn-linked sugar chains, have been identified. GnT-IV (2.4.1.145 from EC) catalyzes the transfer of GlcNAc from UDP-GlcNAc to the GlcNAc1-2Man1-3 arm of core oligosaccharide [Gn2(22)core oligosaccharide] and forms a GlcNAc1-4(GlcNAc1-2)Man1-3 structure on the core oligosaccharide (Gn3(2,4,2)core oligosaccharide). In some members the conserved region occupies all but the very N-terminal, where there is a signal sequence on all members. For other members the conserved region does not occupy the entire protein but is still to the N-terminal end of the protein [].; GO: 0016758 transferase activity, transferring hexosyl groups, 0005975 carbohydrate metabolic process, 0016020 membrane
Probab=21.07  E-value=4.9e+02  Score=28.12  Aligned_cols=109  Identities=15%  Similarity=0.158  Sum_probs=54.4

Q ss_pred             CCCCceEEEEEeCCCCCHHHHHHHHHHhhc----ccccCCCceEEEEEEeeCCC---hhHHHHHHHHHhh---cCcEEEE
Q 006408          395 PARPVHLFIGVLSATNHFAERMAIRKTWMQ----SSKIKSSNVVARFFVALNPR---KEVNAVLKKEAAF---FGDIVIL  464 (646)
Q Consensus       395 p~~~v~LlI~V~Sap~~~~rR~aIR~TW~~----~~~i~~~~v~~~FfVG~~~~---~~~~~~L~~Eae~---ygDII~~  464 (646)
                      +..+..|.|||.|.....  -..+..|=++    ....+...+.++.+++....   ..+...|..+-..   -|-|.++
T Consensus        48 ~~~~~~L~IGIpTV~R~~--~sYL~~TL~SLl~~ls~~Er~~i~IvVllAd~Dp~~~~~~~~~i~~~f~~~i~sG~l~VI  125 (297)
T PF04666_consen   48 PRTGKKLCIGIPTVKREK--ESYLLDTLASLLDGLSPEERKDIVIVVLLADTDPDYHPSVAQNISTRFADHIESGLLEVI  125 (297)
T ss_pred             CCCCCeEEEEecccccCC--CchHHHHHHHHHHhCCHHHhcCeEEEEEecCCChhhhHHHHHHHHHHhHHHHHhCceEEE
Confidence            345566999999976542  2334444432    22223356777777776542   2222333322111   1323333


Q ss_pred             eeccc-cc--------------chhHHHHHHHhhhh--hcC--CceEEEEecCCccccHH
Q 006408          465 PFMDR-YE--------------LVVLKTIAICEFGV--QNV--TAAYIMKCDDDTFIRVD  505 (646)
Q Consensus       465 df~Ds-Y~--------------nLtlKtl~~l~wa~--~~~--~akfvmKvDDDtfVnvd  505 (646)
                      .-..+ |.              ...+.+..-+.|+.  ..|  .++|+|-..||+.....
T Consensus       126 ~~p~~~Yp~l~~l~~~~~d~~~rv~wrsKq~lDya~Lm~y~~~~~~YyL~LEDDVia~~~  185 (297)
T PF04666_consen  126 SPPPSYYPDLDNLKRNFGDSEERVRWRSKQNLDYAFLMNYCQNLGDYYLQLEDDVIAAPG  185 (297)
T ss_pred             ecccccCCChhhhhhcccChhhhhhHHHhhcccHHHHHHHHHhcCCeEEEecCCeEechh
Confidence            33322 22              22233333444433  222  68899999999887554


Done!