Query         006036
Match_columns 663
No_of_seqs    332 out of 1920
Neff          5.5 
Searched_HMMs 46136
Date          Thu Mar 28 17:25:54 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/006036.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/006036hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PLN03133 beta-1,3-galactosyltr 100.0  8E-158  2E-162 1322.9  58.7  611   13-663     1-634 (636)
  2 KOG2287 Galactosyltransferases 100.0 1.3E-59 2.8E-64  504.5  27.8  332  327-663     6-347 (349)
  3 PLN03193 beta-1,3-galactosyltr 100.0 1.1E-49 2.3E-54  427.6  20.5  245  365-632   103-362 (408)
  4 PF01762 Galactosyl_T:  Galacto 100.0 4.5E-44 9.7E-49  353.7  16.4  184  429-614     1-190 (195)
  5 PTZ00210 UDP-GlcNAc-dependent  100.0 1.1E-36 2.3E-41  323.3  20.5  229  412-657    77-359 (382)
  6 KOG2288 Galactosyltransferases 100.0 3.3E-35 7.2E-40  296.0  18.3  241  412-662     8-270 (274)
  7 smart00276 GLECT Galectin. Gal 100.0 1.8E-30 3.9E-35  241.8  16.6  127  182-387     1-127 (128)
  8 cd00070 GLECT Galectin/galacto 100.0 2.8E-29   6E-34  233.2  16.0  126  182-386     2-127 (127)
  9 PF00337 Gal-bind_lectin:  Gala 100.0   2E-29 4.4E-34  235.0  14.6  133  181-387     1-133 (133)
 10 KOG3587 Galectin, galactose-bi  99.9 7.1E-25 1.5E-29  208.4  15.2  135  181-389     5-140 (143)
 11 PF02434 Fringe:  Fringe-like;   99.7   4E-17 8.7E-22  168.8   9.7  180  416-612     7-196 (252)
 12 KOG2246 Galactosyltransferases  99.6 1.7E-14 3.6E-19  156.4  12.2  164  412-613    88-263 (364)
 13 PLN03153 hypothetical protein;  99.0 4.1E-09 8.8E-14  117.4  12.2  104  502-622   207-313 (537)
 14 KOG3708 Uncharacterized conser  97.2  0.0012 2.7E-08   73.6   9.3  198  414-655    25-245 (681)
 15 cd02520 Glucosylceramide_synth  94.2     2.2 4.9E-05   41.6  15.9  128  449-611    31-162 (196)
 16 PF13641 Glyco_tranf_2_3:  Glyc  93.9    0.83 1.8E-05   45.2  12.3  185  416-620     2-201 (228)
 17 TIGR03472 HpnI hopanoid biosyn  92.9     1.7 3.8E-05   47.5  13.8  186  415-612    41-239 (373)
 18 PF01755 Glyco_transf_25:  Glyc  92.1     1.8   4E-05   42.6  11.6   35  419-459     4-38  (200)
 19 cd04186 GT_2_like_c Subfamily   91.5     5.9 0.00013   36.3  13.7   84  501-620    70-156 (166)
 20 cd04196 GT_2_like_d Subfamily   91.1       2 4.4E-05   41.5  10.6  153  448-611    27-189 (214)
 21 cd04192 GT_2_like_e Subfamily   90.9     5.6 0.00012   38.8  13.6  152  449-609    29-191 (229)
 22 cd06439 CESA_like_1 CESA_like_  90.5      12 0.00027   37.4  16.0  180  414-611    28-214 (251)
 23 cd06423 CESA_like CESA_like is  89.9     6.7 0.00014   35.5  12.3   90  498-587    71-171 (180)
 24 cd06421 CESA_CelA_like CESA_Ce  88.6     2.4 5.1E-05   41.8   8.9  117  499-623    78-205 (234)
 25 cd06433 GT_2_WfgS_like WfgS an  88.3       6 0.00013   37.5  11.2  110  497-611    67-179 (202)
 26 PF00535 Glycos_transf_2:  Glyc  87.5     3.5 7.7E-05   37.4   8.8  155  418-585     3-168 (169)
 27 cd06435 CESA_NdvC_like NdvC_li  87.5     8.1 0.00018   38.4  12.1  176  448-652    28-220 (236)
 28 PRK11204 N-glycosyltransferase  87.5      26 0.00057   38.6  17.1  186  414-623    53-254 (420)
 29 cd02525 Succinoglycan_BP_ExoA   87.4      32 0.00068   34.0  17.9  159  448-620    31-199 (249)
 30 cd06434 GT2_HAS Hyaluronan syn  87.3      14 0.00031   36.5  13.7  156  449-620    29-204 (235)
 31 cd02510 pp-GalNAc-T pp-GalNAc-  86.8      32 0.00069   36.1  16.5  113  497-611    75-210 (299)
 32 COG1215 Glycosyltransferases,   86.6      25 0.00055   38.5  16.4  194  415-624    54-260 (439)
 33 PRK14583 hmsR N-glycosyltransf  86.3      20 0.00043   40.3  15.6  183  415-622    75-274 (444)
 34 cd04184 GT2_RfbC_Mx_like Myxoc  85.0      37 0.00081   32.5  16.3  158  448-622    31-194 (202)
 35 PF13506 Glyco_transf_21:  Glyc  84.8     1.2 2.5E-05   44.0   4.4  104  504-612    30-140 (175)
 36 cd04185 GT_2_like_b Subfamily   84.7      11 0.00023   36.6  11.0   87  497-612    72-160 (202)
 37 cd06532 Glyco_transf_25 Glycos  84.2     6.2 0.00014   36.7   8.7  109  419-589     2-117 (128)
 38 PF13632 Glyco_trans_2_3:  Glyc  81.5     5.5 0.00012   38.5   7.5  108  508-624     1-119 (193)
 39 cd04195 GT2_AmsE_like GT2_AmsE  81.1      11 0.00024   36.3   9.5  157  449-622    30-194 (201)
 40 cd06420 GT2_Chondriotin_Pol_N   81.0      25 0.00055   33.1  11.8   96  497-612    71-166 (182)
 41 COG1216 Predicted glycosyltran  80.5      83  0.0018   33.3  17.1  134  474-612    55-206 (305)
 42 TIGR03111 glyc2_xrt_Gpos1 puta  80.0      45 0.00097   37.5  15.1  184  415-611    49-251 (439)
 43 TIGR03469 HonB hopene-associat  79.2      69  0.0015   35.3  16.0  189  414-612    39-248 (384)
 44 cd04187 DPM1_like_bac Bacteria  76.9     9.5 0.00021   36.3   7.5  134  448-587    29-164 (181)
 45 PLN02726 dolichyl-phosphate be  76.4      53  0.0011   33.2  13.2  133  448-588    40-184 (243)
 46 cd02526 GT2_RfbF_like RfbF is   75.9      74  0.0016   31.4  13.9  105  505-612    75-190 (237)
 47 PF04646 DUF604:  Protein of un  75.9     3.3 7.2E-05   43.6   4.2   42  571-612    12-55  (255)
 48 cd04179 DPM_DPG-synthase_like   73.5     8.3 0.00018   36.4   6.1  119  462-586    41-167 (185)
 49 cd06427 CESA_like_2 CESA_like_  73.4      42  0.0009   33.8  11.5  116  496-620    75-203 (241)
 50 PRK14716 bacteriophage N4 adso  65.3      98  0.0021   36.0  13.5  194  414-623    65-283 (504)
 51 cd00761 Glyco_tranf_GTA_type G  64.3      97  0.0021   26.9  13.0   77  499-611    71-150 (156)
 52 TIGR03030 CelA cellulose synth  61.8      83  0.0018   38.0  12.5  126  488-622   212-351 (713)
 53 cd06437 CESA_CaSu_A2 Cellulose  61.7 1.7E+02  0.0038   28.9  15.9  104  497-611    79-198 (232)
 54 cd04191 Glucan_BSP_ModH Glucan  58.6      71  0.0015   33.4  10.0  193  419-622     3-224 (254)
 55 cd06438 EpsO_like EpsO protein  56.9      82  0.0018   30.1   9.5   76  504-584    80-169 (183)
 56 cd06442 DPM1_like DPM1_like re  53.2      96  0.0021   30.2   9.5   87  499-586    72-167 (224)
 57 PF10111 Glyco_tranf_2_2:  Glyc  51.9      91   0.002   32.7   9.6  160  447-613    33-209 (281)
 58 PRK10714 undecaprenyl phosphat  49.1      93   0.002   33.6   9.3  132  448-587    38-174 (325)
 59 cd02522 GT_2_like_a GT_2_like_  48.2 2.6E+02  0.0057   27.0  14.1  104  498-611    65-172 (221)
 60 PRK11234 nfrB bacteriophage N4  45.7 5.4E+02   0.012   31.4  15.8  193  414-622    62-279 (727)
 61 PRK11498 bcsA cellulose syntha  42.7 1.8E+02  0.0039   36.1  11.2  125  488-622   323-462 (852)
 62 TIGR01556 rhamnosyltran L-rham  42.6 1.7E+02  0.0038   30.1   9.9  111  497-611    66-186 (281)
 63 cd02514 GT13_GLCNAC-TI GT13_GL  35.8 2.2E+02  0.0049   31.3   9.7   80  496-585    88-174 (334)
 64 cd04188 DPG_synthase DPG_synth  31.5 3.8E+02  0.0081   26.1   9.8   88  448-541    30-120 (211)
 65 PRK05454 glucosyltransferase M  25.6 5.2E+02   0.011   31.4  11.2  198  413-623   122-350 (691)
 66 PF13704 Glyco_tranf_2_4:  Glyc  23.4 3.8E+02  0.0081   22.9   7.3   49  474-522    40-88  (97)
 67 COG3306 Glycosyltransferase in  22.4 2.3E+02   0.005   30.0   6.7   37  419-460     5-41  (255)
 68 PLN03181 glycosyltransferase;   22.4 4.6E+02    0.01   30.0   9.2   88  432-519   109-212 (453)
 69 PF05679 CHGN:  Chondroitin N-a  20.1 1.3E+02  0.0028   34.9   4.6   58  596-655    10-82  (499)
 70 PF06439 DUF1080:  Domain of Un  20.1 2.5E+02  0.0054   26.9   6.0   39  327-365   120-158 (185)

No 1  
>PLN03133 beta-1,3-galactosyltransferase; Provisional
Probab=100.00  E-value=8.4e-158  Score=1322.85  Aligned_cols=611  Identities=50%  Similarity=0.950  Sum_probs=573.7

Q ss_pred             ccccchhHHHHHHHHHHHHHhhcccccccccccchhhhhccccccCccccCC--------CCCCCcccCCccchhhhhhc
Q 006036           13 MRNWSGGLLIMALAIILVMSYSFMGTQTQTQHRTQTQKQKHKQSANDFFRNH--------PSNDSDMKGSQGVKEVKKTQ   84 (663)
Q Consensus        13 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~--------~~~~~~~~~~~~~~~~~~~~   84 (663)
                      ||||+||+||++|||+|+|||. ++++|.+.++++          ..|+.|+        ++.++++++|      +   
T Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~----------~~~~~~~~~~~~~~~~~~~~~~~~~------~---   60 (636)
T PLN03133          1 MKKWYGGVLVVSLFMLLVLRYV-LLKNPIGESYLQ----------SVFPSNTTNPLEWLDPTNPPAVQNP------E---   60 (636)
T ss_pred             CceeeeeehHHHHHHHHHHHHH-HhcCCCCCCCcc----------cccccccCCchhhcccCCCccccCC------C---
Confidence            9999999999999999999998 999999988773          4666665        4556666665      5   


Q ss_pred             cccCCCeeeecC-CCcccccCCCCCCCCCcccccchhhhhhhhccccchhhHHHHHHHHHHHHHHHhhhHHhhhccC---
Q 006036           85 KLFEKPHIINVQ-GLGDLYSLKNMLGEDSRPLLVWGHMRLLLSRSDALPETAQGVKEAAIAWKDLLSVIEEEKASKF---  160 (663)
Q Consensus        85 ~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~w~~~~~~~~~~~~~~~~~~~~~~~~~~w~~~~~~~~~~~~~~~---  160 (663)
                         |++++++.+ ++|+||+++|+|+|++++|++|++||+|++|||+||+|++||+||+.||++|++++++++++..   
T Consensus        61 ---~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~w~~~~~~~~~~~~~~~~~~~~~~~~~aw~~~~~~~~~~~~~~~~~~  137 (636)
T PLN03133         61 ---NSSQVISTDTIVSSLFATRNISNEEQQSLLTWNHLKHLVDHAQVLPNGVEAIKEAGVAWESLMASVEEEKLGYTNES  137 (636)
T ss_pred             ---ccceeeccccchhhccccccCchhhhhhhhHHHHHHHHHhccccCchHHHHHHHHHHHHHHHHHHHHHHhhcccccc
Confidence               778888888 9999999999999999999999999999999999999999999999999999999996555322   


Q ss_pred             ----CCCCCCCcceecccccccCCc-eEEeeCCCCCCCcEEEEEEEeCCCCCceEEEcccCCCCCCCCCCeeEEEeeeCC
Q 006036          161 ----SRRKNCPPFVSNLSKSLSSGR-LIIEVPCGLVEDSSITLVGIPDGRYGSFQIELIGSQLSGESNPPIILHYNVSLP  235 (663)
Q Consensus       161 ----~~~~~cp~~v~~~~~~~~~~~-~~~~lpcGL~~Gs~itv~G~p~~~~~~F~i~L~~~~~~~~~~~~i~LH~NpR~~  235 (663)
                          .++++||+||+.+++++++++ |++.|||||.+|++|||+|+|+++++||+|||+|+..+|++++||||||||||+
T Consensus       138 ~~~~~~~~~cp~~~~~~~~~~~~~~~~~~~iP~GL~~Gs~ItI~G~p~~~~~~F~InL~g~~~~g~~~~~iaLHfNpRf~  217 (636)
T PLN03133        138 SLRKSKEKQCPYFLNKMNATELGDSGYKLKIPCGLTQGSSITIIGIPDGLLGNFRIDLTGEPLPGEPDPPIILHYNVRLL  217 (636)
T ss_pred             ccccCCCCCCchhhhhcccccccCCceEEecCCcCCCCCEEEEEEEeCCCCCeEEEEEeecCcCCCCCCCEEEEEcCccC
Confidence                256899999999999987655 999999999999999999999999999999999998888888999999999999


Q ss_pred             CCCCCCCCeEEEcCccCCCCCccceecCCCCCCCcccchhhhhhhhhhhccccccccCCCCCCCCCccccCCCCCCcchh
Q 006036          236 GDNMTEEPFIIQNSWTNELGWGKEERCPAHGSSNTLKVDELVLCNEQVLRRSVEENQNTSHPTPSSDMLANAPTPSSDML  315 (663)
Q Consensus       236 gd~~~~~pvIv~Ns~~~~~~WG~eeR~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  315 (663)
                      |||+|++|+||||||+.+|+||.||||++|+|.++++||||++||||+|+|++++++++++                 ||
T Consensus       218 gd~~t~~~vIV~NT~~~~~~WG~EERc~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~-----------------~~  280 (636)
T PLN03133        218 GDKITEDPVIVQNTWTAAHDWGEEERCPSPDPDKNKKVDDLDQCNKMVGRDDKRVLSTSLH-----------------SN  280 (636)
T ss_pred             CCccccCCEEEeCCCcCCCcccHhhhcCCCCccccccccchhhhhhhhccccccccccccc-----------------cc
Confidence            9999999999999999338999999999999999999999999999999999999999877                 88


Q ss_pred             ccc----ccccCCCCcCCCCCCCCcEEEEEEEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeecccCCCC
Q 006036          316 ANA----SRVGAHETSNFPFVDGNPFTTTIWVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAFAEGLP  391 (663)
Q Consensus       316 ~~~----~~~~~~~~~~fPF~~G~~F~l~i~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~a~~lP  391 (663)
                      +||    ++++++.+++|||++|++|++||+||.|||||+|||+|+|+|+||++++||.|++|+|+|||+|+||.|.++|
T Consensus       281 ~~~~~~~~~~~~~~~~~fPF~~G~~F~lti~~g~egf~v~VnG~H~tsF~yR~~lep~~V~~l~V~GDv~l~SV~a~~~p  360 (636)
T PLN03133        281 GSRRSPMSQEATKARRYFPFKQGYLSVATLRVGTEGIQMTVDGKHITSFAYRETLEPWLVSEVRISGDLKLISVLASGLP  360 (636)
T ss_pred             ccccccccccccccccCCCCCCCCcEEEEEEecCCEEEEEECCeEEEeeeCCCCCCccceeEEEEeCcEEEEEEEeeCCC
Confidence            887    7888999999999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             CCCCcccccchhhhcCCCCC-CCCeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHH
Q 006036          392 VSEDFDFIVDVEHLKAPLIS-RKRLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKE  470 (663)
Q Consensus       392 ~~~~~~~~~~~~~l~~p~~~-~~~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~E  470 (663)
                      ++|+++++++++.|++|+++ +++++|||+|+|+++|++||+|||+|||+....++..++++|++|.+.++.++..|++|
T Consensus       361 ~~~~~~~~~d~e~lkAppL~~~~~~~LlI~V~Sap~nf~rR~AIR~TWg~~~~~~~~~v~~rFvVG~s~n~~l~~~L~~E  440 (636)
T PLN03133        361 TSEDSEHVIDLEALKSPPLSPKKPLDLFIGVFSTANNFKRRMAVRRTWMQYDAVRSGAVAVRFFVGLHKNQMVNEELWNE  440 (636)
T ss_pred             CCCchhcccchHHhcCCCCCCCCceEEEEEEeCCcccHHHHHHHHHhhccccccCCCceEEEEEEecCCcHHHHHHHHHH
Confidence            99999999999999999988 56899999999999999999999999999876667789999999999999999999999


Q ss_pred             HhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccC
Q 006036          471 AQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRD  549 (663)
Q Consensus       471 a~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd  549 (663)
                      +++|||||++||.|+|+|+|+||+++++|+.+|++++|+||+|||+|||+++|+++|+. ...+.+|+|++..+..|+|+
T Consensus       441 a~~ygDIIq~dF~DsY~NLTlKtl~~~~wa~~c~~akFilK~DDDvFVnv~~Ll~~L~~~~~~~~Ly~G~v~~~~~PiRd  520 (636)
T PLN03133        441 ARTYGDIQLMPFVDYYSLITWKTLAICIFGTEVVSAKYVMKTDDDAFVRVDEVLASLKRTNVSHGLLYGLINSDSQPHRN  520 (636)
T ss_pred             HHHcCCeEEEeeechhhhhHHHHHHHHHHHHhCCCceEEEEcCCceEEcHHHHHHHHHhcCCCCceEEEEeccCCCcccC
Confidence            99999999999999999999999999999999999999999999999999999999987 66778999999999999999


Q ss_pred             CCCCcccCCCCCCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccCCccccC
Q 006036          550 KDSKWYISNEEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDDRFYNA  629 (663)
Q Consensus       550 ~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf~~~  629 (663)
                      +.+|||||+++||++.|||||+|+|||||+|+|++|+.+++...+++|++||||||+|++++++.|+++.|.++.+++..
T Consensus       521 ~~sKWYVs~~eyp~~~YPpYasG~gYVlS~Dla~~L~~~s~s~~l~~f~lEDVyvGi~l~~l~k~gl~v~~~~~~r~~~~  600 (636)
T PLN03133        521 PDSKWYISPEEWPEETYPPWAHGPGYVVSRDIAKEVYKRHKEGRLKMFKLEDVAMGIWIAEMKKEGLEVKYENDGRIYNE  600 (636)
T ss_pred             CCCCCCCCHHHCCCCCCCCCCCcCEEEEcHHHHHHHHHhhhhcccCcCChhhHhHHHHHHHhcccCCCceeeCCCcccCC
Confidence            99999999999999999999999999999999999999765568999999999999999999999999999999999999


Q ss_pred             CcccceEEEEecCHHHHHHHHHHhhcCCcCCCCC
Q 006036          630 GCESDYILAHYQGPRMVLCLWEKLQKDHRAFCCE  663 (663)
Q Consensus       630 ~C~~~~I~~Hy~sP~~M~~lW~~l~~~~~~~Cc~  663 (663)
                      +|..++|++|+++|++|.++|++++++++++||+
T Consensus       601 ~C~~~~i~~H~~sP~eM~~lW~~l~~~~~~~Cc~  634 (636)
T PLN03133        601 GCKDGYVVAHYQSPREMLCLWQKLQEGKRATCCG  634 (636)
T ss_pred             cCCCCeEEEecCCHHHHHHHHHHHhccCCCCccC
Confidence            9999999999999999999999999999999997


No 2  
>KOG2287 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=100.00  E-value=1.3e-59  Score=504.54  Aligned_cols=332  Identities=33%  Similarity=0.530  Sum_probs=292.8

Q ss_pred             cCCCCCCCCcEEEEEEEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeecccCCCCCCCCcccccchhhhc
Q 006036          327 SNFPFVDGNPFTTTIWVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAFAEGLPVSEDFDFIVDVEHLK  406 (663)
Q Consensus       327 ~~fPF~~G~~F~l~i~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~a~~lP~~~~~~~~~~~~~l~  406 (663)
                      +.+|+..+..|+.++.++.+++++.+++++.++|.++...+.+..++...++.+..++......+++...-. .....+.
T Consensus         6 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~l~   84 (349)
T KOG2287|consen    6 FLFPLLPGKRFVSTLRLVLEGLQISEPLRLLTSFLLLPTIKNCLATGWAFSTPLLLTGDFGSSFPLSFADFQ-KFFYLLY   84 (349)
T ss_pred             ccccccccchhhhhhhhhheeeeeccccccCCcccccCCCcccccccccccCCccccCcccccccccchhhc-cChhhhc
Confidence            578999999999999999999999999999999999998788899999999999888888777777654211 1234445


Q ss_pred             CCCCCCC--CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCCh-hhhHHHHHHHhhcCCEEEEeec
Q 006036          407 APLISRK--RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNR-QVNFELWKEAQAYGDIQIMPFV  483 (663)
Q Consensus       407 ~p~~~~~--~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~-~~~~~L~~Ea~~ygDII~ldf~  483 (663)
                      .|+.+..  .++|+|+|.|+++|++||++||+|||+...+++++|+++|++|.+.++ .++..|.+|++.|||||++||.
T Consensus        85 ~p~~~~~~~~~~lLl~V~S~~~~farR~aiR~TW~~~~~v~~~~v~~~FLvG~~~~~~~~~~~l~~Ea~~ygDIi~~df~  164 (349)
T KOG2287|consen   85 LPEICDPDRPPELLLLVKSAPDNFARRNAIRKTWGNENNVRGGRVRVLFLVGLPSNEDKLNKLLADEARLYGDIIQVDFE  164 (349)
T ss_pred             CChhhcCCCCceEEEEEecCCCCHHHHHHHHHHhcCccccCCCcEEEEEEecCCCcHHHHHHHHHHHHHHhCCEEEEecc
Confidence            5655522  489999999999999999999999999998889999999999999875 5688999999999999999999


Q ss_pred             ccCCcchHHHHHHHHhhh-ccCCCcEEEEeCCceeeeHHHHHHHhhcC--CCCCeeEEeeeCCCCCccCCCCCcccCCCC
Q 006036          484 DYYSLISLKTIAICIFGT-KILPAKYIMKTDDDAFVRIDEVLSNLKEK--PSNGLLFGLMSYDSSPQRDKDSKWYISNEE  560 (663)
Q Consensus       484 DsY~nLtlKtla~l~w~~-~~~~akyvlKvDDDtfVnvd~Ll~~L~~~--~~~~ly~G~v~~~~~P~Rd~~~KwyVs~ee  560 (663)
                      |+|.|+|+||++++.|+. +|++|+||||+|||+||++++|+.+|.+.  +...+|+|++..+..|+|++.+|||||+++
T Consensus       165 Dty~nltlKtl~~l~w~~~~cp~akfi~K~DDDvfv~~~~L~~~L~~~~~~~~~~~~G~v~~~~~p~R~~~~KwyVp~~~  244 (349)
T KOG2287|consen  165 DTYFNLTLKTLAILLWGVSKCPDAKFILKIDDDVFVNPDNLLEYLDKLNDPSSDLYYGRVIQNAPPIRDKTSKWYVPESE  244 (349)
T ss_pred             cchhchHHHHHHHHHHHHhcCCcceEEEeccCceEEcHHHHHHHHhccCCCCcceEEEeecccCCCCCCCCCCCccCHHH
Confidence            999999999999999985 59999999999999999999999999984  788999999999999999999999999999


Q ss_pred             CCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccC----CccccCCcccceE
Q 006036          561 WPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSD----DRFYNAGCESDYI  636 (663)
Q Consensus       561 yp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~----~rf~~~~C~~~~I  636 (663)
                      ||++.|||||+|+|||+|+|+|++|+++  +.+.+++++|||+||+|+++..  |+.+...+.    ...++.+|..+++
T Consensus       245 y~~~~YP~Y~sG~gYvis~~~a~~l~~~--s~~~~~~~iEDV~~g~~l~~~~--gi~~~~~~~~~~~~~~~~~~~~~~~~  320 (349)
T KOG2287|consen  245 YPCSVYPPYASGPGYVISGDAARRLLKA--SKHLKFFPIEDVFVGGCLAEDL--GIKPVNHPGFFEIPLSFDPCCYRDLL  320 (349)
T ss_pred             CCCCCCCCcCCCceeEecHHHHHHHHHH--hcCCCccchHHHHHHHHHHHhc--CCCcccCcccccccccCCCCcccceE
Confidence            9999999999999999999999999997  5789999999999999999974  444432222    1223566778999


Q ss_pred             EEEecCHHHHHHHHHHhhcCCcCCCCC
Q 006036          637 LAHYQGPRMVLCLWEKLQKDHRAFCCE  663 (663)
Q Consensus       637 ~~Hy~sP~~M~~lW~~l~~~~~~~Cc~  663 (663)
                      ++|+++|.+|.++|+.++...+..||+
T Consensus       321 ~~H~~~p~e~~~~w~~~~~~~~~~c~~  347 (349)
T KOG2287|consen  321 AVHRLSPNEMIYLWKKLKDLANLKCKN  347 (349)
T ss_pred             EEecCCHHHHHHHHHHhhccccccccc
Confidence            999999999999999999866678875


No 3  
>PLN03193 beta-1,3-galactosyltransferase; Provisional
Probab=100.00  E-value=1.1e-49  Score=427.60  Aligned_cols=245  Identities=25%  Similarity=0.398  Sum_probs=213.8

Q ss_pred             cCCCCceEEEEEECCeeeeecccCCCCCCCCcccccchhhhcCCCCCCCCeEEEEEEecCCCcHHHHHHHHHHhcCCCCC
Q 006036          365 KLEPWSVTGVKVAGGVDLFSAFAEGLPVSEDFDFIVDVEHLKAPLISRKRLVMLIGVFSTGNNFERRMALRRSWMQYPAV  444 (663)
Q Consensus       365 ~l~~~~v~~l~i~Gdv~l~sV~a~~lP~~~~~~~~~~~~~l~~p~~~~~~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v  444 (663)
                      .||+|.+++.+      +.++.++++|++++++.      +  |...+++++|+|+|+|+++|++||++||+|||+....
T Consensus       103 ~le~el~~~~~------~~~~~~~~~~~~~~~~~------~--~~~~~~~~~LvIgI~Sap~~~~RR~AIR~TWg~~~~~  168 (408)
T PLN03193        103 NLEMELAAARA------AQESILNGSPISEDLKK------T--QSSGKRRYLMVVGINTAFSSRKRRDSVRATWMPQGEK  168 (408)
T ss_pred             HHhHHHHHHHh------hhhhhccCCCccccccc------c--CCCCcceEEEEEEEeCCCCCHHHHHHHHHHHcCCccc
Confidence            57777887776      67888899999988753      1  4334678999999999999999999999999986432


Q ss_pred             -----CCCCeEEEEEEeccC--ChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCcee
Q 006036          445 -----RSGDLAVRFFIGLHK--NRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAF  517 (663)
Q Consensus       445 -----~~~~V~v~FvvG~~~--~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtf  517 (663)
                           ....++++||+|.+.  +..++..|++|+++|||||++||.|+|.|||+||++++.|+..+++++|+||+|||+|
T Consensus       169 ~~kle~~~gv~vrFVIG~s~~~~~~ldr~Le~Ea~~ygDIL~lDfvDsY~NLT~KTl~~f~wA~~~~dAkF~mK~DDDvf  248 (408)
T PLN03193        169 RKKLEEEKGIIIRFVIGHSATSGGILDRAIEAEDRKHGDFLRLDHVEGYLELSAKTKTYFATAVAMWDADFYVKVDDDVH  248 (408)
T ss_pred             ccccccCCcEEEEEEeecCCCcchHHHHHHHHHHHHhCCEEEEecccccccchHHHHHHHHHHHHcCCCeEEEEcCCCce
Confidence                 135799999999987  5689999999999999999999999999999999999999999999999999999999


Q ss_pred             eeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCC----CCCCCCCCcCCCccccCHHHHHHHHhhhccc
Q 006036          518 VRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEW----PHSSYPPWAHGPGYIISRDIAKFIVQGHQER  592 (663)
Q Consensus       518 Vnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eey----p~~~YPpYc~G~GYVLSrdla~~I~~~~~~~  592 (663)
                      ||+++|+.+|.. ....++|+|++..  .|+|++.++||+++++|    +.+.|||||.|+|||||+|+|+.|+.+  ..
T Consensus       249 Vnv~~L~~~L~~~~~~~rlYiG~m~~--gPvr~~~~~ky~epe~w~~~~~~~~YPpyAsG~gYVlS~DLa~~I~~n--~~  324 (408)
T PLN03193        249 VNIATLGETLVRHRKKPRVYIGCMKS--GPVLSQKGVRYHEPEYWKFGENGNKYFRHATGQLYAISKDLASYISIN--QH  324 (408)
T ss_pred             EcHHHHHHHHHhcCCCCCEEEEeccc--CccccCCCCcCcCcccccccCccccCCCCCCcceEEehHHHHHHHHhC--hh
Confidence            999999999987 4445699999975  48898888888888888    568999999999999999999999976  45


Q ss_pred             ccCCCCcchhHHHHHHHHhhcCCCeeeeccCCcccc---CCcc
Q 006036          593 DLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDDRFYN---AGCE  632 (663)
Q Consensus       593 ~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf~~---~~C~  632 (663)
                      .++.|++|||+||+|+.     |++|+|+|+.+||.   ..|.
T Consensus       325 ~L~~y~~EDV~vG~Wl~-----~L~V~~vdd~~fcc~~~~~C~  362 (408)
T PLN03193        325 VLHKYANEDVSLGSWFI-----GLDVEHIDDRRLCCGTPPDCE  362 (408)
T ss_pred             hhcccCcchhhhhhHhc-----cCCceeeecccccCCCCcccc
Confidence            78899999999999996     45799999999985   4575


No 4  
>PF01762 Galactosyl_T:  Galactosyltransferase;  InterPro: IPR002659 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. Glycosyltransferase family 31 (GH31 from CAZY) comprises enzymes with a number of known activities; N-acetyllactosaminide beta-1,3-N-acetylglucosaminyltransferase (2.4.1.149 from EC); beta-1,3-galactosyltransferase (2.4.1 from EC); fucose-specific beta-1,3-N-acetylglucosaminyltransferase (2.4.1 from EC); globotriosylceramide beta-1,3-GalNAc transferase (2.4.1.79 from EC) [, ].; GO: 0008378 galactosyltransferase activity, 0006486 protein glycosylation, 0016020 membrane
Probab=100.00  E-value=4.5e-44  Score=353.71  Aligned_cols=184  Identities=38%  Similarity=0.633  Sum_probs=171.2

Q ss_pred             HHHHHHHHHhcCCCCCCCCCeEEEEEEeccC--ChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhh-ccCC
Q 006036          429 ERRMALRRSWMQYPAVRSGDLAVRFFIGLHK--NRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGT-KILP  505 (663)
Q Consensus       429 ~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~--~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~-~~~~  505 (663)
                      +||++||+||++........++++||+|.+.  +..++..|.+|+++|+|||++||.|+|.|+|+||+++++|+. +|++
T Consensus         1 ~rR~~IR~TW~~~~~~~~~~~~~~FvvG~~~~~~~~~~~~l~~E~~~y~Dil~~d~~D~y~nlt~K~~~~~~w~~~~c~~   80 (195)
T PF01762_consen    1 ERRQAIRETWGNQRNFKGVRVKVVFVVGESPNSDSDLQEALQEEAEKYGDILQGDFVDSYRNLTLKTLAGLKWASKHCPN   80 (195)
T ss_pred             ChHHHHHHHHhcccccCCCcEEEEEEEecCCCCcHHHHHHhhhhhhhcCceEeeecccccchhhHHHHHHHHHHHhhCCc
Confidence            5899999999998877778999999999998  677888899999999999999999999999999999999984 5777


Q ss_pred             CcEEEEeCCceeeeHHHHHHHhhcC---CCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCccccCHHHH
Q 006036          506 AKYIMKTDDDAFVRIDEVLSNLKEK---PSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYIISRDIA  582 (663)
Q Consensus       506 akyvlKvDDDtfVnvd~Ll~~L~~~---~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrdla  582 (663)
                      ++|++|+|||+|||+++|.++|...   ..+..++|.+....+|+|++.+|||+|+++||.+.|||||+|+||+||+++|
T Consensus        81 ~~~v~k~DDD~~vn~~~l~~~L~~~~~~~~~~~~~g~~~~~~~~~r~~~~kw~v~~~~y~~~~yP~y~~G~~yvls~~~v  160 (195)
T PF01762_consen   81 AKYVLKVDDDVFVNPDRLVSFLKSLKQDPSKNSIYGGCIKNGPPIRDPSSKWYVSEEEYPDDYYPPYCSGGGYVLSSDVV  160 (195)
T ss_pred             hhheeecCcEEEEehHHhhhhhhhcccCccccccccccccCCccccccccCceeeeeecccccCCCcCCCCeEEecHHHH
Confidence            9999999999999999999999884   6678999999988999999999999999999999999999999999999999


Q ss_pred             HHHHhhhcccccCCCCcchhHHHHHHHHhhcC
Q 006036          583 KFIVQGHQERDLKLFKLEDVAMGIWIEQFKNT  614 (663)
Q Consensus       583 ~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~  614 (663)
                      +.|+.++  ..++.+++|||++|+|+.++++.
T Consensus       161 ~~i~~~~--~~~~~~~~eDv~iGi~~~~~~i~  190 (195)
T PF01762_consen  161 KRIYKAS--SHTPFFPLEDVFIGILAEKLGIK  190 (195)
T ss_pred             HHHHHHh--hcCCCCCchHHHHHHHHHHCCCC
Confidence            9999984  57799999999999999998643


No 5  
>PTZ00210 UDP-GlcNAc-dependent glycosyltransferase; Provisional
Probab=100.00  E-value=1.1e-36  Score=323.28  Aligned_cols=229  Identities=24%  Similarity=0.331  Sum_probs=193.9

Q ss_pred             CCCeEEEEEEecCCCc--HHHHHHHHHHhcCCCCCC------CCCeEEEEEEeccCCh--hhhHHHHHHHhhcCCEEEEe
Q 006036          412 RKRLVMLIGVFSTGNN--FERRMALRRSWMQYPAVR------SGDLAVRFFIGLHKNR--QVNFELWKEAQAYGDIQIMP  481 (663)
Q Consensus       412 ~~~v~LlI~V~Sa~~n--~~rR~aIR~TW~~~~~v~------~~~V~v~FvvG~~~~~--~~~~~L~~Ea~~ygDII~ld  481 (663)
                      .++..++++|+|..++  +.||+++|+||+++..+.      .+.+.++||+|.+++.  +++++|++|+++|+|||++|
T Consensus        77 ~~~~lv~~Gi~S~d~~~r~~rR~lqr~t~w~y~~va~~~n~ftg~~lv~y~l~~H~~~~~~~~~~L~eEA~~~~DIVilp  156 (382)
T PTZ00210         77 AQRFLAVLGIPSVDNSERSRRRDLQRQTCWKYSGVATRSNNFSGSLLPLYLLAPHQSNSYLISHSLKEEAARTHDIITLP  156 (382)
T ss_pred             cCCceEEEeccCCCchHHHHHHHHHHhhhhcchhhhhhccCCchhhhhhhhhccCCccchhhhHHHHHHHHHhCCEEEEe
Confidence            5689999999999998  999999999999998876      7889999999999987  89999999999999999999


Q ss_pred             e------------------cccCCcchHHHHHHHHhhhc-cCCCcEEEEeCCceeeeHHHHHHHhhcCCCCCeeEEeeeC
Q 006036          482 F------------------VDYYSLISLKTIAICIFGTK-ILPAKYIMKTDDDAFVRIDEVLSNLKEKPSNGLLFGLMSY  542 (663)
Q Consensus       482 f------------------~DsY~nLtlKtla~l~w~~~-~~~akyvlKvDDDtfVnvd~Ll~~L~~~~~~~ly~G~v~~  542 (663)
                      |                  .|+|.++|+||++++.|+.+ |++++||||+|||+|||+++++++|+..+++++|+|++..
T Consensus       157 f~d~~~tTnKkiG~~g~WG~e~e~~mT~KT~l~~~wA~~~cP~a~YImKgDDDvFVrVp~lL~~Lr~~prr~LY~G~v~~  236 (382)
T PTZ00210        157 TNDVSPSTRKKIGENGNWGIEAEVAMSRKTYLWLRFALHMFPNVSYIVKGDDDIFIRVPKYLADLRVMPRHGLYMGRYNY  236 (382)
T ss_pred             cccCccccccccccCCcccchhhcchhHHHHHHHHHHHHhCCCCCeEEEcCCCeEeeHHHHHHHHhhCCCCceEEEeeCC
Confidence            9                  56667899999999999954 7899999999999999999999999887888899999998


Q ss_pred             CCCCccCCCCCcccCCCCCCCCCCCCCcCCCccccCHHHHHHHHhhhccccc---------------CCCCcchhHHHHH
Q 006036          543 DSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDL---------------KLFKLEDVAMGIW  607 (663)
Q Consensus       543 ~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l---------------~~f~lEDV~iGi~  607 (663)
                      ...|.|++               +||||+|+||+||+|+|+.|++.....++               -.+..||+++|.+
T Consensus       237 ~~~p~Rd~---------------~PpY~~G~gYvLSrDVA~~Lvs~~pl~rL~~~pys~~~~~~y~~~~~~~EDiMvG~v  301 (382)
T PTZ00210        237 YNRIWRRN---------------QLTYVNGYCITLSRDTAQAIISYKPLERLVNMPFSMWDYFDFLDLGMFYEDVMVGMI  301 (382)
T ss_pred             CCccccCC---------------CCCccccceeeccHHHHHHHHhhChHhHhhcCCCchHHHHHHHHhhcCchHHHHHHH
Confidence            87788863               49999999999999999999997322222               2357899999999


Q ss_pred             HHH-hhcCCCeeeecc--CCcccc---CCcc----cceEEEEecCHHHHHHHHHHhhcCC
Q 006036          608 IEQ-FKNTGQEVHYMS--DDRFYN---AGCE----SDYILAHYQGPRMVLCLWEKLQKDH  657 (663)
Q Consensus       608 L~~-l~~~gi~v~~~~--~~rf~~---~~C~----~~~I~~Hy~sP~~M~~lW~~l~~~~  657 (663)
                      |+. ++..+  ..++.  ..+|++   ..|.    .+.|++|...+++...+...+++..
T Consensus       302 Lr~~~k~~~--l~~V~~~~c~Fhd~~~~~~~~~v~~~sVvvHhike~dYa~Lm~~F~n~~  359 (382)
T PTZ00210        302 LREKVVYRN--LISVEMGRCHFHNAGKFGVRKSVRNMSVVIHHIQEADYEMLMDYFPEGV  359 (382)
T ss_pred             HHHhcCcCc--eeeeccccccceecCCCCCccccccceEEEEecCHHHHHHHHHHhcCCC
Confidence            954 44333  32333  345543   3443    5789999999999999999998753


No 6  
>KOG2288 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=100.00  E-value=3.3e-35  Score=296.01  Aligned_cols=241  Identities=25%  Similarity=0.447  Sum_probs=206.0

Q ss_pred             CCCeEEEEEEecCCCcHHHHHHHHHHhcCCCC-----CCCCCeEEEEEEec-cCChhhhHHHHHHHhhcCCEEEEe-ecc
Q 006036          412 RKRLVMLIGVFSTGNNFERRMALRRSWMQYPA-----VRSGDLAVRFFIGL-HKNRQVNFELWKEAQAYGDIQIMP-FVD  484 (663)
Q Consensus       412 ~~~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~-----v~~~~V~v~FvvG~-~~~~~~~~~L~~Ea~~ygDII~ld-f~D  484 (663)
                      .++++++|+|.|+++..+||+++|+|||....     -....|.++|++|. +.+.+...+|++|.++|+|.+.+| ..|
T Consensus         8 ~~k~l~vigI~T~f~s~~RR~~vR~TWmp~~~~l~rle~e~gv~~RFvIG~~~~g~~~~r~ie~E~~~~~DfllLd~h~E   87 (274)
T KOG2288|consen    8 RRKVLLVIGINTAFSSRKRRDSVRQTWMPSGEGLKRLEEEKGVIIRFVIGTATLGASLDRALEEENAQHGDFLLLDRHEE   87 (274)
T ss_pred             ccceEEEEEeecccchhhhHHHHHHhhcCCccchhhhccccceEEEEEeccCCccHHHHHHHHHHHHhcCCeEeechhHH
Confidence            56899999999999999999999999999722     23678999999999 667889999999999999999999 999


Q ss_pred             cCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCC-
Q 006036          485 YYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWP-  562 (663)
Q Consensus       485 sY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp-  562 (663)
                      .|.+|+.||++++.++....+++|++|+|||+|||++.|...|.. .....+|+|++..+ +++-.+++|||-|+  |. 
T Consensus        88 ~Y~~Ls~Kt~~~f~~A~~~~daeFyvKvDDDv~v~l~~L~~~la~~r~~pr~YiGcmksg-~v~~~~~~kw~Epe--Wkf  164 (274)
T KOG2288|consen   88 AYEELSAKTKAFFSAAVAHWDAEFYVKVDDDVYVRLARLGTLLARERSHPRLYIGCMKSG-PVLTQPGGKWYEPE--WKF  164 (274)
T ss_pred             HHHHHHHHHHHHHHHHHHhccceEEEEccccceecHHHHHHHHHhhccCCceEEEEecCC-ccccCCCCcccChh--hhc
Confidence            999999999999999999999999999999999999999999998 44477999998865 45556789999887  43 


Q ss_pred             CCC--CCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccCCccccCCcc--cceEEE
Q 006036          563 HSS--YPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDDRFYNAGCE--SDYILA  638 (663)
Q Consensus       563 ~~~--YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf~~~~C~--~~~I~~  638 (663)
                      .+.  |.+|+.|++|+||+|+|..|..+  ...+..+..|||.+|-|+.     |++|+|+|+.|+|...|.  .+.+.+
T Consensus       165 g~~g~YfrhA~G~~YvlS~dLa~yi~in--~~lL~~y~nEDVSlGaW~~-----gldV~h~dd~rlC~~~~~~~~~~~~~  237 (274)
T KOG2288|consen  165 GDNGNYFRHATGGGYVLSKDLATYISIN--RQLLHKYANEDVSLGAWMI-----GLDVEHVDDPRLCCSTPKALAGMVCA  237 (274)
T ss_pred             CcccccchhccCceEEeeHHHHHHHHHh--HHHHHhhccCCcccceeee-----eeeeeEecCCcccccchhhhccceee
Confidence            333  99999999999999999999987  4568889999999999987     567999999999977772  344443


Q ss_pred             Ee---------cCHHHHHHHHHHhhcCCcCCCC
Q 006036          639 HY---------QGPRMVLCLWEKLQKDHRAFCC  662 (663)
Q Consensus       639 Hy---------~sP~~M~~lW~~l~~~~~~~Cc  662 (663)
                      +.         .+..+|..+++.=-.+..+.||
T Consensus       238 ~~~~~kcsglC~~~~rm~~~h~~~~~~~~~~~~  270 (274)
T KOG2288|consen  238 ASFDWKCSGLCKSEDRMLEVHKYDWEGKPATCC  270 (274)
T ss_pred             eeecccccccCchHHHHhHHHHhhccCCCcccC
Confidence            32         3456788888776666778888


No 7  
>smart00276 GLECT Galectin. Galectin - galactose-binding lectin
Probab=99.97  E-value=1.8e-30  Score=241.79  Aligned_cols=127  Identities=36%  Similarity=0.519  Sum_probs=117.6

Q ss_pred             eEEeeCCCCCCCcEEEEEEEeCCCCCceEEEcccCCCCCCCCCCeeEEEeeeCCCCCCCCCCeEEEcCccCCCCCcccee
Q 006036          182 LIIEVPCGLVEDSSITLVGIPDGRYGSFQIELIGSQLSGESNPPIILHYNVSLPGDNMTEEPFIIQNSWTNELGWGKEER  261 (663)
Q Consensus       182 ~~~~lpcGL~~Gs~itv~G~p~~~~~~F~i~L~~~~~~~~~~~~i~LH~NpR~~gd~~~~~pvIv~Ns~~~~~~WG~eeR  261 (663)
                      |+..||+||.+|+.|+|.|+|..++++|.|||+.+      +++|+|||||||.+      .+||+||+.+ |.||.|||
T Consensus         1 ~~~~lp~~l~~G~~i~i~G~~~~~~~~F~inl~~~------~~di~lH~n~rf~~------~~iV~Ns~~~-g~Wg~Eer   67 (128)
T smart00276        1 FTLPIPGGLKPGQTLTVRGIVLPDAKRFSINLLTG------GDDIALHFNPRFNE------NKIVCNSKLN-GSWGSEER   67 (128)
T ss_pred             CcccCCCCCCCCCEEEEEEEECCCCCEEEEEeecC------CCCEEEEEeccCCC------CEEEEeCccC-CccchheE
Confidence            45789999999999999999999999999999983      35999999999984      3799999997 89999999


Q ss_pred             cCCCCCCCcccchhhhhhhhhhhccccccccCCCCCCCCCccccCCCCCCcchhcccccccCCCCcCCCCCCCCcEEEEE
Q 006036          262 CPAHGSSNTLKVDELVLCNEQVLRRSVEENQNTSHPTPSSDMLANAPTPSSDMLANASRVGAHETSNFPFVDGNPFTTTI  341 (663)
Q Consensus       262 ~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~l~i  341 (663)
                      +                                                                ..|||++|++|+|+|
T Consensus        68 ~----------------------------------------------------------------~~~Pf~~g~~F~l~i   83 (128)
T smart00276       68 E----------------------------------------------------------------GGFPFQPGQPFDLTI   83 (128)
T ss_pred             c----------------------------------------------------------------CCCCCCCCCEEEEEE
Confidence            8                                                                368999999999999


Q ss_pred             EEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeeccc
Q 006036          342 WVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAFA  387 (663)
Q Consensus       342 ~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~a  387 (663)
                      .++.++|+|+|||+|+++|+||.+++  .|+.|.|.||+.|++|.+
T Consensus        84 ~~~~~~f~i~vng~~~~~f~~R~~~~--~i~~l~v~Gdv~l~~v~~  127 (128)
T smart00276       84 IVQPDHFQIFVNGVHITTFPHRLPLE--SIDYLSINGDVQLTSVSF  127 (128)
T ss_pred             EEcCCEEEEEECCEeEEEecCCCCcc--cEeEEEEeCCEEEEEEEE
Confidence            99999999999999999999998765  999999999999999975


No 8  
>cd00070 GLECT Galectin/galactose-binding lectin. This domain exclusively binds beta-galactosides, such as lactose, and does not require metal ions for activity. GLECT domains occur as homodimers or tandemly repeated domains. They are developmentally regulated and may be involved in differentiation, cell-cell interaction and cellular regulation.
Probab=99.96  E-value=2.8e-29  Score=233.22  Aligned_cols=126  Identities=36%  Similarity=0.505  Sum_probs=116.7

Q ss_pred             eEEeeCCCCCCCcEEEEEEEeCCCCCceEEEcccCCCCCCCCCCeeEEEeeeCCCCCCCCCCeEEEcCccCCCCCcccee
Q 006036          182 LIIEVPCGLVEDSSITLVGIPDGRYGSFQIELIGSQLSGESNPPIILHYNVSLPGDNMTEEPFIIQNSWTNELGWGKEER  261 (663)
Q Consensus       182 ~~~~lpcGL~~Gs~itv~G~p~~~~~~F~i~L~~~~~~~~~~~~i~LH~NpR~~gd~~~~~pvIv~Ns~~~~~~WG~eeR  261 (663)
                      |...||+||.+|+.|+|.|+|..++++|.|||+++      ..+|+|||||||..      .+||+||+.+ |.||.|||
T Consensus         2 ~~~~l~~~l~~G~~i~i~G~~~~~~~~f~Inl~~~------~~~i~lH~n~rf~~------~~IV~Ns~~~-g~Wg~Eer   68 (127)
T cd00070           2 YKLPLPGGLKPGSTLTVKGRVLPNAKRFSINLGTG------SSDIALHFNPRFDE------NVIVRNSFLN-GNWGPEER   68 (127)
T ss_pred             cccccCCCCcCCCEEEEEEEECCCCCEEEEEEecC------CCCEEEEEeeeCCC------CEEEEcCCCC-CEecHhhc
Confidence            56789999999999999999999999999999983      23899999999995      4799999998 89999999


Q ss_pred             cCCCCCCCcccchhhhhhhhhhhccccccccCCCCCCCCCccccCCCCCCcchhcccccccCCCCcCCCCCCCCcEEEEE
Q 006036          262 CPAHGSSNTLKVDELVLCNEQVLRRSVEENQNTSHPTPSSDMLANAPTPSSDMLANASRVGAHETSNFPFVDGNPFTTTI  341 (663)
Q Consensus       262 ~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~l~i  341 (663)
                      +.                                                                .|||.+|++|+|+|
T Consensus        69 ~~----------------------------------------------------------------~~pf~~g~~F~l~i   84 (127)
T cd00070          69 SG----------------------------------------------------------------GFPFQPGQPFELTI   84 (127)
T ss_pred             cC----------------------------------------------------------------CCCCCCCCeEEEEE
Confidence            93                                                                68999999999999


Q ss_pred             EEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeecc
Q 006036          342 WVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAF  386 (663)
Q Consensus       342 ~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~  386 (663)
                      .++.++|+|.|||+|+++|+||.++  ++|+.|.|.||+.|++|.
T Consensus        85 ~~~~~~f~i~vng~~~~~F~~R~~~--~~i~~l~v~Gdv~i~~v~  127 (127)
T cd00070          85 LVEEDKFQIFVNGQHFFSFPHRLPL--ESIDYLSINGDVSLTSVE  127 (127)
T ss_pred             EEcCCEEEEEECCEeEEEecCcCCh--hhEEEEEEeCCEEEEEeC
Confidence            9999999999999999999999866  599999999999999873


No 9  
>PF00337 Gal-bind_lectin:  Galactoside-binding lectin;  InterPro: IPR001079 Galectins (also known as galaptins or S-lectin) are a family of proteins defined by having at least one characteristic carbohydrate recognition domain (CRD) with an affinity for beta-galactosides and sharing certain sequence elements. Members of the galectins family are found in mammals, birds, amphibians, fish, nematodes, sponges, and some fungi. Galectins are known to carry out intra- and extracellular functions through glycoconjugate-mediated recogntion. From the cytosol they may be secreted by non-classical pathways, but they may also be targeted to the nucleus or specific sub-cytosolic sites. Within the same peptide chain some galectins have a CRD with only a few additional amino acids, whereas others have two CRDs joined by a link peptide, and one (galectin-3) has one CRD joined to a different type of domain [, ]. The galectin carbohydrate recognition domain (CRD) is a beta-sandwich of about 135 amino acid. The two sheets are slightly bent with 6 strands forming the concave side and 5 strands forming the convex side. The concave side forms a groove in which carbohydrate is bound, and which is long enough to hold about a linear tetrasaccharide [, ].; GO: 0005529 sugar binding; PDB: 2WSU_B 2WT0_A 2WT1_A 2WT2_B 2WSV_A 1HLC_A 2ZGQ_A 3M3Q_B 1WW5_C 3M3E_A ....
Probab=99.96  E-value=2e-29  Score=235.01  Aligned_cols=133  Identities=34%  Similarity=0.530  Sum_probs=119.6

Q ss_pred             ceEEeeCCCCCCCcEEEEEEEeCCCCCceEEEcccCCCCCCCCCCeeEEEeeeCCCCCCCCCCeEEEcCccCCCCCccce
Q 006036          181 RLIIEVPCGLVEDSSITLVGIPDGRYGSFQIELIGSQLSGESNPPIILHYNVSLPGDNMTEEPFIIQNSWTNELGWGKEE  260 (663)
Q Consensus       181 ~~~~~lpcGL~~Gs~itv~G~p~~~~~~F~i~L~~~~~~~~~~~~i~LH~NpR~~gd~~~~~pvIv~Ns~~~~~~WG~ee  260 (663)
                      +|++.||+||.+|+.|+|.|++..++++|.|||+++.  .++.++++|||||||+.     +.+||+||+.+ |.||.||
T Consensus         1 pf~~~l~~~l~~G~~i~i~G~~~~~~~~f~inl~~~~--~~~~~~i~lH~~~rf~~-----~~~iv~Ns~~~-g~Wg~Ee   72 (133)
T PF00337_consen    1 PFTARLPGGLSPGDSIIIRGTVPPDAKRFSINLQTGP--NDPDDDIALHFNPRFDE-----QNVIVRNSRIN-GKWGQEE   72 (133)
T ss_dssp             SEEEEETTEEETTEEEEEEEEEBTTSSBEEEEEEES---STTTTEEEEEEEEECTT-----EEEEEEEEEET-TEE-SEE
T ss_pred             CceEEcCCCCCCCcEEEEEEEECCCCCEEEEEecCCC--cCCCCCEEEEEEEEeCC-----CceEEEeceEC-CEeccce
Confidence            4889999999999999999999999999999999964  33578999999999995     24799999998 8899999


Q ss_pred             ecCCCCCCCcccchhhhhhhhhhhccccccccCCCCCCCCCccccCCCCCCcchhcccccccCCCCcCCCCCCCCcEEEE
Q 006036          261 RCPAHGSSNTLKVDELVLCNEQVLRRSVEENQNTSHPTPSSDMLANAPTPSSDMLANASRVGAHETSNFPFVDGNPFTTT  340 (663)
Q Consensus       261 R~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~l~  340 (663)
                      |.                                                                ..|||.+|++|+|+
T Consensus        73 ~~----------------------------------------------------------------~~~pf~~g~~F~i~   88 (133)
T PF00337_consen   73 RE----------------------------------------------------------------SPFPFQPGQPFEIR   88 (133)
T ss_dssp             EE----------------------------------------------------------------SSTSSTTTSEEEEE
T ss_pred             ee----------------------------------------------------------------eeeeecCCceEEEE
Confidence            96                                                                36999999999999


Q ss_pred             EEEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeeccc
Q 006036          341 IWVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAFA  387 (663)
Q Consensus       341 i~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~a  387 (663)
                      |.++.++|+|+|||+|+++|+||.++  .+|++|.|.|||+|+||.+
T Consensus        89 I~~~~~~f~I~vng~~~~~F~~R~~~--~~i~~l~i~Gdv~i~~v~~  133 (133)
T PF00337_consen   89 IRVEEDGFKIYVNGKHFCSFPHRLPL--SSIDYLQIQGDVQIYSVEF  133 (133)
T ss_dssp             EEEESSEEEEEETTEEEEEEE-SSCG--GGEEEEEEEESEEEEEEEE
T ss_pred             EEEecCeeEEEECCeEEEEeeCcCCH--HHcCEEEEECCEEEEEEEC
Confidence            99999999999999999999999876  5999999999999999964


No 10 
>KOG3587 consensus Galectin, galactose-binding lectin [Extracellular structures]
Probab=99.92  E-value=7.1e-25  Score=208.43  Aligned_cols=135  Identities=30%  Similarity=0.395  Sum_probs=121.3

Q ss_pred             ceEEeeCCCCCCCcEEEEEEEeCCC-CCceEEEcccCCCCCCCCCCeeEEEeeeCCCCCCCCCCeEEEcCccCCCCCccc
Q 006036          181 RLIIEVPCGLVEDSSITLVGIPDGR-YGSFQIELIGSQLSGESNPPIILHYNVSLPGDNMTEEPFIIQNSWTNELGWGKE  259 (663)
Q Consensus       181 ~~~~~lpcGL~~Gs~itv~G~p~~~-~~~F~i~L~~~~~~~~~~~~i~LH~NpR~~gd~~~~~pvIv~Ns~~~~~~WG~e  259 (663)
                      .+...+++||.+|+.+++.|.+..+ .++|.++++.+..... +.+|+|||||||++.      .|||||+.+ |.||.|
T Consensus         5 p~~~~~~~~l~~g~~~~~~g~~~~~~~~~~~~~~~~~~~~~~-~~dia~Hfnprf~~~------~VVrNs~~~-g~Wg~e   76 (143)
T KOG3587|consen    5 PFPVPIPSGLPPGSQVTIKGLVLYGIPKRFAVNLRFGTNLDS-DSDIALHFNPRFDEK------GVVRNSLIN-GEWGLE   76 (143)
T ss_pred             ccccccccCcCCCcEEEEEEEEcccCCCcceeeeEeecccCC-CCcEEEEEeccCCCC------eEEEecccC-CccCch
Confidence            4666789999999999999999865 7899999988655555 677999999999965      399999987 999999


Q ss_pred             eecCCCCCCCcccchhhhhhhhhhhccccccccCCCCCCCCCccccCCCCCCcchhcccccccCCCCcCCCCCCCCcEEE
Q 006036          260 ERCPAHGSSNTLKVDELVLCNEQVLRRSVEENQNTSHPTPSSDMLANAPTPSSDMLANASRVGAHETSNFPFVDGNPFTT  339 (663)
Q Consensus       260 eR~~~~~~~~~~~vd~~~~c~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fPF~~G~~F~l  339 (663)
                      ||..                                                                .+||+.|++|.|
T Consensus        77 E~~~----------------------------------------------------------------~~PF~~g~~F~l   92 (143)
T KOG3587|consen   77 EREG----------------------------------------------------------------GNPFQPGQPFDL   92 (143)
T ss_pred             hhcC----------------------------------------------------------------CCCCCCCCeEEE
Confidence            9984                                                                689999999999


Q ss_pred             EEEEecCeEEEEeCCeEeEEeeccccCCCCceEEEEEECCeeeeecccCC
Q 006036          340 TIWVGLDGFHMTVNGRHETSLAYREKLEPWSVTGVKVAGGVDLFSAFAEG  389 (663)
Q Consensus       340 ~i~~~~~gf~v~VnG~h~~sF~yR~~l~~~~v~~l~i~Gdv~l~sV~a~~  389 (663)
                      +|.++.+.|+|.|||.|+++|+||.+.+  .|..|.|.|||+|.+|.++.
T Consensus        93 ~I~~~~~~~~I~VNg~~f~~y~HR~p~~--~v~~l~i~Gdv~i~~i~~~~  140 (143)
T KOG3587|consen   93 TILVEEDKFQIFVNGVHFADYPHRIPPS--SVQTLQINGDVQITSIEFSN  140 (143)
T ss_pred             EEEEccCeEEEEECCEEEEeecCCCCCh--heeEEEEeeeEEEEEEEEEc
Confidence            9999999999999999999999999765  99999999999999998764


No 11 
>PF02434 Fringe:  Fringe-like;  InterPro: IPR003378 The Notch receptor is a large, cell surface transmembrane protein involved in a wide variety of developmental processes in higher organisms []. It becomes activated when its extracellular region binds to ligands located on adjacent cells. Much of this extracellular region is composed of EGF-like repeats, many of which can be O-fucosylated. A number of these O-fucosylated repeats can in turn be further modified by the action of a beta-1,3-N-acetylglucosaminyltransferase enzyme known as Fringe []. Fringe potentiates the activation of Notch by Delta ligands, while inhibiting activation by Serrate/Jagged ligands. This regulation of Notch signalling by Fringe is important in many processes []. Four distinct Fringe proteins have so far been studied in detail; Drosophila Fringe (Dfng) and its three mammalian homologues Lunatic Fringe (Lfng), Radical Fringe (Rfng) and Manic Fringe (Mfng). Dfng, Lfng and Rfng have all been shown to play important roles in developmental processes within their host, though the phenotype of mutants can vary between species e.g. Rfng mutants are retarded in wing development in chickens, but have no obvious phenotype in mice [, , ]. Mfng mutants have not, so far, been charcterised. Biochemical studies indicate that the Fringe proteins are fucose-specific transferases requiring manganese for activity and utilising UDP-N-acetylglucosamine as a donor substrate []. The three mammalian proteins show distinct variations in their catalytic efficiencies with different substrates.  Dfng is a glucosaminyltransferase that controls the response of the Notch receptor to specific ligands which is localised to the Golgi apparatus [] (not secreted as previously thought). Modification of Notch occurs through glycosylation by Dfng.  This entry consists of Fringe proteins and related glycosyltransferase enzymes including:   Beta-1,3-glucosyltransferase, which glucosylates O-linked fucosylglycan on thrombospondin type 1 repeat domains [].  Core 1 beta1,3-galactosyltransferase 1, generates the core T antigen, which is a precursor for many extended O-glycans in glycoproteins and plays a central role in many processes, such as angiogenesis, thrombopoiesis and kidney homeostasis development [].  ; GO: 0016757 transferase activity, transferring glycosyl groups, 0016020 membrane; PDB: 2J0B_A 2J0A_A.
Probab=99.70  E-value=4e-17  Score=168.84  Aligned_cols=180  Identities=17%  Similarity=0.203  Sum_probs=95.2

Q ss_pred             EEEEEEecCCCcHHHH-HHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHH
Q 006036          416 VMLIGVFSTGNNFERR-MALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTI  494 (663)
Q Consensus       416 ~LlI~V~Sa~~n~~rR-~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtl  494 (663)
                      +|+|+|+|++++.+.| .+|++||++...      ...|+.....+..+..    +  ...+++..+....+...+++.+
T Consensus         7 dI~i~V~T~~k~h~tR~~~I~~TW~~~~~------~~~~ifsd~~d~~l~~----~--~~~~l~~~~~~~~~~~~~~~~~   74 (252)
T PF02434_consen    7 DIFIAVKTTKKFHKTRAPAIKQTWAKRCN------KQTFIFSDAEDPSLPT----V--TGVHLVNPNCDAGHCRKTLSCK   74 (252)
T ss_dssp             GEEEEEE--GGGTTTTHHHHHHTGGGGSG------GGEEEEESS--HHHHH----H--HGGGEEE-------------HH
T ss_pred             cEEEEEEeCHHHHHHHHHHHHHHHHhhcC------CceEEecCcccccccc----c--cccccccCCCcchhhHHHHHHH
Confidence            4789999998765555 899999999754      1245444444433322    1  3446666666666665566666


Q ss_pred             HHHHhhh-ccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCc-C
Q 006036          495 AICIFGT-KILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWA-H  571 (663)
Q Consensus       495 a~l~w~~-~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc-~  571 (663)
                      +...|.. ..++++|++++||||||++++|+++|.. ++.++.|+|...... |..... +  ..........| .|+ +
T Consensus        75 ~~~~y~~~~~~~~~Wf~~~DDDtyv~~~~L~~~L~~~~~~~~~yiG~~~~~~-~~~~~~-~--~~~~~~~~~~~-~f~~G  149 (252)
T PF02434_consen   75 MAYEYDHFLNSDKDWFCFADDDTYVNVENLRRLLSKYDPSEPIYIGRPSGDR-PIEIIH-R--FNPNKSKDSGF-WFATG  149 (252)
T ss_dssp             HHHHHHHHHHHT-SEEEEEETTEEE-HHHHHHHHTTS-TTS--EEE-EE---------------------------EE-G
T ss_pred             HHHHHHhhhcCCceEEEEEeCCceecHHHHHHHHhhCCCccCEEeeeeccCc-cceeec-c--ccccccCcCce-EeeCC
Confidence            5555543 2468899999999999999999999999 889999999876532 222100 0  00000011112 234 6


Q ss_pred             CCccccCHHHHHHHHhhhccccc-CCC----CcchhHHHHHHHH-hh
Q 006036          572 GPGYIISRDIAKFIVQGHQERDL-KLF----KLEDVAMGIWIEQ-FK  612 (663)
Q Consensus       572 G~GYVLSrdla~~I~~~~~~~~l-~~f----~lEDV~iGi~L~~-l~  612 (663)
                      |+||+||+.++++|......+.+ ...    ..||+.||.|++. ++
T Consensus       150 GaG~vlSr~~~~k~~~~~~~~~~~~~~~~~~~~dD~~lG~ci~~~lg  196 (252)
T PF02434_consen  150 GAGYVLSRALLKKMSPWASGCKCPSTDEKIRLPDDMTLGYCIENLLG  196 (252)
T ss_dssp             GG-EEEEHHHHHHHHHHHTT-TTS--TTTTTS-HHHHHHHHHHHTT-
T ss_pred             CeeHHHhHHHHHHHhhhcccccccCCcCCCCCcccChhhhhHHhcCC
Confidence            79999999999999654322222 222    3799999999998 54


No 12 
>KOG2246 consensus Galactosyltransferases [Carbohydrate transport and metabolism]
Probab=99.56  E-value=1.7e-14  Score=156.37  Aligned_cols=164  Identities=16%  Similarity=0.222  Sum_probs=123.7

Q ss_pred             CCCeEEEEEEecCCCcHHHH-HHHHHHhcCCCCCCCCCeEEEEEE---eccCChhhhHHHHHHHhhcCCEEEEeecccCC
Q 006036          412 RKRLVMLIGVFSTGNNFERR-MALRRSWMQYPAVRSGDLAVRFFI---GLHKNRQVNFELWKEAQAYGDIQIMPFVDYYS  487 (663)
Q Consensus       412 ~~~v~LlI~V~Sa~~n~~rR-~aIR~TW~~~~~v~~~~V~v~Fvv---G~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~  487 (663)
                      .++.+++|+|.|.+.+...| ..+-+||++...      +..|+-   .....            .+. .|..+..|+|+
T Consensus        88 ~r~~~v~cwv~t~~~~~~~~~~~v~~TW~~rc~------~~~f~s~~~s~~~~------------~f~-~v~~~~~~g~~  148 (364)
T KOG2246|consen   88 SRSGRVLCWVLTSPMRHVTRADAVKETWLKRCD------KGIFFSPTLSKDDS------------RFP-TVYYNLPDGYR  148 (364)
T ss_pred             CCCceEEEEEEecCcCceeehhhhhcccccccC------cceecCccCCCCCC------------cCc-eeeccCCcchH
Confidence            57899999999998776666 699999998654      123443   22211            111 24678899999


Q ss_pred             cchHHHHHHHHhhh--ccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCC
Q 006036          488 LISLKTIAICIFGT--KILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHS  564 (663)
Q Consensus       488 nLtlKtla~l~w~~--~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~  564 (663)
                      ++..||..+++|..  .-.+++|++|+|||||+.++||..+|.+ +++++.|+|.....   .- ..+  |.        
T Consensus       149 ~~~~ktr~~~~yv~~~~~~~~dWf~~aDDDTy~i~eNLr~~L~~yDp~~p~YiG~~~~~---~~-~~~--y~--------  214 (364)
T KOG2246|consen  149 SLWRKTRIAFKYVYDHILKDYDWFLKADDDTYFIMENLRYVLSKYDPEKPVYLGYRSKS---YF-QNG--YS--------  214 (364)
T ss_pred             HHHHHHHHHHHHHHHhccCCCCeEEeccCCeEEeHHHHHHHHhhcCCCCcEEecccccc---cc-ccc--cc--------
Confidence            99999999999885  3468999999999999999999999999 99999999986532   11 112  22        


Q ss_pred             CCCCCcCCCccccCHHHHHHHHhhhcc--cccCCC---CcchhHHHHHHHHhhc
Q 006036          565 SYPPWAHGPGYIISRDIAKFIVQGHQE--RDLKLF---KLEDVAMGIWIEQFKN  613 (663)
Q Consensus       565 ~YPpYc~G~GYVLSrdla~~I~~~~~~--~~l~~f---~lEDV~iGi~L~~l~~  613 (663)
                           -+|+||++|+.+.+.+++....  ..++.-   ..||+-||.||+.+|+
T Consensus       215 -----~g~ag~~ls~aa~~~la~~l~~~~~~C~~~~~~~~eD~~i~~Cl~~~GV  263 (364)
T KOG2246|consen  215 -----SGGAGYVLSFAALRRLAERLLNNEDKCPQRYPSYGEDRRIGRCLAEVGV  263 (364)
T ss_pred             -----cCCCCcceeHHHHHHHHHHHhcchhhcccccCCchhHHHHHHHHHHhCC
Confidence                 2899999999999998876421  112222   3899999999999965


No 13 
>PLN03153 hypothetical protein; Provisional
Probab=98.96  E-value=4.1e-09  Score=117.42  Aligned_cols=104  Identities=18%  Similarity=0.154  Sum_probs=75.2

Q ss_pred             ccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCccccCHH
Q 006036          502 KILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYIISRD  580 (663)
Q Consensus       502 ~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrd  580 (663)
                      ..++++|++++|||||+.+++|++.|.. +++++.|+|.........    ..+.          |--.-+|+||+||+.
T Consensus       207 ~~pd~kWfVf~DDDTyf~~~NLv~~Ls~YDptkp~YIGs~Se~~~qn----~~f~----------~~fA~GGAG~~LSrP  272 (537)
T PLN03153        207 GLPDVRWFVLGDDDTIFNADNLVAVLSKYDPSEMVYVGGPSESHSAN----SYFS----------HNMAFGGGGIAISYP  272 (537)
T ss_pred             hCCCCCEEEEecCCccccHHHHHHHHhhcCCCCCEEecccccccccc----cccc----------cccccCCceEEEcHH
Confidence            3689999999999999999999999999 899999999876432100    0000          111237999999999


Q ss_pred             HHHHHHhhhccccc--CCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          581 IAKFIVQGHQERDL--KLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       581 la~~I~~~~~~~~l--~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                      +++.|......+..  +...-+|..||.|+.++   |+++....
T Consensus       273 Lae~L~~~~d~C~~rY~~~~~gD~rL~~CL~el---GV~LT~~~  313 (537)
T PLN03153        273 LAEALSRILDDCLDRYPKLYGSDDRLHACITEL---GVPLSREP  313 (537)
T ss_pred             HHHHHHHHhhhhhhhcccCCCcHHHHHHHHHHc---CCCceecC
Confidence            99998886432221  22356899999999987   45555433


No 14 
>KOG3708 consensus Uncharacterized conserved protein [Function unknown]
Probab=97.22  E-value=0.0012  Score=73.61  Aligned_cols=198  Identities=14%  Similarity=0.146  Sum_probs=120.3

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      +=+|+++|+|..   .---+|-+|=+.+-      =++.||.+...-.             .|.-++..+..|+.-..|+
T Consensus        25 RErl~~aVmte~---tlA~a~NrT~ahhv------prv~~F~~~~~i~-------------~~~a~~~~vs~~d~r~~~~   82 (681)
T KOG3708|consen   25 RERLMAAVMTES---TLALAINRTLAHHV------PRVHLFADSSRID-------------NDLAQLTNVSPYDLRGQKT   82 (681)
T ss_pred             HHHHHHHHHHHH---HHHHHHHHHHHhhc------ceeEEeecccccc-------------ccHhhccccCccccCcccc
Confidence            345667788722   45567777766532      1355676654321             1222233334444444555


Q ss_pred             H-HHHHhh--hccCCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCC
Q 006036          494 I-AICIFG--TKILPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPW  569 (663)
Q Consensus       494 l-a~l~w~--~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpY  569 (663)
                      . +.+.+.  ....+++|++-+-||||||...|++++.. +-..++|+|.--.+      -            ...    
T Consensus        83 ~s~vl~~l~~~~~~~YDwFll~~D~tYv~a~~L~~l~~hmsin~dlymGEe~~~------g------------s~r----  140 (681)
T KOG3708|consen   83 HSMVLGLLFNMVHNNYDWFLLAKDSTYVNAFVLLRLIDHMSINEDLYMGEEAED------G------------SGR----  140 (681)
T ss_pred             HHHHHHHHHHhhccccceEEEecCcceecHHHHHHHHhhcccccccccchhhhC------c------------cCc----
Confidence            4 233443  34568999999999999999999999988 77889999932111      0            011    


Q ss_pred             c-CCCccccCHHHHHHHHhhhcccccC-CCCcchhHHHHHHHHhhcCCCeeeeccCCcc-------------cc---CCc
Q 006036          570 A-HGPGYIISRDIAKFIVQGHQERDLK-LFKLEDVAMGIWIEQFKNTGQEVHYMSDDRF-------------YN---AGC  631 (663)
Q Consensus       570 c-~G~GYVLSrdla~~I~~~~~~~~l~-~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf-------------~~---~~C  631 (663)
                      | .|.||+||+.++.++-.+.+.+.-- .-.=.|+.+|.|+......+-...+..-.++             ..   +.-
T Consensus       141 C~l~~G~LLS~s~l~~lrnnle~C~~~~lsad~d~~lgrCi~~At~v~C~~~hQGvrq~s~~~dspgr~~~~~e~~~s~a  220 (681)
T KOG3708|consen  141 CRLDTGMLLSQSLLHALRNNLEGCRNDILSADPDEWLGRCIQDATGVGCKPLHQGVRQYSEREDSPGRHDSIPEWEGSPA  220 (681)
T ss_pred             cccccceeecHHHHHHHHhhHHHhhcccccCCcHHHHHHHHHHhhcCCccchhhhHHhhhHhhcCCCccccchhhcCChH
Confidence            5 5889999999999998875322211 2234689999999875432211111111111             00   112


Q ss_pred             ccceEEEE-ecCHHHHHHHHHHhhc
Q 006036          632 ESDYILAH-YQGPRMVLCLWEKLQK  655 (663)
Q Consensus       632 ~~~~I~~H-y~sP~~M~~lW~~l~~  655 (663)
                      ..+.+++| -++|.+|..+.+.+..
T Consensus       221 Fr~A~tv~pv~~p~d~yrLH~yfsr  245 (681)
T KOG3708|consen  221 FRSALTVHPVLSPADMYRLHKYFSR  245 (681)
T ss_pred             HhhhhccCccCCHHHHHHHHHHHHH
Confidence            24667888 5889999999988754


No 15 
>cd02520 Glucosylceramide_synthase Glucosylceramide synthase catalyzes the first glycosylation step of glycosphingolipid synthesis. UDP-glucose:N-acylsphingosine D-glucosyltransferase (glucosylceramide synthase or ceramide glucosyltransferase) catalyzes the first glycosylation step of glycosphingolipid synthesis. Its product, glucosylceramide, serves as the core of more than 300 glycosphingolipids (GSL). GSLs are a group of membrane components that have the lipid portion embedded in the outer plasma membrane leaflet and the sugar chains extended to the outer environment. Several lines of evidence suggest the importance of GSLs in various cellular processes such as differentiation, adhesion, proliferation, and cell-cell recognition. In pathogenic fungus Cryptococcus neoformans,  glucosylceramide serves as an antigen that elicits an antibody response in patients and it is essential for fungal growth in host extracellular environment.
Probab=94.24  E-value=2.2  Score=41.61  Aligned_cols=128  Identities=19%  Similarity=0.142  Sum_probs=75.9

Q ss_pred             eEEEEEEeccCChhhhHHHHHHHhhcC--CEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHH
Q 006036          449 LAVRFFIGLHKNRQVNFELWKEAQAYG--DIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSN  526 (663)
Q Consensus       449 V~v~FvvG~~~~~~~~~~L~~Ea~~yg--DII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~  526 (663)
                      +.++++...+.+.. .+.+++-.+.|.  ++......... ....|.-+ +..+......+|++..|+|+.+..+.|...
T Consensus        31 ~eiivVdd~s~d~t-~~~~~~~~~~~~~~~~~~~~~~~~~-g~~~~~~~-~n~g~~~a~~d~i~~~D~D~~~~~~~l~~l  107 (196)
T cd02520          31 YEILFCVQDEDDPA-IPVVRKLIAKYPNVDARLLIGGEKV-GINPKVNN-LIKGYEEARYDILVISDSDISVPPDYLRRM  107 (196)
T ss_pred             eEEEEEeCCCcchH-HHHHHHHHHHCCCCcEEEEecCCcC-CCCHhHHH-HHHHHHhCCCCEEEEECCCceEChhHHHHH
Confidence            56666665555433 334444445555  33222221111 12234322 234445567899999999999988888777


Q ss_pred             hhc--CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHH
Q 006036          527 LKE--KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAM  604 (663)
Q Consensus       527 L~~--~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~i  604 (663)
                      +..  ++.-..+.|.                             ++.|++.++.+++.+.+---   ........||..+
T Consensus       108 ~~~~~~~~~~~v~~~-----------------------------~~~g~~~~~r~~~~~~~ggf---~~~~~~~~eD~~l  155 (196)
T cd02520         108 VAPLMDPGVGLVTCL-----------------------------CAFGKSMALRREVLDAIGGF---EAFADYLAEDYFL  155 (196)
T ss_pred             HHHhhCCCCCeEEee-----------------------------cccCceeeeEHHHHHhccCh---HHHhHHHHHHHHH
Confidence            765  3333333332                             57899999999999887432   1112234699999


Q ss_pred             HHHHHHh
Q 006036          605 GIWIEQF  611 (663)
Q Consensus       605 Gi~L~~l  611 (663)
                      ++-+.+.
T Consensus       156 ~~rl~~~  162 (196)
T cd02520         156 GKLIWRL  162 (196)
T ss_pred             HHHHHHc
Confidence            8887765


No 16 
>PF13641 Glyco_tranf_2_3:  Glycosyltransferase like family 2; PDB: 4FIY_B 4FIX_A.
Probab=93.92  E-value=0.83  Score=45.17  Aligned_cols=185  Identities=16%  Similarity=0.111  Sum_probs=88.0

Q ss_pred             EEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCE--EEEeecccCCcc--hH
Q 006036          416 VMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDI--QIMPFVDYYSLI--SL  491 (663)
Q Consensus       416 ~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDI--I~ldf~DsY~nL--tl  491 (663)
                      .+.|+|++.-....-++.|+.--.+.    ...+.++++... .+....+.+++-.+.|.++  ..+...   .|.  +.
T Consensus         2 ~v~Vvip~~~~~~~l~~~l~sl~~~~----~~~~~v~vvd~~-~~~~~~~~~~~~~~~~~~~~v~vi~~~---~~~g~~~   73 (228)
T PF13641_consen    2 RVSVVIPAYNEDDVLRRCLESLLAQD----YPRLEVVVVDDG-SDDETAEILRALAARYPRVRVRVIRRP---RNPGPGG   73 (228)
T ss_dssp             -EEEE--BSS-HHHHHHHHHHHTTSH----HHTEEEEEEEE--SSS-GCTTHHHHHHTTGG-GEEEEE-------HHHHH
T ss_pred             EEEEEEEecCCHHHHHHHHHHHHcCC----CCCeEEEEEECC-CChHHHHHHHHHHHHcCCCceEEeecC---CCCCcch
Confidence            46677777665556666666655442    134555554433 3333444455555666653  322221   222  23


Q ss_pred             HHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCC---CC-----CcccCCCCC
Q 006036          492 KTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDK---DS-----KWYISNEEW  561 (663)
Q Consensus       492 Ktla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~---~~-----KwyVs~eey  561 (663)
                      |.-+ +.++....+.+|++.+|||+.+..+.|...+..  .+.-..+.|.+....  .+..   ..     .|+......
T Consensus        74 k~~a-~n~~~~~~~~d~i~~lD~D~~~~p~~l~~~~~~~~~~~~~~v~~~~~~~~--~~~~~~~~~~~~~~~~~~~~~~~  150 (228)
T PF13641_consen   74 KARA-LNEALAAARGDYILFLDDDTVLDPDWLERLLAAFADPGVGAVGGPVFPDN--DRNWLTRLQDLFFARWHLRFRSG  150 (228)
T ss_dssp             HHHH-HHHHHHH---SEEEEE-SSEEE-CHHHHHHHHHHHBSS--EEEEEEEETT--CCCEEEE-TT--S-EETTTS-TT
T ss_pred             HHHH-HHHHHHhcCCCEEEEECCCcEECHHHHHHHHHHHHhCCCCeEeeeEeecC--CCCHHHHHHHHHHhhhhhhhhhh
Confidence            3332 344444456999999999999998887776665  455555556553321  1100   00     111100000


Q ss_pred             CCCCCC-CCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeee
Q 006036          562 PHSSYP-PWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHY  620 (663)
Q Consensus       562 p~~~YP-pYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~  620 (663)
                      . ..+. .++.|++.++.+++++.+--- . .   ....||..++..+.+.   |..+.|
T Consensus       151 ~-~~~~~~~~~G~~~~~rr~~~~~~g~f-d-~---~~~~eD~~l~~r~~~~---G~~~~~  201 (228)
T PF13641_consen  151 R-RALGVAFLSGSGMLFRRSALEEVGGF-D-P---FILGEDFDLCLRLRAA---GWRIVY  201 (228)
T ss_dssp             --B----S-B--TEEEEEHHHHHHH-S----S---SSSSHHHHHHHHHHHT---T--EEE
T ss_pred             h-cccceeeccCcEEEEEHHHHHHhCCC-C-C---CCcccHHHHHHHHHHC---CCcEEE
Confidence            0 1111 456899999999999998642 1 1   3445999999888874   455554


No 17 
>TIGR03472 HpnI hopanoid biosynthesis associated glycosyl transferase protein HpnI. This family of genes include a glycosyl transferase, group 2 domain (pfam00535) which are responsible, generally for the transfer of nucleotide-diphosphate sugars to substrates such as polysaccharides and lipids. The member of this clade from Acidithiobacillus ferrooxidans ATCC 23270 (AFE_0974) is found in the same locus as squalene-hopene cyclase (SHC, TIGR01507) and other genes associated with the biosynthesis of hopanoid natural products. Similarly, in Ralstonia eutropha JMP134 (Reut_B4902) this gene is adjacent to HpnAB, IspH and HpnH (TIGR03470), although SHC itself is elsewhere in the genome. Notably, this gene (here named HpnI) and three others form a conserved set (HpnIJKL) which occur in a subset of all genomes containing the SHC enzyme. This relationship was discerned using the method of partial phylogenetic profiling. This group includes Zymomonas mobilis, the organism where the initial hopano
Probab=92.90  E-value=1.7  Score=47.50  Aligned_cols=186  Identities=14%  Similarity=0.042  Sum_probs=96.8

Q ss_pred             eEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCC--EEEEeecccCCcchHH
Q 006036          415 LVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGD--IQIMPFVDYYSLISLK  492 (663)
Q Consensus       415 v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygD--II~ldf~DsY~nLtlK  492 (663)
                      +.+-|+|++.-....-.+.|+.-=.+ .   ...+.++++...+++... +.+++=.+.|.+  |..+. .+.-.....|
T Consensus        41 p~VSViiP~~nee~~l~~~L~Sl~~q-~---Yp~~EIivvdd~s~D~t~-~iv~~~~~~~p~~~i~~v~-~~~~~G~~~K  114 (373)
T TIGR03472        41 PPVSVLKPLHGDEPELYENLASFCRQ-D---YPGFQMLFGVQDPDDPAL-AVVRRLRADFPDADIDLVI-DARRHGPNRK  114 (373)
T ss_pred             CCeEEEEECCCCChhHHHHHHHHHhc-C---CCCeEEEEEeCCCCCcHH-HHHHHHHHhCCCCceEEEE-CCCCCCCChH
Confidence            44556666554433344555432222 1   123667676665554432 333333455666  43331 1111222346


Q ss_pred             HHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCC---cccCCCCCCC----
Q 006036          493 TIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSK---WYISNEEWPH----  563 (663)
Q Consensus       493 tla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~K---wyVs~eeyp~----  563 (663)
                      .-+..+ +.+..+.+|++.+|+|+.+..+.|...+..  ++.-....|...  ..+......+   .++....+|.    
T Consensus       115 ~~~l~~-~~~~a~ge~i~~~DaD~~~~p~~L~~lv~~~~~~~v~~V~~~~~--~~~~~~~~~~l~~~~~~~~~~~~~~~~  191 (373)
T TIGR03472       115 VSNLIN-MLPHARHDILVIADSDISVGPDYLRQVVAPLADPDVGLVTCLYR--GRPVPGFWSRLGAMGINHNFLPSVMVA  191 (373)
T ss_pred             HHHHHH-HHHhccCCEEEEECCCCCcChhHHHHHHHHhcCCCcceEecccc--CCCCCCHHHHHHHHHhhhhhhHHHHHH
Confidence            544333 334457999999999999999888887766  333344444321  1111100000   0111111110    


Q ss_pred             --CCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          564 --SSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       564 --~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                        ..-+.+|.|+++++.+++.+.+--- .  .....-.||+.+|.-+.+.+
T Consensus       192 ~~~~~~~~~~G~~~a~RR~~l~~iGGf-~--~~~~~~~ED~~l~~~i~~~G  239 (373)
T TIGR03472       192 RALGRARFCFGATMALRRATLEAIGGL-A--ALAHHLADDYWLGELVRALG  239 (373)
T ss_pred             HhccCCccccChhhheeHHHHHHcCCh-H--HhcccchHHHHHHHHHHHcC
Confidence              0113568899999999999888632 1  11222369999999988653


No 18 
>PF01755 Glyco_transf_25:  Glycosyltransferase family 25 (LPS biosynthesis protein);  InterPro: IPR002654 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. Glycosyltransferase family 25 GT25 from CAZY comprises enzymes with only one known activity; as a lipopolysaccharide biosynthesis protein. These enzymes catalyse the transfer of various sugars onto the growing lipopolysaccharide chain during its biosynthesis [].; GO: 0009103 lipopolysaccharide biosynthetic process
Probab=92.08  E-value=1.8  Score=42.65  Aligned_cols=35  Identities=20%  Similarity=0.330  Sum_probs=25.6

Q ss_pred             EEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccC
Q 006036          419 IGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHK  459 (663)
Q Consensus       419 I~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~  459 (663)
                      |.|.|-+...+||..+.+.....      .+.+.||-|...
T Consensus         4 i~vInL~~~~~Rr~~~~~~~~~~------~~~~e~~~Avdg   38 (200)
T PF01755_consen    4 IYVINLDRSTERRERIQQQLAKL------GINFEFFDAVDG   38 (200)
T ss_pred             EEEEECCCCHHHHHHHHHHHHHc------CCceEEEEeecc
Confidence            56777888999999999887653      345667766544


No 19 
>cd04186 GT_2_like_c Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=91.54  E-value=5.9  Score=36.28  Aligned_cols=84  Identities=19%  Similarity=0.292  Sum_probs=56.0

Q ss_pred             hccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCcccc
Q 006036          501 TKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYII  577 (663)
Q Consensus       501 ~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVL  577 (663)
                      ....+.+|++..|||..+..+.+...+..   .+.-..+.|.                              +.|++.++
T Consensus        70 ~~~~~~~~i~~~D~D~~~~~~~l~~~~~~~~~~~~~~~~~~~------------------------------~~~~~~~~  119 (166)
T cd04186          70 IREAKGDYVLLLNPDTVVEPGALLELLDAAEQDPDVGIVGPK------------------------------VSGAFLLV  119 (166)
T ss_pred             HhhCCCCEEEEECCCcEECccHHHHHHHHHHhCCCceEEEcc------------------------------CceeeEee
Confidence            33448999999999999998888887764   2222233222                              68999999


Q ss_pred             CHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeee
Q 006036          578 SRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHY  620 (663)
Q Consensus       578 Srdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~  620 (663)
                      ++++++.+-- +. .... ...||..+.+-+...   |..+.+
T Consensus       120 ~~~~~~~~~~-~~-~~~~-~~~eD~~~~~~~~~~---g~~i~~  156 (166)
T cd04186         120 RREVFEEVGG-FD-EDFF-LYYEDVDLCLRARLA---GYRVLY  156 (166)
T ss_pred             eHHHHHHcCC-CC-hhhh-ccccHHHHHHHHHHc---CCeEEE
Confidence            9999887743 11 1111 256999888766644   445543


No 20 
>cd04196 GT_2_like_d Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=91.10  E-value=2  Score=41.48  Aligned_cols=153  Identities=8%  Similarity=0.001  Sum_probs=79.5

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcC-CEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHH
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYG-DIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSN  526 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~yg-DII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~  526 (663)
                      .+.++++-..+.+. ....+++-+.+|. .+.......+. ...    ..+..+....+.+|++..|+|..+..+.|...
T Consensus        27 ~~eiiVvddgS~d~-t~~~~~~~~~~~~~~~~~~~~~~~~-G~~----~~~n~g~~~~~g~~v~~ld~Dd~~~~~~l~~~  100 (214)
T cd04196          27 NDELIISDDGSTDG-TVEIIKEYIDKDPFIIILIRNGKNL-GVA----RNFESLLQAADGDYVFFCDQDDIWLPDKLERL  100 (214)
T ss_pred             CeEEEEEeCCCCCC-cHHHHHHHHhcCCceEEEEeCCCCc-cHH----HHHHHHHHhCCCCEEEEECCCcccChhHHHHH
Confidence            45565555444433 3344444444554 33333332221 111    12233445568999999999999998877777


Q ss_pred             hhc---CCCCCeeEEeeeC--CCCCccCCCCCcccC----CCCCCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCC
Q 006036          527 LKE---KPSNGLLFGLMSY--DSSPQRDKDSKWYIS----NEEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLF  597 (663)
Q Consensus       527 L~~---~~~~~ly~G~v~~--~~~P~Rd~~~KwyVs----~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f  597 (663)
                      +..   .+....+.|....  ....... ...+...    ...+.......++.|++.++.+++++.+....  .  ...
T Consensus       101 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~~--~--~~~  175 (214)
T cd04196         101 LKAFLKDDKPLLVYSDLELVDENGNPIG-ESFFEYQKIKPGTSFNNLLFQNVVTGCTMAFNRELLELALPFP--D--ADV  175 (214)
T ss_pred             HHHHhcCCCceEEecCcEEECCCCCCcc-cccccccccCCccCHHHHHHhCccCCceeeEEHHHHHhhcccc--c--ccc
Confidence            764   3333455554321  1111110 0111000    00111112235668999999999999986531  1  114


Q ss_pred             CcchhHHHHHHHHh
Q 006036          598 KLEDVAMGIWIEQF  611 (663)
Q Consensus       598 ~lEDV~iGi~L~~l  611 (663)
                      ..||.++.+.+...
T Consensus       176 ~~~D~~~~~~~~~~  189 (214)
T cd04196         176 IMHDWWLALLASAF  189 (214)
T ss_pred             ccchHHHHHHHHHc
Confidence            68898887776653


No 21 
>cd04192 GT_2_like_e Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=90.88  E-value=5.6  Score=38.82  Aligned_cols=152  Identities=16%  Similarity=0.040  Sum_probs=79.4

Q ss_pred             eEEEEEEeccCChhhhHHHH-HHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHh
Q 006036          449 LAVRFFIGLHKNRQVNFELW-KEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNL  527 (663)
Q Consensus       449 V~v~FvvG~~~~~~~~~~L~-~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L  527 (663)
                      +.++.+-..+.+ ...+.++ .....+..+..++... -.+ ..|.. .+.++......+|++.+|+|+.+..+.|...+
T Consensus        29 ~eiivvdd~s~d-~t~~~~~~~~~~~~~~v~~~~~~~-~~~-~g~~~-a~n~g~~~~~~d~i~~~D~D~~~~~~~l~~l~  104 (229)
T cd04192          29 FEVILVDDHSTD-GTVQILEFAAAKPNFQLKILNNSR-VSI-SGKKN-ALTTAIKAAKGDWIVTTDADCVVPSNWLLTFV  104 (229)
T ss_pred             eEEEEEcCCCCc-ChHHHHHHHHhCCCcceEEeeccC-ccc-chhHH-HHHHHHHHhcCCEEEEECCCcccCHHHHHHHH
Confidence            555544444333 2333343 1222233455555443 122 22332 23455555689999999999999988887777


Q ss_pred             hc--CCCCCeeEEeeeCCCCCccCCCCC-----cccCC---CCCCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCC
Q 006036          528 KE--KPSNGLLFGLMSYDSSPQRDKDSK-----WYISN---EEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLF  597 (663)
Q Consensus       528 ~~--~~~~~ly~G~v~~~~~P~Rd~~~K-----wyVs~---eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f  597 (663)
                      ..  ......+.|..... .+ ......     +....   .......++..+.|+++++.+++.+.+---   ......
T Consensus       105 ~~~~~~~~~~v~~~~~~~-~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~~~~rr~~~~~~ggf---~~~~~~  179 (229)
T cd04192         105 AFIQKEQIGLVAGPVIYF-KG-KSLLAKFQRLDWLSLLGLIAGSFGLGKPFMCNGANMAYRKEAFFEVGGF---EGNDHI  179 (229)
T ss_pred             HHhhcCCCcEEeeeeeec-CC-ccHHHHHHHHHHHHHHHHHhhHHHhcCccccccceEEEEHHHHHHhcCC---cccccc
Confidence            64  33445666654432 11 000000     00000   001123356677899999999999988532   111234


Q ss_pred             CcchhHHHHHHH
Q 006036          598 KLEDVAMGIWIE  609 (663)
Q Consensus       598 ~lEDV~iGi~L~  609 (663)
                      ..||..++.-+.
T Consensus       180 ~~eD~~~~~~~~  191 (229)
T cd04192         180 ASGDDELLLAKV  191 (229)
T ss_pred             ccCCHHHHHHHH
Confidence            567877765444


No 22 
>cd06439 CESA_like_1 CESA_like_1 is a member of the cellulose synthase (CESA) superfamily. This is a subfamily of cellulose synthase (CESA) superfamily.  CESA superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains.  The members of the superfamily include cellulose synthase catalytic subunit, chitin synthase, glucan biosynthesis protein and other families of CESA-like proteins.
Probab=90.52  E-value=12  Score=37.44  Aligned_cols=180  Identities=13%  Similarity=0.051  Sum_probs=87.4

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      ...+-|+|++.-....-...|+.-..+...  ...+.++++...+.+ .....+.+-.+.  .+......+   |. .|.
T Consensus        28 ~~~isVvip~~n~~~~l~~~l~si~~q~~~--~~~~eiivvdd~s~d-~t~~~~~~~~~~--~v~~i~~~~---~~-g~~   98 (251)
T cd06439          28 LPTVTIIIPAYNEEAVIEAKLENLLALDYP--RDRLEIIVVSDGSTD-GTAEIAREYADK--GVKLLRFPE---RR-GKA   98 (251)
T ss_pred             CCEEEEEEecCCcHHHHHHHHHHHHhCcCC--CCcEEEEEEECCCCc-cHHHHHHHHhhC--cEEEEEcCC---CC-ChH
Confidence            345666676655444444556655554211  112445444433333 222333322222  344433222   21 232


Q ss_pred             HHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCcccCCC----CCC-CCCC
Q 006036          494 IAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKWYISNE----EWP-HSSY  566 (663)
Q Consensus       494 la~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~e----eyp-~~~Y  566 (663)
                      - .+..+......+|++.+|+|+++..+.|.+.+..  ++.-..+.|................+....    .+. ....
T Consensus        99 ~-a~n~gi~~a~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  177 (251)
T cd06439          99 A-ALNRALALATGEIVVFTDANALLDPDALRLLVRHFADPSVGAVSGELVIVDGGGSGSGEGLYWKYENWLKRAESRLGS  177 (251)
T ss_pred             H-HHHHHHHHcCCCEEEEEccccCcCHHHHHHHHHHhcCCCccEEEeEEEecCCcccchhHHHHHHHHHHHHHHHHhcCC
Confidence            2 2334444446799999999999997777776666  344456666554321110000011110000    000 1112


Q ss_pred             CCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          567 PPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       567 PpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      ...+.|+++.+.+++..    ..    ......||..++.-+...
T Consensus       178 ~~~~~g~~~~~rr~~~~----~~----~~~~~~eD~~l~~~~~~~  214 (251)
T cd06439         178 TVGANGAIYAIRRELFR----PL----PADTINDDFVLPLRIARQ  214 (251)
T ss_pred             eeeecchHHHhHHHHhc----CC----CcccchhHHHHHHHHHHc
Confidence            34567888878887666    21    112346999998877654


No 23 
>cd06423 CESA_like CESA_like is  the cellulose synthase superfamily. The cellulose synthase (CESA) superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains. The members include cellulose synthase catalytic subunit, chitin synthase, glucan biosynthesis protein and other families of CESA-like proteins. Cellulose synthase catalyzes the polymerization reaction of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues in  plants, most algae, some bacteria and fungi, and even some animals. In bacteria, algae and lower eukaryotes, there is a second unrelated type of cellulose synthase (Type II), which produces acylated cellulose, a derivative of cellulose. Chitin synthase catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin, which is a linear homopolymer of beta-(1,4)-linked GlcNAc residues and Glucan Biosynthesis protein catalyzes the
Probab=89.85  E-value=6.7  Score=35.47  Aligned_cols=90  Identities=10%  Similarity=0.042  Sum_probs=49.8

Q ss_pred             HhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCC---ccCCCC-C---cccCCCCC-CCCCC
Q 006036          498 IFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSP---QRDKDS-K---WYISNEEW-PHSSY  566 (663)
Q Consensus       498 ~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P---~Rd~~~-K---wyVs~eey-p~~~Y  566 (663)
                      .++....+.+|++.+|+|.++..+.|...+..   .+.-..+.|........   ...... +   ++.....+ ....+
T Consensus        71 n~~~~~~~~~~i~~~D~D~~~~~~~l~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  150 (180)
T cd06423          71 NAGLRHAKGDIVVVLDADTILEPDALKRLVVPFFADPKVGAVQGRVRVRNGSENLLTRLQAIEYLSIFRLGRRAQSALGG  150 (180)
T ss_pred             HHHHHhcCCCEEEEECCCCCcChHHHHHHHHHhccCCCeeeEeeeEEEecCcCcceeccchheecceeeeeeehhheecc
Confidence            34444558999999999999988777776444   33333444444322110   100000 0   00000000 11234


Q ss_pred             CCCcCCCccccCHHHHHHHHh
Q 006036          567 PPWAHGPGYIISRDIAKFIVQ  587 (663)
Q Consensus       567 PpYc~G~GYVLSrdla~~I~~  587 (663)
                      .+++.|.++++++++++.+--
T Consensus       151 ~~~~~g~~~~~~~~~~~~~gg  171 (180)
T cd06423         151 VLVLSGAFGAFRREALREVGG  171 (180)
T ss_pred             eeecCchHHHHHHHHHHHhCC
Confidence            567889999999999887653


No 24 
>cd06421 CESA_CelA_like CESA_CelA_like are involved in the elongation of the glucan chain of cellulose. Family of proteins related to  Agrobacterium tumefaciens CelA and  Gluconacetobacter xylinus BscA. These proteins are involved in the elongation of the glucan chain of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues. They are putative catalytic subunit of cellulose synthase, which is a glycosyltransferase using UDP-glucose as the substrate. The catalytic subunit is an integral membrane protein with 6 transmembrane segments and it is postulated that the protein is anchored in the membrane at the N-terminal end.
Probab=88.57  E-value=2.4  Score=41.84  Aligned_cols=117  Identities=14%  Similarity=0.110  Sum_probs=65.9

Q ss_pred             hhhccCCCcEEEEeCCceeeeHHHHHHHhhc-C--CCCCeeEEeeeCC-CCC----ccCC--CCCcccCCCCCC-CCCCC
Q 006036          499 FGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-K--PSNGLLFGLMSYD-SSP----QRDK--DSKWYISNEEWP-HSSYP  567 (663)
Q Consensus       499 w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~--~~~~ly~G~v~~~-~~P----~Rd~--~~KwyVs~eeyp-~~~YP  567 (663)
                      .+.+..+.+|++.+|+|+++..+.|...+.. .  +.-....|..... ...    .+..  ....+....... .....
T Consensus        78 ~~~~~a~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  157 (234)
T cd06421          78 NALAHTTGDFVAILDADHVPTPDFLRRTLGYFLDDPKVALVQTPQFFYNPDPFDWLADGAPNEQELFYGVIQPGRDRWGA  157 (234)
T ss_pred             HHHHhCCCCEEEEEccccCcCccHHHHHHHHHhcCCCeEEEecceEEecCCcchhHHHHHHHHHHHHHHHHHHHHhhcCC
Confidence            3444447899999999999999888887766 2  3223344432211 100    0000  000000000000 01124


Q ss_pred             CCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccC
Q 006036          568 PWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSD  623 (663)
Q Consensus       568 pYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~  623 (663)
                      .++.|++.++++++++.+--- .    ..+..||..++.-+.+.   |..+.+..+
T Consensus       158 ~~~~g~~~~~r~~~~~~ig~~-~----~~~~~eD~~l~~r~~~~---g~~i~~~~~  205 (234)
T cd06421         158 AFCCGSGAVVRREALDEIGGF-P----TDSVTEDLATSLRLHAK---GWRSVYVPE  205 (234)
T ss_pred             ceecCceeeEeHHHHHHhCCC-C----ccceeccHHHHHHHHHc---CceEEEecC
Confidence            567899999999999887532 1    23457999999877765   455655443


No 25 
>cd06433 GT_2_WfgS_like WfgS and WfeV are involved in O-antigen biosynthesis. Escherichia coli WfgS and Shigella dysenteriae WfeV are glycosyltransferase 2 family enzymes involved in O-antigen biosynthesis. GT-2 enzymes have GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=88.29  E-value=6  Score=37.46  Aligned_cols=110  Identities=9%  Similarity=-0.047  Sum_probs=65.0

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCC
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGP  573 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~  573 (663)
                      +..+....+.+|++..|+|.++..+.+...+..   .+...+++|........... ...+.........-....++.|+
T Consensus        67 ~n~~~~~a~~~~v~~ld~D~~~~~~~~~~~~~~~~~~~~~~~v~g~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~  145 (202)
T cd06433          67 MNKGIALATGDIIGFLNSDDTLLPGALLAVVAAFAEHPEVDVVYGDVLLVDENGRV-IGRRRPPPFLDKFLLYGMPICHQ  145 (202)
T ss_pred             HHHHHHHcCCCEEEEeCCCcccCchHHHHHHHHHHhCCCccEEEeeeEEEcCCCCc-ccCCCCcchhhhHHhhcCcccCc
Confidence            445555567899999999999998888887733   45566777765421111111 01111111111222235667888


Q ss_pred             ccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          574 GYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       574 GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      +.++++++.+.+-. +. ..  +...||..+..-+...
T Consensus       146 ~~~~~~~~~~~~~~-f~-~~--~~~~~D~~~~~r~~~~  179 (202)
T cd06433         146 ATFFRRSLFEKYGG-FD-ES--YRIAADYDLLLRLLLA  179 (202)
T ss_pred             ceEEEHHHHHHhCC-Cc-hh--hCchhhHHHHHHHHHc
Confidence            99999999988753 21 11  2345788766665554


No 26 
>PF00535 Glycos_transf_2:  Glycosyl transferase family 2;  InterPro: IPR001173 The biosynthesis of disaccharides, oligosaccharides and polysaccharides involves the action of hundreds of different glycosyltransferases. These enzymes catalyse the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. A classification of glycosyltransferases using nucleotide diphospho-sugar, nucleotide monophospho-sugar and sugar phosphates (2.4.1.- from EC) and related proteins into distinct sequence based families has been described []. This classification is available on the CAZy (CArbohydrate-Active EnZymes) web site. The same three-dimensional fold is expected to occur within each of the families. Because 3-D structures are better conserved than sequences, several of the families defined on the basis of sequence similarities may have similar 3-D structures and therefore form 'clans'. This domain is found in a diverse family of glycosyl transferases that transfer the sugar from UDP-glucose, UDP-N-acetyl-galactosamine, GDP-mannose or CDP-abequose, to a range of substrates including cellulose, dolichol phosphate and teichoic acids.; PDB: 2Z87_A 2Z86_B 2D7R_A 2D7I_A 3CKN_A 3CKQ_A 3CKJ_A 3CKV_A 3CKO_A 2FFU_A ....
Probab=87.52  E-value=3.5  Score=37.40  Aligned_cols=155  Identities=16%  Similarity=0.133  Sum_probs=74.9

Q ss_pred             EEEEecCCCcHHHH-HHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHH
Q 006036          418 LIGVFSTGNNFERR-MALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAI  496 (663)
Q Consensus       418 lI~V~Sa~~n~~rR-~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~  496 (663)
                      +|.+.-.+....+- ..+++.  .     .....++++-..+ ++.....+++-.+....+..+...+.. .    .-..
T Consensus         3 vip~~n~~~~l~~~l~sl~~q--~-----~~~~eiivvdd~s-~d~~~~~~~~~~~~~~~i~~i~~~~n~-g----~~~~   69 (169)
T PF00535_consen    3 VIPTYNEAEYLERTLESLLKQ--T-----DPDFEIIVVDDGS-TDETEEILEEYAESDPNIRYIRNPENL-G----FSAA   69 (169)
T ss_dssp             EEEESS-TTTHHHHHHHHHHH--S-----GCEEEEEEEECS--SSSHHHHHHHHHCCSTTEEEEEHCCCS-H----HHHH
T ss_pred             EEEeeCCHHHHHHHHHHHhhc--c-----CCCEEEEEecccc-ccccccccccccccccccccccccccc-c----cccc
Confidence            33344344444443 457766  1     1234444444333 444444444444435566655554433 1    1222


Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCc---ccCC-----CCCCCCCC
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKW---YISN-----EEWPHSSY  566 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~Kw---yVs~-----eeyp~~~Y  566 (663)
                      +..+......+|++.+|||.++..+.|..++..  ......++|.........+......   +...     .......-
T Consensus        70 ~n~~~~~a~~~~i~~ld~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  149 (169)
T PF00535_consen   70 RNRGIKHAKGEYILFLDDDDIISPDWLEELVEALEKNPPDVVIGSVIYIDDDNRYPDRRLRFSFWNRFERKIFNNIRFWK  149 (169)
T ss_dssp             HHHHHHH--SSEEEEEETTEEE-TTHHHHHHHHHHHCTTEEEEEEEEEEECTTETEECCCTSEEEECCHCHHHHTTHSTT
T ss_pred             ccccccccceeEEEEeCCCceEcHHHHHHHHHHHHhCCCcEEEEEEEEecCCccccccccchhhhhhhhhHHHHhhhcCC
Confidence            334444456679999999999998866666655  3334455555432211111100110   0000     01111223


Q ss_pred             CCCcCCCccccCHHHHHHH
Q 006036          567 PPWAHGPGYIISRDIAKFI  585 (663)
Q Consensus       567 PpYc~G~GYVLSrdla~~I  585 (663)
                      -+|+.|++.++++++.+++
T Consensus       150 ~~~~~~~~~~~rr~~~~~~  168 (169)
T PF00535_consen  150 ISFFIGSCALFRRSVFEEI  168 (169)
T ss_dssp             SSEESSSCEEEEEHHHHHC
T ss_pred             cccccccEEEEEHHHHHhh
Confidence            4677899999999988764


No 27 
>cd06435 CESA_NdvC_like NdvC_like  proteins in this family are putative bacterial beta-(1,6)-glucosyltransferase. NdvC_like  proteins in this family are putative bacterial beta-(1,6)-glucosyltransferase. Bradyrhizobium japonicum synthesizes periplasmic cyclic beta-(1,3),beta-(1,6)-D-glucans during growth under hypoosmotic conditions. Two genes (ndvB, ndvC) are involved in the beta-(1, 3), beta-(1,6)-glucan synthesis. The ndvC mutant strain resulted in synthesis of altered cyclic beta-glucans composed almost entirely of beta-(1, 3)-glycosyl linkages. The periplasmic cyclic beta-(1,3),beta-(1,6)-D-glucans function for osmoregulation. The ndvC mutation also affects the ability of the bacteria to establish a successful symbiotic interaction with host plant. Thus, the beta-glucans may function as suppressors of a host defense response.
Probab=87.50  E-value=8.1  Score=38.40  Aligned_cols=176  Identities=15%  Similarity=0.138  Sum_probs=88.6

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcC-CEEEEeecccCCcchHHHHHHHHhhhcc--CCCcEEEEeCCceeeeHHHHH
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYG-DIQIMPFVDYYSLISLKTIAICIFGTKI--LPAKYIMKTDDDAFVRIDEVL  524 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~yg-DII~ldf~DsY~nLtlKtla~l~w~~~~--~~akyvlKvDDDtfVnvd~Ll  524 (663)
                      .+.++++-+.+.+......+++=.++++ ++..+...   .|.-.|. ..+.++...  .+.+|++..|+|+.+..+.|.
T Consensus        28 ~~eiiVvdd~s~D~t~~~~i~~~~~~~~~~i~~i~~~---~~~G~~~-~a~n~g~~~a~~~~d~i~~lD~D~~~~~~~l~  103 (236)
T cd06435          28 NFEVIVIDNNTKDEALWKPVEAHCAQLGERFRFFHVE---PLPGAKA-GALNYALERTAPDAEIIAVIDADYQVEPDWLK  103 (236)
T ss_pred             CcEEEEEeCCCCchhHHHHHHHHHHHhCCcEEEEEcC---CCCCCch-HHHHHHHHhcCCCCCEEEEEcCCCCcCHHHHH
Confidence            4555555555555443333322222333 45443322   2222232 234444333  247999999999999999888


Q ss_pred             HHhhc-C-CCCCeeEEeeeCCCCCccCCCCCcccCC--CCC----------CCCCCCCCcCCCccccCHHHHHHHHhhhc
Q 006036          525 SNLKE-K-PSNGLLFGLMSYDSSPQRDKDSKWYISN--EEW----------PHSSYPPWAHGPGYIISRDIAKFIVQGHQ  590 (663)
Q Consensus       525 ~~L~~-~-~~~~ly~G~v~~~~~P~Rd~~~KwyVs~--eey----------p~~~YPpYc~G~GYVLSrdla~~I~~~~~  590 (663)
                      ..+.. . +.-.++.|...     .++....++...  ..|          ....--.++.|++.++++++.+.+-- +.
T Consensus       104 ~l~~~~~~~~~~~v~~~~~-----~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~~~~rr~~~~~iGg-f~  177 (236)
T cd06435         104 RLVPIFDDPRVGFVQAPQD-----YRDGEESLFKRMCYAEYKGFFDIGMVSRNERNAIIQHGTMCLIRRSALDDVGG-WD  177 (236)
T ss_pred             HHHHHhcCCCeeEEecCcc-----ccCCCccHHHHHHhHHHHHHHHHHhccccccCceEEecceEEEEHHHHHHhCC-CC
Confidence            88766 2 22223333211     111111111000  000          00000135678889999999998743 21


Q ss_pred             ccccCCCCcchhHHHHHHHHhhcCCCeeeeccCCccccCCcccceEEEEecCHHHHHHHHHH
Q 006036          591 ERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDDRFYNAGCESDYILAHYQGPRMVLCLWEK  652 (663)
Q Consensus       591 ~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf~~~~C~~~~I~~Hy~sP~~M~~lW~~  652 (663)
                       .   .+..||+-++.-+.+.   |..+.+..+            ...|...|..+..++++
T Consensus       178 -~---~~~~eD~dl~~r~~~~---G~~~~~~~~------------~~~~~~~~~~~~~~~~q  220 (236)
T cd06435         178 -E---WCITEDSELGLRMHEA---GYIGVYVAQ------------SYGHGLIPDTFEAFKKQ  220 (236)
T ss_pred             -C---ccccchHHHHHHHHHC---CcEEEEcch------------hhccCcCcccHHHHHHH
Confidence             1   2348999998877765   445554332            12344566666555554


No 28 
>PRK11204 N-glycosyltransferase; Provisional
Probab=87.47  E-value=26  Score=38.62  Aligned_cols=186  Identities=13%  Similarity=0.048  Sum_probs=97.5

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      .+.+-|+|++.-+...-++.|+.-=.+    ......+ +++....+++..+.+++.+++|..+..+...+   |. .|.
T Consensus        53 ~p~vsViIp~yne~~~i~~~l~sl~~q----~yp~~ei-iVvdD~s~d~t~~~l~~~~~~~~~v~~i~~~~---n~-Gka  123 (420)
T PRK11204         53 YPGVSILVPCYNEGENVEETISHLLAL----RYPNYEV-IAINDGSSDNTGEILDRLAAQIPRLRVIHLAE---NQ-GKA  123 (420)
T ss_pred             CCCEEEEEecCCCHHHHHHHHHHHHhC----CCCCeEE-EEEECCCCccHHHHHHHHHHhCCcEEEEEcCC---CC-CHH
Confidence            345667777654433333333332211    1123343 44544444444555666666677676555332   32 243


Q ss_pred             HHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccC--CCCCCC-----
Q 006036          494 IAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYIS--NEEWPH-----  563 (663)
Q Consensus       494 la~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs--~eeyp~-----  563 (663)
                      - .+..+.+..+.+|++..|+|+.+..+.|...++.   ++.-..+.|....     ++.. .|.-.  ..+|..     
T Consensus       124 ~-aln~g~~~a~~d~i~~lDaD~~~~~d~L~~l~~~~~~~~~v~~v~g~~~~-----~~~~-~~~~~~~~~~~~~~~~~~  196 (420)
T PRK11204        124 N-ALNTGAAAARSEYLVCIDGDALLDPDAAAYMVEHFLHNPRVGAVTGNPRI-----RNRS-TLLGRIQVGEFSSIIGLI  196 (420)
T ss_pred             H-HHHHHHHHcCCCEEEEECCCCCCChhHHHHHHHHHHhCCCeEEEECCcee-----ccch-hHHHHHHHHHHHHhhhHH
Confidence            3 2445555568899999999999999988887765   3322233332211     1110 00000  000100     


Q ss_pred             ----CC--CCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccC
Q 006036          564 ----SS--YPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSD  623 (663)
Q Consensus       564 ----~~--YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~  623 (663)
                          ..  .+..++|++.++.+++++.+---     -...-.||+.++.-+.+.   |..+.|..+
T Consensus       197 ~~~~~~~~~~~~~~G~~~~~rr~~l~~vgg~-----~~~~~~ED~~l~~rl~~~---G~~i~~~p~  254 (420)
T PRK11204        197 KRAQRVYGRVFTVSGVITAFRKSALHEVGYW-----STDMITEDIDISWKLQLR---GWDIRYEPR  254 (420)
T ss_pred             HHHHHHhCCceEecceeeeeeHHHHHHhCCC-----CCCcccchHHHHHHHHHc---CCeEEeccc
Confidence                00  12234788899999998876321     112346999998887754   556665443


No 29 
>cd02525 Succinoglycan_BP_ExoA ExoA is involved in the biosynthesis of succinoglycan. Succinoglycan Biosynthesis Protein ExoA catalyzes the formation of a beta-1,3 linkage of the second sugar (glucose) of the succinoglycan with the galactose on the lipid carrie. Succinoglycan is an acidic exopolysaccharide that is important for invasion of the nodules. Succinoglycan is a high-molecular-weight polymer composed of repeating octasaccharide units. These units are synthesized on membrane-bound isoprenoid lipid carriers, beginning with galactose followed by seven glucose molecules, and modified by the addition of acetate, succinate, and pyruvate. ExoA is a membrane protein with a transmembrance domain at c-terminus.
Probab=87.40  E-value=32  Score=34.00  Aligned_cols=159  Identities=12%  Similarity=0.038  Sum_probs=79.5

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHh
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNL  527 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L  527 (663)
                      .+.++.+-+.+.+ +....++...+++..+....-...    . +. ..+..+....+.+|++.+|||..+..+.|...+
T Consensus        31 ~~evivvd~~s~d-~~~~~~~~~~~~~~~v~~i~~~~~----~-~~-~a~N~g~~~a~~d~v~~lD~D~~~~~~~l~~~~  103 (249)
T cd02525          31 LIEIIVVDGGSTD-GTREIVQEYAAKDPRIRLIDNPKR----I-QS-AGLNIGIRNSRGDIIIRVDAHAVYPKDYILELV  103 (249)
T ss_pred             ccEEEEEeCCCCc-cHHHHHHHHHhcCCeEEEEeCCCC----C-ch-HHHHHHHHHhCCCEEEEECCCccCCHHHHHHHH
Confidence            4555555444443 334444544444444544432211    1 11 234555555589999999999999987777777


Q ss_pred             hc--CCCCCeeEEeeeCC-CCCccC-----CCCCcccCCCCC--CCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCC
Q 006036          528 KE--KPSNGLLFGLMSYD-SSPQRD-----KDSKWYISNEEW--PHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLF  597 (663)
Q Consensus       528 ~~--~~~~~ly~G~v~~~-~~P~Rd-----~~~KwyVs~eey--p~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f  597 (663)
                      ..  .+......|..... ..+...     ....+......+  .....-.++.|++.++++++.+++.-. . .  ...
T Consensus       104 ~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~-~-~--~~~  179 (249)
T cd02525         104 EALKRTGADNVGGPMETIGESKFQKAIAVAQSSPLGSGGSAYRGGAVKIGYVDTVHHGAYRREVFEKVGGF-D-E--SLV  179 (249)
T ss_pred             HHHhcCCCCEEecceecCCCChHHHHHHHHhhchhccCCccccccccccccccccccceEEHHHHHHhCCC-C-c--ccC
Confidence            55  33333444543221 111100     000000000000  000001145788889999998877431 1 1  233


Q ss_pred             CcchhHHHHHHHHhhcCCCeeee
Q 006036          598 KLEDVAMGIWIEQFKNTGQEVHY  620 (663)
Q Consensus       598 ~lEDV~iGi~L~~l~~~gi~v~~  620 (663)
                      ..||..++.-+.+.   |..+.+
T Consensus       180 ~~eD~~l~~r~~~~---G~~~~~  199 (249)
T cd02525         180 RNEDAELNYRLRKA---GYKIWL  199 (249)
T ss_pred             ccchhHHHHHHHHc---CcEEEE
Confidence            46999988766654   445543


No 30 
>cd06434 GT2_HAS Hyaluronan synthases catalyze polymerization of hyaluronan. Hyaluronan synthases (HASs) are bi-functional glycosyltransferases that catalyze polymerization of hyaluronan. HASs transfer both GlcUA and GlcNAc in beta-(1,3) and beta-(1,4) linkages, respectively to the hyaluronan chain using UDP-GlcNAc and UDP-GlcUA as substrates. HA is made as a free glycan, not attached to a protein or lipid. HASs do not need a primer for HA synthesis; they initiate HA biosynthesis de novo with only UDP-GlcNAc, UDP-GlcUA, and Mg2+. Hyaluronan (HA) is a linear heteropolysaccharide composed of (1-3)-linked beta-D-GlcUA-beta-D-GlcNAc disaccharide repeats. It can be found in vertebrates and a few microbes and is typically on the cell surface or in the extracellular space, but is also found inside mammalian cells. Hyaluronan has several physiochemical and biological functions such as space filling, lubrication, and providing a hydrated matrix through which cells can migrate.
Probab=87.35  E-value=14  Score=36.47  Aligned_cols=156  Identities=17%  Similarity=0.142  Sum_probs=79.3

Q ss_pred             eEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhh
Q 006036          449 LAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLK  528 (663)
Q Consensus       449 V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~  528 (663)
                      ..++++...+.++ ....| ++...+..+....- +   + ..|.-+ +..+....+.+|++.+|+|+.+..+.|.+.+.
T Consensus        29 ~eiivvdd~s~d~-~~~~l-~~~~~~~~~~v~~~-~---~-~g~~~a-~n~g~~~a~~d~v~~lD~D~~~~~~~l~~l~~  100 (235)
T cd06434          29 LEIIVVTDGDDEP-YLSIL-SQTVKYGGIFVITV-P---H-PGKRRA-LAEGIRHVTTDIVVLLDSDTVWPPNALPEMLK  100 (235)
T ss_pred             CEEEEEeCCCChH-HHHHH-HhhccCCcEEEEec-C---C-CChHHH-HHHHHHHhCCCEEEEECCCceeChhHHHHHHH
Confidence            4454454444333 33333 34555666655541 1   1 224332 23344445899999999999999999888776


Q ss_pred             c-C-CCCCeeEEeeeCCCCCccCCCCCc------ccCC-------CCCCCCCCCCCcCCCccccCHHHHHHHHhhhc---
Q 006036          529 E-K-PSNGLLFGLMSYDSSPQRDKDSKW------YISN-------EEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQ---  590 (663)
Q Consensus       529 ~-~-~~~~ly~G~v~~~~~P~Rd~~~Kw------yVs~-------eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~---  590 (663)
                      . . +.-....|......    ...+.|      +...       ...... --+++.|++.++.+++++.+.-...   
T Consensus       101 ~~~~~~v~~v~~~~~~~~----~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~G~~~~~rr~~l~~~~~~~~~~~  175 (235)
T cd06434         101 PFEDPKVGGVGTNQRILR----PRDSKWSFLAAEYLERRNEEIRAAMSYDG-GVPCLSGRTAAYRTEILKDFLFLEEFTN  175 (235)
T ss_pred             hccCCCEeEEcCceEeec----CcccHHHHHHHHHHHHHHHHHHHHHhhCC-CEEEccCcHHHHHHHHHhhhhhHHHhhh
Confidence            6 3 22223333322111    001111      0000       000001 1134578888899998887643210   


Q ss_pred             --ccccCCCCcchhHHHHHHHHhhcCCCeeee
Q 006036          591 --ERDLKLFKLEDVAMGIWIEQFKNTGQEVHY  620 (663)
Q Consensus       591 --~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~  620 (663)
                        -...+...-||..++.-+.+.   |..+.|
T Consensus       176 ~~~~~~~~~~~eD~~l~~~~~~~---g~~~~~  204 (235)
T cd06434         176 ETFMGRRLNAGDDRFLTRYVLSH---GYKTVY  204 (235)
T ss_pred             hhhcCCCCCcCchHHHHHHHHHC---CCeEEE
Confidence              001133467999998877654   444544


No 31 
>cd02510 pp-GalNAc-T pp-GalNAc-T initiates the formation of mucin-type O-linked glycans. UDP-GalNAc: polypeptide alpha-N-acetylgalactosaminyltransferases (pp-GalNAc-T) initiate the formation of mucin-type, O-linked glycans by catalyzing the transfer of alpha-N-acetylgalactosamine (GalNAc) from UDP-GalNAc to hydroxyl groups of Ser or Thr residues of core proteins to form the Tn antigen (GalNAc-a-1-O-Ser/Thr). These enzymes are type II membrane proteins with a GT-A type catalytic domain and a lectin domain located on the lumen side of the Golgi apparatus. In human, there are 15 isozymes of pp-GalNAc-Ts, representing the largest of all glycosyltransferase families. Each isozyme has unique but partially redundant substrate specificity for glycosylation sites on acceptor proteins.
Probab=86.75  E-value=32  Score=36.08  Aligned_cols=113  Identities=14%  Similarity=0.150  Sum_probs=60.8

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCC------CCccC---------CCCCcccCCC
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDS------SPQRD---------KDSKWYISNE  559 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~------~P~Rd---------~~~KwyVs~e  559 (663)
                      ...+......+|++..|+|+.+..+-|..++..  ........|.+....      .....         -...|.....
T Consensus        75 ~N~g~~~A~gd~i~fLD~D~~~~~~wL~~ll~~l~~~~~~~v~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  154 (299)
T cd02510          75 RIAGARAATGDVLVFLDSHCEVNVGWLEPLLARIAENRKTVVCPIIDVIDADTFEYRGSSGDARGGFDWSLHFKWLPLPE  154 (299)
T ss_pred             HHHHHHHccCCEEEEEeCCcccCccHHHHHHHHHHhCCCeEEEeeeccccCCCeeEecCCCceeEEecccceeccccCCH
Confidence            445555557899999999999987776666654  222223333221100      00000         0001111000


Q ss_pred             -----CCC-CCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          560 -----EWP-HSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       560 -----eyp-~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                           ..+ ....-+++.|++.++++++...+-- + ...+.....||+-+..-+.+.
T Consensus       155 ~~~~~~~~~~~~~~~~~~g~~~~irr~~~~~vGg-f-De~~~~~~~ED~Dl~~R~~~~  210 (299)
T cd02510         155 EERRRESPTAPIRSPTMAGGLFAIDREWFLELGG-Y-DEGMDIWGGENLELSFKVWQC  210 (299)
T ss_pred             HHhhhcCCCCCccCccccceeeEEEHHHHHHhCC-C-CCcccccCchhHHHHHHHHHc
Confidence                 001 1223467789999999999998853 2 123333347999876655544


No 32 
>COG1215 Glycosyltransferases, probably involved in cell wall biogenesis [Cell envelope biogenesis, outer membrane]
Probab=86.65  E-value=25  Score=38.49  Aligned_cols=194  Identities=13%  Similarity=0.047  Sum_probs=108.9

Q ss_pred             eEEEEEEecCCCcH-HHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          415 LVMLIGVFSTGNNF-ERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       415 v~LlI~V~Sa~~n~-~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      +.+-|+|++--... --.+.++..=.+.    -....+..+...+ .++..+.+++-.+++++.+.+...  -.....| 
T Consensus        54 p~vsviiP~ynE~~~~~~~~l~s~~~~d----yp~~evivv~d~~-~d~~~~~~~~~~~~~~~~~~~~~~--~~~~~gK-  125 (439)
T COG1215          54 PKVSVIIPAYNEEPEVLEETLESLLSQD----YPRYEVIVVDDGS-TDETYEILEELGAEYGPNFRVIYP--EKKNGGK-  125 (439)
T ss_pred             CceEEEEecCCCchhhHHHHHHHHHhCC----CCCceEEEECCCC-ChhHHHHHHHHHhhcCcceEEEec--cccCccc-
Confidence            66777888766554 3344444443331    1224554454433 344455566666677644444411  0121222 


Q ss_pred             HHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCc-cCCCCCc----ccCC----CCCC
Q 006036          494 IAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQ-RDKDSKW----YISN----EEWP  562 (663)
Q Consensus       494 la~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~-Rd~~~Kw----yVs~----eeyp  562 (663)
                      ...+.++.+..+.++++..|.|+.+..+.|.+.+..  .+....+.|.......+. .+..++-    |...    ..+.
T Consensus       126 ~~al~~~l~~~~~d~V~~~DaD~~~~~d~l~~~~~~f~~~~~~~v~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~  205 (439)
T COG1215         126 AGALNNGLKRAKGDVVVILDADTVPEPDALRELVSPFEDPPVGAVVGTPRIRNRPDPSNLLGRIQAIEYLSAFYFRLRAA  205 (439)
T ss_pred             hHHHHHHHhhcCCCEEEEEcCCCCCChhHHHHHHhhhcCCCeeEEeCCceeeecCChhhhcchhcchhhhhhHHHhhhhh
Confidence            234566666667999999999999999999999887  222222444332111110 0000010    0000    0001


Q ss_pred             -CCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccCC
Q 006036          563 -HSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDD  624 (663)
Q Consensus       563 -~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~  624 (663)
                       ......+|.|++.++-+++++.+-.     .....--||..+++.+...   |..+.|..+.
T Consensus       206 ~~~g~~~~~~G~~~~~rr~aL~~~g~-----~~~~~i~ED~~lt~~l~~~---G~~~~~~~~~  260 (439)
T COG1215         206 SKGGLISFLSGSSSAFRRSALEEVGG-----WLEDTITEDADLTLRLHLR---GYRVVYVPEA  260 (439)
T ss_pred             hhcCCeEEEcceeeeEEHHHHHHhCC-----CCCCceeccHHHHHHHHHC---CCeEEEeecc
Confidence             1125788999999999999999873     2234456999999999843   5667666544


No 33 
>PRK14583 hmsR N-glycosyltransferase; Provisional
Probab=86.33  E-value=20  Score=40.28  Aligned_cols=183  Identities=13%  Similarity=0.090  Sum_probs=98.2

Q ss_pred             eEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHH
Q 006036          415 LVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTI  494 (663)
Q Consensus       415 v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtl  494 (663)
                      +.+-|+|++.-+...-++.|+.- .+.   ...+..+ +++..+.++...+.+++..+++..+.......   |. .|. 
T Consensus        75 p~vsViIP~yNE~~~i~~~l~sl-l~q---~yp~~eI-ivVdDgs~D~t~~~~~~~~~~~~~v~vv~~~~---n~-Gka-  144 (444)
T PRK14583         75 PLVSILVPCFNEGLNARETIHAA-LAQ---TYTNIEV-IAINDGSSDDTAQVLDALLAEDPRLRVIHLAH---NQ-GKA-  144 (444)
T ss_pred             CcEEEEEEeCCCHHHHHHHHHHH-HcC---CCCCeEE-EEEECCCCccHHHHHHHHHHhCCCEEEEEeCC---CC-CHH-
Confidence            45667777665443334444332 121   1124554 44433333444455555566777665554322   22 243 


Q ss_pred             HHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCC---CCcccCCCCCCC-----
Q 006036          495 AICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKD---SKWYISNEEWPH-----  563 (663)
Q Consensus       495 a~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~---~KwyVs~eeyp~-----  563 (663)
                      ..++.+....+.+|++..|+|+.+..+.|...+..   ++.-..+.|....     ++..   ++...  .+|..     
T Consensus       145 ~AlN~gl~~a~~d~iv~lDAD~~~~~d~L~~lv~~~~~~~~~g~v~g~~~~-----~~~~~~~~~~~~--~e~~~~~~~~  217 (444)
T PRK14583        145 IALRMGAAAARSEYLVCIDGDALLDKNAVPYLVAPLIANPRTGAVTGNPRI-----RTRSTLIGRVQV--GEFSSIIGLI  217 (444)
T ss_pred             HHHHHHHHhCCCCEEEEECCCCCcCHHHHHHHHHHHHhCCCeEEEEcccee-----cCCCcchhhHHH--HHHHHHHHHH
Confidence            23455655668999999999999999988887765   3333333343211     1111   11100  01100     


Q ss_pred             ----CCC--CCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          564 ----SSY--PPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       564 ----~~Y--PpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                          ..|  +..++|.+.++.+++++++--.     -...-.||..+|.-+...   |..+.|..
T Consensus       218 ~~~~~~~g~~~~~sG~~~~~rr~al~~vGg~-----~~~~i~ED~dl~~rl~~~---G~~i~~~p  274 (444)
T PRK14583        218 KRTQRVYGQVFTVSGVVAAFRRRALADVGYW-----SPDMITEDIDISWKLQLK---HWSVFFEP  274 (444)
T ss_pred             HHHHHHhCCceEecCceeEEEHHHHHHcCCC-----CCCcccccHHHHHHHHHc---CCeEEEee
Confidence                011  2235788899999998887421     112346999999998865   44555544


No 34 
>cd04184 GT2_RfbC_Mx_like Myxococcus xanthus RfbC like proteins are required for O-antigen biosynthesis. The rfbC gene encodes a predicted protein of 1,276 amino acids, which is required for O-antigen biosynthesis in Myxococcus xanthus. It is a subfamily of Glycosyltransferase Family GT2, which includes diverse families of glycosyl transferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds.
Probab=84.97  E-value=37  Score=32.52  Aligned_cols=158  Identities=11%  Similarity=0.095  Sum_probs=78.0

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHh
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNL  527 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L  527 (663)
                      .+.++.+-..+.+..+...+......+..+..... +.-...    -..+..+......+|++..|+|..+..+.|...+
T Consensus        31 ~~eiivvd~gs~d~~~~~~~~~~~~~~~~~~~~~~-~~~~g~----~~a~n~g~~~a~~d~i~~ld~D~~~~~~~l~~~~  105 (202)
T cd04184          31 NWELCIADDASTDPEVKRVLKKYAAQDPRIKVVFR-EENGGI----SAATNSALELATGEFVALLDHDDELAPHALYEVV  105 (202)
T ss_pred             CeEEEEEeCCCCChHHHHHHHHHHhcCCCEEEEEc-ccCCCH----HHHHHHHHHhhcCCEEEEECCCCcCChHHHHHHH
Confidence            35555554555454443334433444444433322 211111    1233445455678999999999999988777776


Q ss_pred             hc---CCCCCeeEEeeeCCCCCccCCCCCcccCC--CCCCCCC-CCCCcCCCccccCHHHHHHHHhhhcccccCCCCcch
Q 006036          528 KE---KPSNGLLFGLMSYDSSPQRDKDSKWYISN--EEWPHSS-YPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLED  601 (663)
Q Consensus       528 ~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~--eeyp~~~-YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lED  601 (663)
                      ..   .+.-.+++|......     ..+..+-+.  ..|.... +..-+.|++-++++++++.+-- +..   .+...||
T Consensus       106 ~~~~~~~~~~~v~~~~~~~~-----~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~igg-f~~---~~~~~eD  176 (202)
T cd04184         106 KALNEHPDADLIYSDEDKID-----EGGKRSEPFFKPDWSPDLLLSQNYIGHLLVYRRSLVRQVGG-FRE---GFEGAQD  176 (202)
T ss_pred             HHHHhCCCCCEEEccHHhcc-----CCCCEeccccCCCCCHHHhhhcCCccceEeEEHHHHHHhCC-CCc---Ccccchh
Confidence            55   344456655432211     001111000  0111111 1111234555788888877643 111   2335799


Q ss_pred             hHHHHHHHHhhcCCCeeeecc
Q 006036          602 VAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       602 V~iGi~L~~l~~~gi~v~~~~  622 (663)
                      ..+++-+.+.   |..+.+..
T Consensus       177 ~~l~~rl~~~---g~~~~~~~  194 (202)
T cd04184         177 YDLVLRVSEH---TDRIAHIP  194 (202)
T ss_pred             HHHHHHHHhc---cceEEEcc
Confidence            9887766554   44554433


No 35 
>PF13506 Glyco_transf_21:  Glycosyl transferase family 21
Probab=84.85  E-value=1.2  Score=43.97  Aligned_cols=104  Identities=21%  Similarity=0.227  Sum_probs=65.8

Q ss_pred             CCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCC---CcccC--CCCCCCCCCCCCcCCCccc
Q 006036          504 LPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDS---KWYIS--NEEWPHSSYPPWAHGPGYI  576 (663)
Q Consensus       504 ~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~---KwyVs--~eeyp~~~YPpYc~G~GYV  576 (663)
                      .+.++++..|+|+.|+.+.|...+..  ++.-.+..|...  ..|.+.-.+   .-++.  ...+..-.-.++|.|+.++
T Consensus        30 a~~d~~~~~DsDi~v~p~~L~~lv~~l~~p~vglVt~~~~--~~~~~~~~~~l~~~~~~~~~~~~~a~~~~~~~~G~~m~  107 (175)
T PF13506_consen   30 AKYDYLVISDSDIRVPPDYLRELVAPLADPGVGLVTGLPR--GVPARGFWSRLEAAFFNFLPGVLQALGGAPFAWGGSMA  107 (175)
T ss_pred             CCCCEEEEECCCeeECHHHHHHHHHHHhCCCCcEEEeccc--ccCCcCHHHHHHHHHHhHHHHHHHHhcCCCceecceee
Confidence            68899999999999999999988877  445555544222  112221000   01110  0000001246889999999


Q ss_pred             cCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          577 ISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       577 LSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      +.+++++.+-- +  ..+...--||.++|..+.+.+
T Consensus       108 ~rr~~L~~~GG-~--~~l~~~ladD~~l~~~~~~~G  140 (175)
T PF13506_consen  108 FRREALEEIGG-F--EALADYLADDYALGRRLRARG  140 (175)
T ss_pred             eEHHHHHHccc-H--HHHhhhhhHHHHHHHHHHHCC
Confidence            99999998732 1  123345689999999999864


No 36 
>cd04185 GT_2_like_b Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=84.70  E-value=11  Score=36.56  Aligned_cols=87  Identities=20%  Similarity=0.141  Sum_probs=54.3

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc-C-CCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCc
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-K-PSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPG  574 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~-~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~G  574 (663)
                      +.++. ..+.+|++..|||..+..+.|...+.. . +.-..+.|.....     +  +                  .++|
T Consensus        72 ~~~a~-~~~~d~v~~ld~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~-----~--~------------------~~~~  125 (202)
T cd04185          72 VRRAY-ELGYDWIWLMDDDAIPDPDALEKLLAYADKDNPQFLAPLVLDP-----D--G------------------SFVG  125 (202)
T ss_pred             HHHHh-ccCCCEEEEeCCCCCcChHHHHHHHHHHhcCCceEecceeEcC-----C--C------------------ceEE
Confidence            44444 457899999999999998777666655 3 3333444433221     0  1                  3456


Q ss_pred             cccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          575 YIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       575 YVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      .++.+++.+.+--.  .... ....||+.++.-+.+.+
T Consensus       126 ~~~~~~~~~~~g~~--~~~~-~~~~eD~~~~~r~~~~G  160 (202)
T cd04185         126 VLISRRVVEKIGLP--DKEF-FIWGDDTEYTLRASKAG  160 (202)
T ss_pred             EEEeHHHHHHhCCC--Chhh-hccchHHHHHHHHHHcC
Confidence            78999998877321  1111 23469999988877653


No 37 
>cd06532 Glyco_transf_25 Glycosyltransferase family 25 [lipooligosaccharide (LOS) biosynthesis protein] is a family of glycosyltransferases involved in LOS biosynthesis. The members include the beta(1,4) galactosyltransferases: Lgt2 of Moraxella catarrhalis, LgtB and LgtE of Neisseria gonorrhoeae and Lic2A of Haemophilus influenzae. M. catarrhalis Lgt2 catalyzes the addition of galactose (Gal) to the growing chain of LOS on the cell surface. N. gonorrhoeae LgtB and LgtE link Gal-beta(1,4)  to GlcNAc (N-acetylglucosamine) and Glc (glucose), respectively. The genes encoding LgtB and LgtE are two genes of a five gene locus involved in the synthesis of gonococcal LOS. LgtE is believed to perform the first step in LOS biosynthesis.
Probab=84.16  E-value=6.2  Score=36.68  Aligned_cols=109  Identities=20%  Similarity=0.208  Sum_probs=62.9

Q ss_pred             EEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH-----
Q 006036          419 IGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT-----  493 (663)
Q Consensus       419 I~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt-----  493 (663)
                      |.|.+-+...+||..+++.....      .+...||-|..........+......      .........++.--     
T Consensus         2 i~vInL~~~~~Rr~~~~~~~~~~------~~~~~~~~Avd~~~~~~~~~~~~~~~------~~~~~~~~~l~~gEiGC~l   69 (128)
T cd06532           2 IFVINLDRSTDRRERMEAQLAAL------GLDFEFFDAVDGKDLSEEELAALYDA------LFLPRYGRPLTPGEIGCFL   69 (128)
T ss_pred             EEEEECCCCHHHHHHHHHHHHHc------CCCeEEEeccccccCCHHHHHHHhHH------HhhhhcCCCCChhhHHHHH
Confidence            45677788899999999865543      34566776654432222222211110      00000011122111     


Q ss_pred             --HHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhcCCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcC
Q 006036          494 --IAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKEKPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAH  571 (663)
Q Consensus       494 --la~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~  571 (663)
                        +..++-... .+.++.+-..||+.+..+                                                 +
T Consensus        70 SH~~~w~~~~~-~~~~~alIlEDDv~~~~~-------------------------------------------------~   99 (128)
T cd06532          70 SHYKLWQKIVE-SNLEYALILEDDAILDPD-------------------------------------------------G   99 (128)
T ss_pred             HHHHHHHHHHH-cCCCeEEEEccCcEECCC-------------------------------------------------C
Confidence              111111111 367899999999999887                                                 5


Q ss_pred             CCccccCHHHHHHHHhhh
Q 006036          572 GPGYIISRDIAKFIVQGH  589 (663)
Q Consensus       572 G~GYVLSrdla~~I~~~~  589 (663)
                      ..||++|+..|++++...
T Consensus       100 ~~~Y~vs~~~A~~ll~~~  117 (128)
T cd06532         100 TAGYLVSRKGAKKLLAAL  117 (128)
T ss_pred             ceEEEeCHHHHHHHHHhC
Confidence            668999999999999974


No 38 
>PF13632 Glyco_trans_2_3:  Glycosyl transferase family group 2
Probab=81.45  E-value=5.5  Score=38.52  Aligned_cols=108  Identities=15%  Similarity=0.186  Sum_probs=64.8

Q ss_pred             EEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCcccCCCC------C---CCCCCCCCcCCCccc
Q 006036          508 YIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKWYISNEE------W---PHSSYPPWAHGPGYI  576 (663)
Q Consensus       508 yvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~ee------y---p~~~YPpYc~G~GYV  576 (663)
                      ||+-+|+|+-+..+.|.+.+..  ++.-...-|.+...  +..+.-.++......      .   ..-..+.++.|++.+
T Consensus         1 ~v~~~DaDt~~~~d~l~~~~~~~~~~~~~~vq~~~~~~--~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~~   78 (193)
T PF13632_consen    1 YVLFLDADTRLPPDFLERLVAALEDPKVDAVQGPIIFR--NRGSLLTRLQDFEYAISHGLSRLSQSSLGRPLFLSGSGML   78 (193)
T ss_pred             CEEEEcCCCCCChHHHHHHHHHHhCCCceEEEccEEec--CCCChhheeehhhhhhhhhhhHHHHHhcCCCccccCccee
Confidence            6899999999999888887766  33333444444321  111111111111100      0   112347778999999


Q ss_pred             cCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeeccCC
Q 006036          577 ISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMSDD  624 (663)
Q Consensus       577 LSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~~~  624 (663)
                      +.+++++++.--   . -.....||..++.-+.+.   |..+.+..+.
T Consensus        79 ~r~~~l~~vg~~---~-~~~~~~ED~~l~~~l~~~---G~~~~~~~~~  119 (193)
T PF13632_consen   79 FRREALREVGGF---D-DPFSIGEDMDLGFRLRRA---GYRIVYVPDA  119 (193)
T ss_pred             eeHHHHHHhCcc---c-ccccccchHHHHHHHHHC---CCEEEEeccc
Confidence            999999988532   1 234556999999888755   4556555543


No 39 
>cd04195 GT2_AmsE_like GT2_AmsE_like is involved in exopolysaccharide amylovora biosynthesis. AmsE is a glycosyltransferase involved in exopolysaccharide amylovora biosynthesis in Erwinia amylovora. Amylovara is one of the three exopolysaccharide produced by E. amylovora. Amylovara-deficient mutants are non-pathogenic. It is a subfamily of Glycosyltransferase Family GT2, which includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds.
Probab=81.10  E-value=11  Score=36.30  Aligned_cols=157  Identities=13%  Similarity=0.074  Sum_probs=77.4

Q ss_pred             eEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhh
Q 006036          449 LAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLK  528 (663)
Q Consensus       449 V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~  528 (663)
                      ..++++.-.+.+..+...+++-.+.+. +..+....+   . .+. ..+..+....+.+|++..|+|.++..+.|...+.
T Consensus        30 ~eiiivdd~ss~d~t~~~~~~~~~~~~-i~~i~~~~n---~-G~~-~a~N~g~~~a~gd~i~~lD~Dd~~~~~~l~~~~~  103 (201)
T cd04195          30 DEVVLVKDGPVTQSLNEVLEEFKRKLP-LKVVPLEKN---R-GLG-KALNEGLKHCTYDWVARMDTDDISLPDRFEKQLD  103 (201)
T ss_pred             cEEEEEECCCCchhHHHHHHHHHhcCC-eEEEEcCcc---c-cHH-HHHHHHHHhcCCCEEEEeCCccccCcHHHHHHHH
Confidence            344333332324444444444455555 544433222   1 111 1234555555889999999999999888877776


Q ss_pred             c---CCCCCeeEEeeeCCCCCccCCCCCcccCCC-----CCCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcc
Q 006036          529 E---KPSNGLLFGLMSYDSSPQRDKDSKWYISNE-----EWPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLE  600 (663)
Q Consensus       529 ~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~e-----eyp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lE  600 (663)
                      .   ++.-.++.|.+.......+....+. .+..     .+.... -+ ..|++.++.+.+.+.+---     -.....|
T Consensus       104 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~-~~-~~~~~~~~rr~~~~~~g~~-----~~~~~~e  175 (201)
T cd04195         104 FIEKNPEIDIVGGGVLEFDSDGNDIGKRR-LPTSHDDILKFARRR-SP-FNHPTVMFRKSKVLAVGGY-----QDLPLVE  175 (201)
T ss_pred             HHHhCCCeEEEcccEEEECCCCCeecccc-CCCCHHHHHHHhccC-CC-CCChHHhhhHHHHHHcCCc-----CCCCCch
Confidence            5   3444455554432110000000000 0000     000000 11 2466778888777665321     1225689


Q ss_pred             hhHHHHHHHHhhcCCCeeeecc
Q 006036          601 DVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       601 DV~iGi~L~~l~~~gi~v~~~~  622 (663)
                      |..+...+...   |..+.+..
T Consensus       176 D~~~~~r~~~~---g~~~~~~~  194 (201)
T cd04195         176 DYALWARMLAN---GARFANLP  194 (201)
T ss_pred             HHHHHHHHHHc---CCceeccc
Confidence            99988887654   34454443


No 40 
>cd06420 GT2_Chondriotin_Pol_N N-terminal domain of Chondroitin polymerase functions as a GalNAc transferase. Chondroitin polymerase is a two domain, bi-functional protein. The N-terminal domain functions as a GalNAc transferase. The bacterial chondroitin polymerase catalyzes elongation of the chondroitin chain by alternatively transferring the GlcUA and GalNAc moiety from UDP-GlcUA and UDP-GalNAc to the non-reducing ends of the chondroitin chain. The enzyme consists of N-terminal and C-terminal domains in which the two active sites catalyze the addition of GalNAc and GlcUA, respectively. Chondroitin chains range from 40 to over 100 repeating units of the disaccharide. Sulfated chondroitins are involved in the regulation of various biological functions such as central nervous system development, wound repair, infection, growth factor signaling, and morphogenesis, in addition to its conventional structural roles. In Caenorhabditis elegans, chondroitin is an essential factor for the worm 
Probab=80.99  E-value=25  Score=33.06  Aligned_cols=96  Identities=9%  Similarity=-0.010  Sum_probs=57.7

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhcCCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCccc
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKEKPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGYI  576 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GYV  576 (663)
                      +..+.+....+|++..|+|..+..+.|...++.......++|..........                  .....|+++.
T Consensus        71 ~n~g~~~a~g~~i~~lD~D~~~~~~~l~~~~~~~~~~~~v~g~~~~~~~~~~------------------~~~~~~~~~~  132 (182)
T cd06420          71 RNKAIAAAKGDYLIFIDGDCIPHPDFIADHIELAEPGVFLSGSRVLLNEKLT------------------ERGIRGCNMS  132 (182)
T ss_pred             HHHHHHHhcCCEEEEEcCCcccCHHHHHHHHHHhCCCcEEecceeecccccc------------------eeEeccceEE
Confidence            3445555688999999999999887777766553223344443322111100                  0345678888


Q ss_pred             cCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          577 ISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       577 LSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      +.+..+..+.- +. ........||+.++.-+.+.+
T Consensus       133 ~~r~~~~~~gg-f~-~~~~~~~~eD~~l~~r~~~~g  166 (182)
T cd06420         133 FWKKDLLAVNG-FD-EEFTGWGGEDSELVARLLNSG  166 (182)
T ss_pred             EEHHHHHHhCC-CC-cccccCCcchHHHHHHHHHcC
Confidence            88888775433 21 122223479998888777653


No 41 
>COG1216 Predicted glycosyltransferases [General function prediction only]
Probab=80.51  E-value=83  Score=33.34  Aligned_cols=134  Identities=13%  Similarity=0.109  Sum_probs=73.7

Q ss_pred             cCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCC--C--Cc
Q 006036          474 YGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDS--S--PQ  547 (663)
Q Consensus       474 ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~--~--P~  547 (663)
                      +.++..+...+++---.. .-.+..++..- ..+|++-.++|+.+..+.|.++++.  ......+.|......  .  +.
T Consensus        55 ~~~v~~i~~~~NlG~agg-~n~g~~~a~~~-~~~~~l~LN~D~~~~~~~l~~ll~~~~~~~~~~~~~~~i~~~~~~~~~~  132 (305)
T COG1216          55 FPNVRLIENGENLGFAGG-FNRGIKYALAK-GDDYVLLLNPDTVVEPDLLEELLKAAEEDPAAGVVGPLIRNYDESLYID  132 (305)
T ss_pred             CCcEEEEEcCCCccchhh-hhHHHHHHhcC-CCcEEEEEcCCeeeChhHHHHHHHHHHhCCCCeEeeeeEecCCCCcchh
Confidence            678877665554321000 00122333221 1229999999999999999888877  333334444333211  0  11


Q ss_pred             cCC------CCCc-ccCCCCCCC-----CCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          548 RDK------DSKW-YISNEEWPH-----SSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       548 Rd~------~~Kw-yVs~eeyp~-----~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      +..      ...| +....+.+.     ...-.++.|++.++++++.+++-- +.  .--....||+-++.=+++.+
T Consensus       133 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~~li~~~~~~~vG~-~d--e~~F~y~eD~D~~~R~~~~G  206 (305)
T COG1216         133 RRGGESDGLTGGWRASPLLEIAPDLSSYLEVVASLSGACLLIRREAFEKVGG-FD--ERFFIYYEDVDLCLRARKAG  206 (305)
T ss_pred             eeccccccccccceecccccccccccchhhhhhhcceeeeEEcHHHHHHhCC-CC--cccceeehHHHHHHHHHHcC
Confidence            110      1122 222222222     112225799999999999999976 21  22244799999988888764


No 42 
>TIGR03111 glyc2_xrt_Gpos1 putative glycosyltransferase TIGR03111. Members of this protein family probable glycosyltransferases of family 2, whose genes are near those for Gram-positive proteins (TIGR03110) related to the proposed exosortase (TIGR02602).
Probab=80.00  E-value=45  Score=37.53  Aligned_cols=184  Identities=11%  Similarity=0.005  Sum_probs=90.9

Q ss_pred             eEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHH
Q 006036          415 LVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTI  494 (663)
Q Consensus       415 v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtl  494 (663)
                      +.+-|+|++--....-++.|+.--.+.  .....+.+ .++.....++..+.+++-.+.+..+...- .+.  + ..|.-
T Consensus        49 P~vsVIIP~yNe~~~l~~~l~sl~~q~--yp~~~~eI-iVVDd~StD~T~~il~~~~~~~~~v~v~~-~~~--~-~Gka~  121 (439)
T TIGR03111        49 PDITIIIPVYNSEDTLFNCIESIYNQT--YPIELIDI-ILANNQSTDDSFQVFCRAQNEFPGLSLRY-MNS--D-QGKAK  121 (439)
T ss_pred             CCEEEEEEeCCChHHHHHHHHHHHhcC--CCCCCeEE-EEEECCCChhHHHHHHHHHHhCCCeEEEE-eCC--C-CCHHH
Confidence            445556665443333444555433331  11223444 34433333333333333344555543322 221  1 23433


Q ss_pred             HHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCC--CcccCCC---CCC----
Q 006036          495 AICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDS--KWYISNE---EWP----  562 (663)
Q Consensus       495 a~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~--KwyVs~e---eyp----  562 (663)
                       .+.++.+..+.+|++..|+|..+..+.|.+.+..   ++.-....|.+.......-...+  .+++...   +|.    
T Consensus       122 -AlN~gl~~s~g~~v~~~DaD~~~~~d~L~~l~~~f~~~~~v~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~l  200 (439)
T TIGR03111       122 -ALNAAIYNSIGKYIIHIDSDGKLHKDAIKNMVTRFENNPDIHAMTGVILTDKELIEKTKGRFLKLIRRCEYFEYAQAFL  200 (439)
T ss_pred             -HHHHHHHHccCCEEEEECCCCCcChHHHHHHHHHHHhCCCeEEEEeEEecCchhhhhhcchhhhHhHHhHHHHHHHHHH
Confidence             3456666668899999999999999988887765   33333444555432111000000  1111110   110    


Q ss_pred             -------CCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          563 -------HSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       563 -------~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                             ....+..++|++.++.++++.++--- .    ...-.||..++.-+...
T Consensus       201 ~~r~~~s~~~~~~~~sGa~~~~Rr~~l~~vggf-~----~~~i~ED~~l~~rl~~~  251 (439)
T TIGR03111       201 AGRNFESQVNSLFTLSGAFSAFRRETILKTQLY-N----SETVGEDTDMTFQIREL  251 (439)
T ss_pred             hhhHHHHhcCCeEEEccHHHhhhHHHHHHhCCC-C----CCCcCccHHHHHHHHHh
Confidence                   00122346788999999998775321 1    11238999998776543


No 43 
>TIGR03469 HonB hopene-associated glycosyltransferase HpnB. This family of genes include a glycosyl transferase, group 2 domain (pfam00535) which are responsible, generally for the transfer of nucleotide-diphosphate sugars to substrates such as polysaccharides and lipids. The genes of this family are often found in the same genetic locus with squalene-hopene cyclase genes, and are never associated with genes for the metabolism of phytoene. Indeed, the members of this family appear to never be found in a genome lacking squalene-hopene cyclase (SHC), although not all genomes encoding SHC have this glycosyl transferase. In the organism Zymomonas mobilis the linkage of this gene to hopanoid biosynthesis has been noted and the gene named HpnB. Hopanoids are known to feature polar glycosyl head groups in many organisms.
Probab=79.15  E-value=69  Score=35.30  Aligned_cols=189  Identities=15%  Similarity=0.051  Sum_probs=92.2

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcC---CEEEEeecccCCcch
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYG---DIQIMPFVDYYSLIS  490 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~yg---DII~ldf~DsY~nLt  490 (663)
                      .+.+-|+|++.-....-.+.|+.--.+. .  .....++++-..+.+.. .+.+++-.+.|.   .+..+...+.-.+-.
T Consensus        39 ~p~VSVIIpa~Ne~~~L~~~L~sL~~q~-y--p~~~eIIVVDd~StD~T-~~i~~~~~~~~~~~~~i~vi~~~~~~~g~~  114 (384)
T TIGR03469        39 WPAVVAVVPARNEADVIGECVTSLLEQD-Y--PGKLHVILVDDHSTDGT-ADIARAAARAYGRGDRLTVVSGQPLPPGWS  114 (384)
T ss_pred             CCCEEEEEecCCcHhHHHHHHHHHHhCC-C--CCceEEEEEeCCCCCcH-HHHHHHHHHhcCCCCcEEEecCCCCCCCCc
Confidence            3456566665443333334444332221 1  11356665555555433 222222223343   455544322222333


Q ss_pred             HHHHH---HHHhhh-ccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCcccC------C
Q 006036          491 LKTIA---ICIFGT-KILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKWYIS------N  558 (663)
Q Consensus       491 lKtla---~l~w~~-~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~KwyVs------~  558 (663)
                      .|..+   +++.+. ..++.+|++.+|+|+.+..+.|.+.+..  .....+..|......   .....+..++      .
T Consensus       115 Gk~~A~n~g~~~A~~~~~~gd~llflDaD~~~~p~~l~~lv~~~~~~~~~~vs~~~~~~~---~~~~~~~~~~~~~~~~~  191 (384)
T TIGR03469       115 GKLWAVSQGIAAARTLAPPADYLLLTDADIAHGPDNLARLVARARAEGLDLVSLMVRLRC---ESFWEKLLIPAFVFFFQ  191 (384)
T ss_pred             chHHHHHHHHHHHhccCCCCCEEEEECCCCCCChhHHHHHHHHHHhCCCCEEEecccccC---CCHHHHHHHHHHHHHHH
Confidence            45433   233332 2334899999999999999888887766  222233333221100   0000000000      0


Q ss_pred             CCCCC------CCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          559 EEWPH------SSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       559 eeyp~------~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      ..||.      .....++.|++.++++++.+++--. .  .......||+.++.-+.+.+
T Consensus       192 ~~~~~~~~~~~~~~~~~~~G~~~lirr~~~~~vGGf-~--~~~~~~~ED~~L~~r~~~~G  248 (384)
T TIGR03469       192 KLYPFRWVNDPRRRTAAAAGGCILIRREALERIGGI-A--AIRGALIDDCTLAAAVKRSG  248 (384)
T ss_pred             HhcchhhhcCCCccceeecceEEEEEHHHHHHcCCH-H--HHhhCcccHHHHHHHHHHcC
Confidence            00110      1123456899999999999888332 1  11223589999998888753


No 44 
>cd04187 DPM1_like_bac Bacterial DPM1_like enzymes are related to eukaryotic DPM1. A family of  bacterial enzymes related to eukaryotic DPM1; Although the mechanism of eukaryotic enzyme is well studied, the mechanism of the  bacterial enzymes is not well understood. The eukaryotic DPM1 is the catalytic subunit of eukaryotic Dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. The enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. This protein family belongs to Glycosyltransferase 2 superfamily.
Probab=76.94  E-value=9.5  Score=36.29  Aligned_cols=134  Identities=12%  Similarity=0.107  Sum_probs=70.5

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHh
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNL  527 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L  527 (663)
                      .+.++.+-..+.+. ....++...+++..+..+.....+.    |. ..+..+......+|++.+|+|.....+.|...+
T Consensus        29 ~~eiivvdd~s~d~-t~~~~~~~~~~~~~i~~i~~~~n~G----~~-~a~n~g~~~a~~d~i~~~D~D~~~~~~~l~~l~  102 (181)
T cd04187          29 DYEIIFVDDGSTDR-TLEILRELAARDPRVKVIRLSRNFG----QQ-AALLAGLDHARGDAVITMDADLQDPPELIPEML  102 (181)
T ss_pred             CeEEEEEeCCCCcc-HHHHHHHHHhhCCCEEEEEecCCCC----cH-HHHHHHHHhcCCCEEEEEeCCCCCCHHHHHHHH
Confidence            34555554444433 2333444455566666555433221    22 223344444567999999999999887777766


Q ss_pred             hc-CCCCCeeEEeeeCCCCCc-cCCCCCcccCCCCCCCCCCCCCcCCCccccCHHHHHHHHh
Q 006036          528 KE-KPSNGLLFGLMSYDSSPQ-RDKDSKWYISNEEWPHSSYPPWAHGPGYIISRDIAKFIVQ  587 (663)
Q Consensus       528 ~~-~~~~~ly~G~v~~~~~P~-Rd~~~KwyVs~eeyp~~~YPpYc~G~GYVLSrdla~~I~~  587 (663)
                      .. .......+|.......+. +.-.++.+...........-+...|+.+++++++++.+..
T Consensus       103 ~~~~~~~~~v~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~i~~  164 (181)
T cd04187         103 AKWEEGYDVVYGVRKNRKESWLKRLTSKLFYRLINKLSGVDIPDNGGDFRLMDRKVVDALLL  164 (181)
T ss_pred             HHHhCCCcEEEEEecCCcchHHHHHHHHHHHHHHHHHcCCCCCCCCCCEEEEcHHHHHHHHh
Confidence            65 444567777654321110 0000000000000001122345678889999999999875


No 45 
>PLN02726 dolichyl-phosphate beta-D-mannosyltransferase
Probab=76.42  E-value=53  Score=33.23  Aligned_cols=133  Identities=14%  Similarity=0.098  Sum_probs=68.3

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCC--EEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHH
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGD--IQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLS  525 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygD--II~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~  525 (663)
                      .+.++++-..+.+. ..+.+++-.++|++  +.......   |.- |. ..+..+....+.+|++..|+|..+.++.|.+
T Consensus        40 ~~eiivvDdgS~D~-t~~i~~~~~~~~~~~~v~~~~~~~---n~G-~~-~a~n~g~~~a~g~~i~~lD~D~~~~~~~l~~  113 (243)
T PLN02726         40 DFEIIVVDDGSPDG-TQDVVKQLQKVYGEDRILLRPRPG---KLG-LG-TAYIHGLKHASGDFVVIMDADLSHHPKYLPS  113 (243)
T ss_pred             CeEEEEEeCCCCCC-HHHHHHHHHHhcCCCcEEEEecCC---CCC-HH-HHHHHHHHHcCCCEEEEEcCCCCCCHHHHHH
Confidence            45666665555443 23334443445553  33322211   211 11 2333444445789999999999999988888


Q ss_pred             Hhhc--CCCCCeeEEeeeCCCC--C----ccCCCCC--cccCCCCCCCCCCCCCcCCCccccCHHHHHHHHhh
Q 006036          526 NLKE--KPSNGLLFGLMSYDSS--P----QRDKDSK--WYISNEEWPHSSYPPWAHGPGYIISRDIAKFIVQG  588 (663)
Q Consensus       526 ~L~~--~~~~~ly~G~v~~~~~--P----~Rd~~~K--wyVs~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~  588 (663)
                      .+..  .....+++|.......  .    .|.-.++  .++...... . .-+.+.|+..++++++++.+...
T Consensus       114 l~~~~~~~~~~~v~g~r~~~~~~~~~~~~~r~~~~~~~~~~~~~~~~-~-~~~d~~g~~~~~rr~~~~~i~~~  184 (243)
T PLN02726        114 FIKKQRETGADIVTGTRYVKGGGVHGWDLRRKLTSRGANVLAQTLLW-P-GVSDLTGSFRLYKRSALEDLVSS  184 (243)
T ss_pred             HHHHHHhcCCcEEEEccccCCCCcCCccHHHHHHHHHHHHHHHHHhC-C-CCCcCCCcccceeHHHHHHHHhh
Confidence            7766  3345677775432110  0    0100000  000000111 1 11235788889999999999753


No 46 
>cd02526 GT2_RfbF_like RfbF is a putative dTDP-rhamnosyl transferase. Shigella flexneri RfbF protein is a putative dTDP-rhamnosyl transferase. dTDP rhamnosyl  transferases of Shigella flexneri  add rhamnose sugars to N-acetyl-glucosamine in the O-antigen tetrasaccharide repeat. Lipopolysaccharide O antigens are important virulence determinants for many bacteria. The variations of sugar composition, the sequence of the sugars and the linkages in the O antigen provide structural diversity of the O antigen.
Probab=75.90  E-value=74  Score=31.37  Aligned_cols=105  Identities=18%  Similarity=0.118  Sum_probs=55.4

Q ss_pred             CCcEEEEeCCceeeeHHHHHHHh--hc--C-CCCCeeEEeeeCC-CCCccC---CCCCcccCCCCCCCCC--CCCCcCCC
Q 006036          505 PAKYIMKTDDDAFVRIDEVLSNL--KE--K-PSNGLLFGLMSYD-SSPQRD---KDSKWYISNEEWPHSS--YPPWAHGP  573 (663)
Q Consensus       505 ~akyvlKvDDDtfVnvd~Ll~~L--~~--~-~~~~ly~G~v~~~-~~P~Rd---~~~KwyVs~eeyp~~~--YPpYc~G~  573 (663)
                      +++|++..|+|+.+..+.|...+  ..  . ...-..+|..... ......   ....|...........  -..++.|+
T Consensus        75 ~~d~v~~lD~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  154 (237)
T cd02526          75 GADYVLLFDQDSVPPPDMVEKLLAYKILSDKNSNIGAVGPRIIDRRTGENSPGVRKSGYKLRIQKEGEEGLKEVDFLITS  154 (237)
T ss_pred             CCCEEEEECCCCCcCHhHHHHHHHHHHhhccCCCeEEEeeeEEcCCCCeeccceeccCccceecccccCCceEeeeeecc
Confidence            67999999999999988888875  22  1 1222333332211 110000   0001111000010111  12455678


Q ss_pred             ccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhh
Q 006036          574 GYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       574 GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~  612 (663)
                      |.++.+++.+.+--- . ... ....||+.+++-+.+.+
T Consensus       155 ~~~~rr~~~~~~ggf-d-~~~-~~~~eD~d~~~r~~~~G  190 (237)
T cd02526         155 GSLISLEALEKVGGF-D-EDL-FIDYVDTEWCLRARSKG  190 (237)
T ss_pred             ceEEcHHHHHHhCCC-C-HHH-cCccchHHHHHHHHHcC
Confidence            889999998887432 1 111 23468999888877654


No 47 
>PF04646 DUF604:  Protein of unknown function, DUF604;  InterPro: IPR006740 This family includes a conserved region found in several uncharacterised plant proteins.
Probab=75.88  E-value=3.3  Score=43.56  Aligned_cols=42  Identities=19%  Similarity=0.201  Sum_probs=32.4

Q ss_pred             CCCccccCHHHHHHHHhhhcccc--cCCCCcchhHHHHHHHHhh
Q 006036          571 HGPGYIISRDIAKFIVQGHQERD--LKLFKLEDVAMGIWIEQFK  612 (663)
Q Consensus       571 ~G~GYVLSrdla~~I~~~~~~~~--l~~f~lEDV~iGi~L~~l~  612 (663)
                      +|+|++||..+|+.|.+....+.  .+.+.--|-.+..|+.+++
T Consensus        12 GGgG~~iS~pLa~~L~~~~d~C~~r~~~~~g~D~~i~~C~~~lg   55 (255)
T PF04646_consen   12 GGGGFAISYPLAKALAKMQDDCIERYPHLYGGDQRIQACIAELG   55 (255)
T ss_pred             cCceeEEcHHHHHHHHHHHHHHHHhcCCCCCchHHHHHHHHHhC
Confidence            89999999999999998754332  2333446888999998874


No 48 
>cd04179 DPM_DPG-synthase_like DPM_DPG-synthase_like is a member of the Glycosyltransferase 2 superfamily. DPM1 is the catalytic subunit of eukaryotic dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. In higher eukaryotes,the enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. In lower eukaryotes, such as Saccharomyces cerevisiae and Trypanosoma brucei, DPM synthase consists of a single component (Dpm1p and TbDpm1, respectively) that possesses one predicted transmembrane region near the C terminus for anchoring to the ER membrane. In contrast, the Dpm1 homologues of higher eukaryotes, namely fission yeast, fungi, and animals, have no transmembrane region, suggesting the ex
Probab=73.46  E-value=8.3  Score=36.44  Aligned_cols=119  Identities=10%  Similarity=0.035  Sum_probs=63.8

Q ss_pred             hhhHHHHHHHhhcCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEe
Q 006036          462 QVNFELWKEAQAYGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGL  539 (663)
Q Consensus       462 ~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~  539 (663)
                      .....++.-..++..+..+.......    | -..+..+......+|++..|+|..+..+.|.+++..  ......++|.
T Consensus        41 ~~~~~~~~~~~~~~~~~~~~~~~n~G----~-~~a~n~g~~~a~gd~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~g~  115 (185)
T cd04179          41 GTAEIARELAARVPRVRVIRLSRNFG----K-GAAVRAGFKAARGDIVVTMDADLQHPPEDIPKLLEKLLEGGADVVIGS  115 (185)
T ss_pred             ChHHHHHHHHHhCCCeEEEEccCCCC----c-cHHHHHHHHHhcCCEEEEEeCCCCCCHHHHHHHHHHHhccCCcEEEEE
Confidence            33444555555666665555444332    1 122334444455699999999999998888888875  4445677776


Q ss_pred             eeCCCC----C-ccCCCCCcccCCCCCC-CCCCCCCcCCCccccCHHHHHHHH
Q 006036          540 MSYDSS----P-QRDKDSKWYISNEEWP-HSSYPPWAHGPGYIISRDIAKFIV  586 (663)
Q Consensus       540 v~~~~~----P-~Rd~~~KwyVs~eeyp-~~~YPpYc~G~GYVLSrdla~~I~  586 (663)
                      ......    + .+. ...+........ ...-.....|+.+++.+++++.+.
T Consensus       116 ~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~i~  167 (185)
T cd04179         116 RFVRGGGAGMPLLRR-LGSRLFNFLIRLLLGVRISDTQSGFRLFRREVLEALL  167 (185)
T ss_pred             eecCCCcccchHHHH-HHHHHHHHHHHHHcCCCCcCCCCceeeeHHHHHHHHH
Confidence            543221    0 000 000000000000 011123346777899999999985


No 49 
>cd06427 CESA_like_2 CESA_like_2 is a member of the cellulose synthase superfamily. The cellulose synthase (CESA) superfamily includes a wide variety of glycosyltransferase family 2 enzymes that share the common characteristic of catalyzing the elongation of polysaccharide chains.  The members include cellulose synthase catalytic subunit, chitin synthase, Glucan Biosynthesis protein and other families of CESA-like proteins. Cellulose synthase catalyzes the polymerization reaction of cellulose, an aggregate of unbranched polymers of beta-1,4-linked glucose residues in  plants, most algae, some bacteria and fungi, and even some animals. In bacteria, algae and lower eukaryotes, there is a second unrelated type of cellulose synthase (Type II), which produces acylated cellulose, a derivative of cellulose.  Chitin synthase catalyzes the incorporation of GlcNAc from substrate UDP-GlcNAc into chitin, which is a linear homopolymer of beta-(1,4)-linked GlcNAc residues and Glucan Biosynthesis prot
Probab=73.39  E-value=42  Score=33.81  Aligned_cols=116  Identities=11%  Similarity=0.150  Sum_probs=64.3

Q ss_pred             HHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc-CCC-CC-eeE-EeeeCCCCCccCCCCCcccC-C-----CCCC---
Q 006036          496 ICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-KPS-NG-LLF-GLMSYDSSPQRDKDSKWYIS-N-----EEWP---  562 (663)
Q Consensus       496 ~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~-~~-ly~-G~v~~~~~P~Rd~~~KwyVs-~-----eeyp---  562 (663)
                      .+.++....+.+||+.+|+|+.+..+.|.+.+.. ... .. .+. |.+.....+ .....+.+.. .     ...+   
T Consensus        75 a~n~g~~~a~gd~i~~~DaD~~~~~~~l~~~~~~~~~~~~~v~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~  153 (241)
T cd06427          75 ACNYALAFARGEYVVIYDAEDAPDPDQLKKAVAAFARLDDKLACVQAPLNYYNAR-ENWLTRMFALEYAAWFDYLLPGLA  153 (241)
T ss_pred             HHHHHHHhcCCCEEEEEcCCCCCChHHHHHHHHHHHhcCCCEEEEeCceEeeCCC-ccHHHHHHHHHHHHHHHHHHHHHH
Confidence            3445555567899999999999999999888876 211 22 222 222211110 0000010000 0     0001   


Q ss_pred             CCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeee
Q 006036          563 HSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHY  620 (663)
Q Consensus       563 ~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~  620 (663)
                      ....+..++|++.++++++.+.+--. .    .....||..+++-+.+.   |..+.+
T Consensus       154 ~~~~~~~~~g~~~~~rr~~~~~vgg~-~----~~~~~eD~~l~~rl~~~---G~r~~~  203 (241)
T cd06427         154 RLGLPIPLGGTSNHFRTDVLRELGGW-D----PFNVTEDADLGLRLARA---GYRTGV  203 (241)
T ss_pred             hcCCeeecCCchHHhhHHHHHHcCCC-C----cccchhhHHHHHHHHHC---CceEEE
Confidence            11233456899999999999887542 1    12346999998877654   444544


No 50 
>PRK14716 bacteriophage N4 adsorption protein B; Provisional
Probab=65.32  E-value=98  Score=35.95  Aligned_cols=194  Identities=12%  Similarity=0.046  Sum_probs=96.2

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      ...+-|+|+.--+..--.+.|+..=.+..   ..+..+ ||+....++.+...+++=+++|..+..+-. + ....+-|.
T Consensus        65 ~p~vaIlIPA~NE~~vI~~~l~s~L~~ld---Y~~~eI-iVv~d~ndd~T~~~v~~l~~~~p~v~~vv~-~-~~gp~~Ka  138 (504)
T PRK14716         65 EKRIAIFVPAWREADVIGRMLEHNLATLD---YENYRI-FVGTYPNDPATLREVDRLAARYPRVHLVIV-P-HDGPTSKA  138 (504)
T ss_pred             CCceEEEEeccCchhHHHHHHHHHHHcCC---CCCeEE-EEEECCCChhHHHHHHHHHHHCCCeEEEEe-C-CCCCCCHH
Confidence            34455666644333223344443311111   123443 333334444444444433566777643332 2 12234565


Q ss_pred             HHHHHhhhc-------c--CCCcEEEEeCCceeeeHHHHHHHhhcCCCCCeeEEeeeCCCCCccCCCCCc----ccCCCC
Q 006036          494 IAICIFGTK-------I--LPAKYIMKTDDDAFVRIDEVLSNLKEKPSNGLLFGLMSYDSSPQRDKDSKW----YISNEE  560 (663)
Q Consensus       494 la~l~w~~~-------~--~~akyvlKvDDDtfVnvd~Ll~~L~~~~~~~ly~G~v~~~~~P~Rd~~~Kw----yVs~ee  560 (663)
                      -+ +.++..       +  .++++++..|-|..+..+.|.......+...++-..+....   + +.+.|    |.  .+
T Consensus       139 ~a-LN~~l~~~~~~e~~~G~~~d~vvi~DAD~~v~Pd~Lr~~~~~~~~~~~VQ~pv~~~~---~-~~~~~~ag~y~--~e  211 (504)
T PRK14716        139 DC-LNWIYQAIFAFERERGIRFAIIVLHDAEDVIHPLELRLYNYLLPRHDFVQLPVFSLP---R-DWGEWVAGTYM--DE  211 (504)
T ss_pred             HH-HHHHHHHHHHhhhhcCCCcCEEEEEcCCCCcCccHHHHHHhhcCCCCEEecceeccC---C-chhHHHHHHHH--HH
Confidence            43 233321       1  24699999999999999998764322322222211111111   1 11111    11  11


Q ss_pred             CCC---------CC--CCCCcCCCccccCHHHHHHHHhhhccccc-CCCCcchhHHHHHHHHhhcCCCeeeeccC
Q 006036          561 WPH---------SS--YPPWAHGPGYIISRDIAKFIVQGHQERDL-KLFKLEDVAMGIWIEQFKNTGQEVHYMSD  623 (663)
Q Consensus       561 yp~---------~~--YPpYc~G~GYVLSrdla~~I~~~~~~~~l-~~f~lEDV~iGi~L~~l~~~gi~v~~~~~  623 (663)
                      |.+         +.  -+..+.|.|+++++++++++.....-... ...--||.-+|+-+...   |..+.|.+.
T Consensus       212 f~~~~~~~l~~r~~LG~~~~~~Gtg~afRR~aLe~l~~~~GG~~fd~~sLTED~dLglRL~~~---G~rv~y~p~  283 (504)
T PRK14716        212 FAESHLKDLPVREALGGLIPSAGVGTAFSRRALERLAAERGGQPFDSDSLTEDYDIGLRLKRA---GFRQIFVRV  283 (504)
T ss_pred             HHHHHHHHHHHHHhcCCccccCCeeEEeEHHHHHHHHhhcCCCCCCCCCcchHHHHHHHHHHC---CCEEEEecc
Confidence            211         00  23347899999999999998653100012 22457999999998865   566766554


No 51 
>cd00761 Glyco_tranf_GTA_type Glycosyltransferase family A (GT-A) includes diverse families of glycosyl transferases with a common GT-A type structural fold. Glycosyltransferases (GTs) are enzymes that synthesize oligosaccharides, polysaccharides, and glycoconjugates by transferring the sugar moiety from an activated nucleotide-sugar donor to an acceptor molecule, which may be a growing oligosaccharide, a lipid, or a protein.  Based on the stereochemistry of the donor and acceptor molecules, GTs are classified as either retaining or inverting enzymes. To date, all GT structures adopt one of two possible folds, termed GT-A fold and GT-B fold.  This hierarchy includes diverse families of glycosyl transferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. The majority of the proteins in this superfamily are Glycosyltransferase family 2 (GT-2) proteins. But it als
Probab=64.31  E-value=97  Score=26.94  Aligned_cols=77  Identities=19%  Similarity=0.140  Sum_probs=50.1

Q ss_pred             hhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCCCCcCCCcc
Q 006036          499 FGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYPPWAHGPGY  575 (663)
Q Consensus       499 w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~GY  575 (663)
                      ++....+.+|++.+|+|..+..+.+...+..   .+...+..|.                                 +++
T Consensus        71 ~~~~~~~~d~v~~~d~D~~~~~~~~~~~~~~~~~~~~~~~v~~~---------------------------------~~~  117 (156)
T cd00761          71 AGLKAARGEYILFLDADDLLLPDWLERLVAELLADPEADAVGGP---------------------------------GNL  117 (156)
T ss_pred             HHHHHhcCCEEEEECCCCccCccHHHHHHHHHhcCCCceEEecc---------------------------------chh
Confidence            3433448999999999999998888776433   2222233332                                 789


Q ss_pred             ccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          576 IISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       576 VLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      ++++++.+.+.-..   ......-||..++..+...
T Consensus       118 ~~~~~~~~~~~~~~---~~~~~~~ed~~~~~~~~~~  150 (156)
T cd00761         118 LFRRELLEEIGGFD---EALLSGEEDDDFLLRLLRG  150 (156)
T ss_pred             eeeHHHHHHhCCcc---hHhcCCcchHHHHHHHHhh
Confidence            99999998886531   1112226888777666654


No 52 
>TIGR03030 CelA cellulose synthase catalytic subunit (UDP-forming). Cellulose synthase catalyzes the beta-1,4 polymerization of glucose residues in the formation of cellulose. In bacteria, the substrate is UDP-glucose. The synthase consists of two subunits (or domains in the frequent cases where it is encoded as a single polypeptide), the catalytic domain modelled here and the regulatory domain (pfam03170). The regulatory domain binds the allosteric activator cyclic di-GMP. The protein is membrane-associated and probably assembles into multimers such that the individual cellulose strands can self-assemble into multi-strand fibrils.
Probab=61.84  E-value=83  Score=37.96  Aligned_cols=126  Identities=15%  Similarity=0.076  Sum_probs=66.8

Q ss_pred             cchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeee-CCCCCc-cCCCCCcccCCCC--
Q 006036          488 LISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMS-YDSSPQ-RDKDSKWYISNEE--  560 (663)
Q Consensus       488 nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~-~~~~P~-Rd~~~KwyVs~ee--  560 (663)
                      |.-.|.-+ +..+.+..+.+|++..|.|+.+..+.|...+..   ++.-.++.+... .+..|. |+-.....++.+.  
T Consensus       212 n~~~KAgn-LN~al~~a~gd~Il~lDAD~v~~pd~L~~~v~~f~~dp~v~~Vqtp~~f~~p~~~~~nl~~~~~~~~e~~~  290 (713)
T TIGR03030       212 NVHAKAGN-INNALKHTDGELILIFDADHVPTRDFLQRTVGWFVEDPKLFLVQTPHFFVSPDPIERNLGTFRRMPNENEL  290 (713)
T ss_pred             CCCCChHH-HHHHHHhcCCCEEEEECCCCCcChhHHHHHHHHHHhCCCEEEEeCCeeccCCCHHhhhhHHHHHhhhHHHH
Confidence            43345432 345555567899999999999998888877655   222111111111 111111 1100000001000  


Q ss_pred             -C----CC-C-CCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          561 -W----PH-S-SYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       561 -y----p~-~-~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                       |    +. + .-..++.|++.++.+++.+.+--- .    ...-.||..+++-+.+.   |..+.|..
T Consensus       291 f~~~i~~g~~~~~~~~~~Gs~~~iRR~al~~iGGf-~----~~~vtED~~l~~rL~~~---G~~~~y~~  351 (713)
T TIGR03030       291 FYGLIQDGNDFWNAAFFCGSAAVLRREALDEIGGI-A----GETVTEDAETALKLHRR---GWNSAYLD  351 (713)
T ss_pred             HHHHHHHHHhhhCCeeecCceeEEEHHHHHHcCCC-C----CCCcCcHHHHHHHHHHc---CCeEEEec
Confidence             0    00 0 012467799999999999877421 1    12247999999988765   44555544


No 53 
>cd06437 CESA_CaSu_A2 Cellulose synthase catalytic subunit A2 (CESA2) is a catalytic subunit or a catalytic subunit substitute of the cellulose synthase complex. Cellulose synthase (CESA) catalyzes the polymerization reaction of cellulose using UDP-glucose as the substrate. Cellulose is an aggregate of unbranched polymers of beta-1,4-linked glucose residues, which is an abundant polysaccharide produced by plants and in varying degrees by several other organisms including algae, bacteria, fungi, and even some animals. Genomes from higher plants harbor multiple CESA genes. There are ten in Arabidopsis. At least three different CESA proteins are required to form a functional complex. In Arabidopsis, CESA1, 3 and 6 and CESA4, 7 and 8, are required for cellulose biosynthesis during primary and secondary cell wall formation. CESA2 is very closely related to CESA6 and is viewed as a prime substitute for CESA6. They functionally compensate each other. The cesa2 and cesa6 double mutant plants we
Probab=61.66  E-value=1.7e+02  Score=28.93  Aligned_cols=104  Identities=11%  Similarity=0.011  Sum_probs=56.5

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCcccCCCC--------------
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKWYISNEE--------------  560 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~ee--------------  560 (663)
                      +..+....+.+|++.+|.|+.+..+.|...+..  ++.-..+.|.+..     .+....|......              
T Consensus        79 ~n~g~~~a~~~~i~~~DaD~~~~~~~l~~~~~~~~~~~v~~v~~~~~~-----~~~~~~~~~~~~~~~~~~~~~~~~~~~  153 (232)
T cd06437          79 LAEGMKVAKGEYVAIFDADFVPPPDFLQKTPPYFADPKLGFVQTRWGH-----INANYSLLTRVQAMSLDYHFTIEQVAR  153 (232)
T ss_pred             HHHHHHhCCCCEEEEEcCCCCCChHHHHHhhhhhcCCCeEEEecceee-----EcCCCchhhHhhhhhHHhhhhHhHhhH
Confidence            345555568999999999999999888884443  2222233443321     1111111100000              


Q ss_pred             CCCCCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          561 WPHSSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       561 yp~~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      +....+ ..+.|++-++.+++.+.+-- +..    ....||+.++.-+...
T Consensus       154 ~~~~~~-~~~~g~~~~~rr~~~~~vgg-~~~----~~~~ED~~l~~rl~~~  198 (232)
T cd06437         154 SSTGLF-FNFNGTAGVWRKECIEDAGG-WNH----DTLTEDLDLSYRAQLK  198 (232)
T ss_pred             hhcCCe-EEeccchhhhhHHHHHHhCC-CCC----CcchhhHHHHHHHHHC
Confidence            011111 12356666788888877632 211    2347999998877654


No 54 
>cd04191 Glucan_BSP_ModH Glucan_BSP_ModH catalyzes the elongation of beta-1,2 polyglucose chains of glucan. Periplasmic Glucan Biosynthesis protein ModH is a glucosyltransferase that catalyzes the elongation of beta-1,2 polyglucose chains of glucan, requiring a beta-glucoside as a primer and UDP-glucose as a substrate. Glucans are composed of 5 to 10 units of glucose forming a highly branched structure, where beta-1,2-linked glucose constitutes a linear backbone to which branches are attached by beta-1,6 linkages. In Escherichia coli, glucans are located in the periplasmic space, functioning as regulator of osmolarity. It is synthesized at a maximum when cells are grown in a medium with low osmolarity. It has been shown to span the cytoplasmic membrane.
Probab=58.56  E-value=71  Score=33.39  Aligned_cols=193  Identities=11%  Similarity=0.076  Sum_probs=100.8

Q ss_pred             EEEecCCCcHH-HHHHHHHHhcCCC-CCCCCCeEEEEEEeccCChhhhHHHHHH----HhhcCCEEEEeecccCCcchHH
Q 006036          419 IGVFSTGNNFE-RRMALRRSWMQYP-AVRSGDLAVRFFIGLHKNRQVNFELWKE----AQAYGDIQIMPFVDYYSLISLK  492 (663)
Q Consensus       419 I~V~Sa~~n~~-rR~aIR~TW~~~~-~v~~~~V~v~FvvG~~~~~~~~~~L~~E----a~~ygDII~ldf~DsY~nLtlK  492 (663)
                      |+|++.-.... -...++..+..-. .-....+.+ |++..+.+++.....+++    .+++..-+.+-+...-.|.-.|
T Consensus         3 IliP~~ne~~~~l~~~l~~~~~~~~~~~~~~~~eI-~vldD~~d~~~~~~~~~~~~~l~~~~~~~~~v~~~~r~~~~g~K   81 (254)
T cd04191           3 IVMPVYNEDPARVFAGLRAMYESLAKTGLADHFDF-FILSDTRDPDIWLAEEAAWLDLCEELGAQGRIYYRRRRENTGRK   81 (254)
T ss_pred             EEEeCCCCCHHHHHHHHHHHHHHHHhcCCcCceEE-EEECCCCChHHHHHHHHHHHHHHHHhCCCCcEEEEEcCCCCCcc
Confidence            66777666554 5666776664110 000124556 888777665433211111    1224433334444444455567


Q ss_pred             HHHHHHhhhcc-CCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcc----------c--
Q 006036          493 TIAICIFGTKI-LPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWY----------I--  556 (663)
Q Consensus       493 tla~l~w~~~~-~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~Kwy----------V--  556 (663)
                      +-.+-.+.... .+.+|++-.|.|+.+..+.|.+.+..   ++.-.++-+....     .+..+-|.          .  
T Consensus        82 ag~l~~~~~~~~~~~~~i~~~DaD~~~~p~~l~~~v~~~~~~~~vg~vq~~~~~-----~n~~~~~~~~~~~~~~~~~~~  156 (254)
T cd04191          82 AGNIADFCRRWGSRYDYMVVLDADSLMSGDTIVRLVRRMEANPRAGIIQTAPKL-----IGAETLFARLQQFANRLYGPV  156 (254)
T ss_pred             HHHHHHHHHHhCCCCCEEEEEeCCCCCCHHHHHHHHHHHHhCCCEEEEeCCcee-----ECCCCHHHHHHHHHHHHHHHH
Confidence            65544443322 46799999999999999999998865   3322222221111     11111000          0  


Q ss_pred             ---CCCCCCCCCCCCCcCCCccccCHHHHHHHHhhhc---cccc-CCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          557 ---SNEEWPHSSYPPWAHGPGYIISRDIAKFIVQGHQ---ERDL-KLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       557 ---s~eeyp~~~YPpYc~G~GYVLSrdla~~I~~~~~---~~~l-~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                         ....|...  -.+|.|...++.++++..+...-.   .... ...-.||..+|+.+...   |..+.|..
T Consensus       157 ~~~~~~~~~~~--~~~~~G~~~~~Rr~al~~~~~~~~i~g~g~~~~~~l~eD~~l~~~~~~~---G~ri~~~~  224 (254)
T cd04191         157 FGRGLAAWQGG--EGNYWGHNAIIRVAAFMEHCALPVLPGRPPFGGHILSHDFVEAALMRRA---GWEVRLAP  224 (254)
T ss_pred             HHHHHHHhcCC--ccCccceEEEEEHHHHHHhcCCccccCCCCCCCCeecHHHHHHHHHHHc---CCEEEEcc
Confidence               00011111  135679999999998877632100   0011 12357999999998865   44555543


No 55 
>cd06438 EpsO_like EpsO protein participates in the methanolan synthesis. The Methylobacillus sp EpsO protein is predicted to participate in the methanolan synthesis. Methanolan is an exopolysaccharide (EPS), composed of glucose, mannose and galactose.  A 21 genes cluster was predicted to participate in the methanolan synthesis. Gene disruption analysis revealed that EpsO is one of the glycosyltransferase enzymes involved in the synthesis of repeating sugar units onto the lipid carrier.
Probab=56.88  E-value=82  Score=30.15  Aligned_cols=76  Identities=9%  Similarity=0.112  Sum_probs=46.3

Q ss_pred             CCCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCC--CCC-----------CCCCCCCC
Q 006036          504 LPAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISN--EEW-----------PHSSYPPW  569 (663)
Q Consensus       504 ~~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~--eey-----------p~~~YPpY  569 (663)
                      .+.+|++.+|.|+.+.++.|...+.. ......+.|....     +++...|.-..  ..|           ..-.-+.+
T Consensus        80 ~~~d~v~~~DaD~~~~p~~l~~l~~~~~~~~~~v~g~~~~-----~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  154 (183)
T cd06438          80 DDPDAVVVFDADNLVDPNALEELNARFAAGARVVQAYYNS-----KNPDDSWITRLYAFAFLVFNRLRPLGRSNLGLSCQ  154 (183)
T ss_pred             CCCCEEEEEcCCCCCChhHHHHHHHHHhhCCCeeEEEEee-----eCCccCHHHHHHHHHHHHHHHHHHHHHHHcCCCee
Confidence            36899999999999998888777766 3333456665432     11112221000  000           00122446


Q ss_pred             cCCCccccCHHHHHH
Q 006036          570 AHGPGYIISRDIAKF  584 (663)
Q Consensus       570 c~G~GYVLSrdla~~  584 (663)
                      +.|+++++++++++.
T Consensus       155 ~~G~~~~~rr~~l~~  169 (183)
T cd06438         155 LGGTGMCFPWAVLRQ  169 (183)
T ss_pred             ecCchhhhHHHHHHh
Confidence            789999999999888


No 56 
>cd06442 DPM1_like DPM1_like represents putative enzymes similar to eukaryotic DPM1. Proteins similar to eukaryotic DPM1, including enzymes from bacteria and archaea; DPM1 is the catalytic subunit of eukaryotic dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. In higher eukaryotes,the enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. In lower eukaryotes, such as Saccharomyces cerevisiae and Trypanosoma brucei, DPM synthase consists of a single component (Dpm1p and TbDpm1, respectively) that possesses one predicted transmembrane region near the C terminus for anchoring to the ER membrane. In contrast, the Dpm1 homologues of higher eukaryotes, namely fission yeast, fungi, 
Probab=53.18  E-value=96  Score=30.19  Aligned_cols=87  Identities=13%  Similarity=0.012  Sum_probs=49.3

Q ss_pred             hhhccCCCcEEEEeCCceeeeHHHHHHHhhc--CCCCCeeEEeeeCCCCCccCCCCCc--ccCC--C---CCCCCCCCCC
Q 006036          499 FGTKILPAKYIMKTDDDAFVRIDEVLSNLKE--KPSNGLLFGLMSYDSSPQRDKDSKW--YISN--E---EWPHSSYPPW  569 (663)
Q Consensus       499 w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~--~~~~~ly~G~v~~~~~P~Rd~~~Kw--yVs~--e---eyp~~~YPpY  569 (663)
                      .+......+|++.+|+|..+..+.|...+..  ......+.|......... .....+  +.+.  .   .+....-.+.
T Consensus        72 ~g~~~a~gd~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~v~g~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~~~  150 (224)
T cd06442          72 EGFKAARGDVIVVMDADLSHPPEYIPELLEAQLEGGADLVIGSRYVEGGGV-EGWGLKRKLISRGANLLARLLLGRKVSD  150 (224)
T ss_pred             HHHHHcCCCEEEEEECCCCCCHHHHHHHHHHHhcCCCCEEEEeeeecCCcc-CCCcHHHHHHHHHHHHHHHHHcCCCCCC
Confidence            3333445699999999999998888887775  344456666543221111 000000  0000  0   0000111345


Q ss_pred             cCCCccccCHHHHHHHH
Q 006036          570 AHGPGYIISRDIAKFIV  586 (663)
Q Consensus       570 c~G~GYVLSrdla~~I~  586 (663)
                      +.|++.++++++++.+.
T Consensus       151 ~~~~~~~~~r~~~~~ig  167 (224)
T cd06442         151 PTSGFRAYRREVLEKLI  167 (224)
T ss_pred             CCCccchhhHHHHHHHh
Confidence            67888899999999997


No 57 
>PF10111 Glyco_tranf_2_2:  Glycosyltransferase like family 2;  InterPro: IPR019290 This conserved domain is found in a set of prokaryotic proteins including putative glucosyltransferases, which are involved in bacterial capsule biosynthesis [, ]. 
Probab=51.92  E-value=91  Score=32.72  Aligned_cols=160  Identities=18%  Similarity=0.078  Sum_probs=85.9

Q ss_pred             CCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEE--eecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHH
Q 006036          447 GDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIM--PFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVL  524 (663)
Q Consensus       447 ~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~l--df~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll  524 (663)
                      ..+.++++=+.+. ......|.+-.+.++-+..+  +....+-+.   . .+...+......+|++..|.|+++..+.+.
T Consensus        33 ~~~eiIvvd~~s~-~~~~~~l~~~~~~~~~~~~i~~~~~~~~f~~---a-~arN~g~~~A~~d~l~flD~D~i~~~~~i~  107 (281)
T PF10111_consen   33 PDFEIIVVDDGSS-DEFDEELKKLCEKNGFIRYIRHEDNGEPFSR---A-KARNIGAKYARGDYLIFLDADCIPSPDFIE  107 (281)
T ss_pred             CCEEEEEEECCCc-hhHHHHHHHHHhccCceEEEEcCCCCCCcCH---H-HHHHHHHHHcCCCEEEEEcCCeeeCHHHHH
Confidence            3455544444333 23346677777777766222  222211221   1 123445555699999999999999999999


Q ss_pred             HHhh---c--CCCCCeeEEeeeCCCCCccCCC---CCcccCCC----C--CCCCCCC-CCcCCCccccCHHHHHHHHhhh
Q 006036          525 SNLK---E--KPSNGLLFGLMSYDSSPQRDKD---SKWYISNE----E--WPHSSYP-PWAHGPGYIISRDIAKFIVQGH  589 (663)
Q Consensus       525 ~~L~---~--~~~~~ly~G~v~~~~~P~Rd~~---~KwyVs~e----e--yp~~~YP-pYc~G~GYVLSrdla~~I~~~~  589 (663)
                      +.+.   .  .....++.+.+.....+.....   .+......    .  .....+. ....|++.+++++.-..|-=- 
T Consensus       108 ~~~~~~~~l~~~~~~~~~~p~~yl~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~~~~i~r~~f~~iGGf-  186 (281)
T PF10111_consen  108 KLLNHVKKLDKNPNAFLVYPCLYLSEEGSEKFYSQFKNLWDHEFLESFISGKNSLWEFIAFASSCFLINREDFLEIGGF-  186 (281)
T ss_pred             HHHHHHHHHhcCCCceEEEeeeeccchhhHHHhhcchhcchHHHHHHHhhccccccccccccceEEEEEHHHHHHhCCC-
Confidence            9888   3  2333444443332222111000   00000000    0  0011111 233568899999988777542 


Q ss_pred             cccccCCCCcchhHHHHHHHHhhc
Q 006036          590 QERDLKLFKLEDVAMGIWIEQFKN  613 (663)
Q Consensus       590 ~~~~l~~f~lEDV~iGi~L~~l~~  613 (663)
                       .........||.-++.=|.+.+.
T Consensus       187 -DE~f~G~G~ED~D~~~RL~~~~~  209 (281)
T PF10111_consen  187 -DERFRGWGYEDIDFGYRLKKAGY  209 (281)
T ss_pred             -CccccCCCcchHHHHHHHHHcCC
Confidence             23444567999999888877653


No 58 
>PRK10714 undecaprenyl phosphate 4-deoxy-4-formamido-L-arabinose transferase; Provisional
Probab=49.14  E-value=93  Score=33.64  Aligned_cols=132  Identities=14%  Similarity=0.068  Sum_probs=67.4

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCC-EEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHH
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGD-IQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSN  526 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygD-II~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~  526 (663)
                      .+.++++-..+.+... +.+++-++.+++ ++......++    -|.- .+..+....+.+|++..|+|.-.+++.+.+.
T Consensus        38 ~~EIIvVDDgS~D~T~-~il~~~~~~~~~~v~~i~~~~n~----G~~~-A~~~G~~~A~gd~vv~~DaD~q~~p~~i~~l  111 (325)
T PRK10714         38 EYEILLIDDGSSDNSA-EMLVEAAQAPDSHIVAILLNRNY----GQHS-AIMAGFSHVTGDLIITLDADLQNPPEEIPRL  111 (325)
T ss_pred             CEEEEEEeCCCCCcHH-HHHHHHHhhcCCcEEEEEeCCCC----CHHH-HHHHHHHhCCCCEEEEECCCCCCCHHHHHHH
Confidence            4667677665555432 333333344444 4444333332    2221 1223334457899999999999999998888


Q ss_pred             hhc-CCCCCeeEEeeeC-CCCCccCCCCCcccCC-CCCCCCCCCCCcCCCcc-ccCHHHHHHHHh
Q 006036          527 LKE-KPSNGLLFGLMSY-DSSPQRDKDSKWYISN-EEWPHSSYPPWAHGPGY-IISRDIAKFIVQ  587 (663)
Q Consensus       527 L~~-~~~~~ly~G~v~~-~~~P~Rd~~~KwyVs~-eeyp~~~YPpYc~G~GY-VLSrdla~~I~~  587 (663)
                      ++. ....+...|.... ...+.|.-.++.+--. .......++.+  ++|| ++++++++.+..
T Consensus       112 ~~~~~~~~DvV~~~r~~~~~~~~r~~~s~~~~~l~~~~~g~~~~d~--~~gfr~~~r~~~~~l~~  174 (325)
T PRK10714        112 VAKADEGYDVVGTVRQNRQDSWFRKTASKMINRLIQRTTGKAMGDY--GCMLRAYRRHIVDAMLH  174 (325)
T ss_pred             HHHHHhhCCEEEEEEcCCCCcHHHHHHHHHHHHHHHHHcCCCCCCC--CcCeEEEcHHHHHHHHH
Confidence            877 3223455554321 1122221111111000 00112223333  3444 899999999865


No 59 
>cd02522 GT_2_like_a GT_2_like_a represents a glycosyltransferase family-2 subfamily with unknown function. Glycosyltransferase family 2 (GT-2) subfamily of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.
Probab=48.24  E-value=2.6e+02  Score=26.99  Aligned_cols=104  Identities=13%  Similarity=0.079  Sum_probs=55.2

Q ss_pred             HhhhccCCCcEEEEeCCceeeeHHHHHHHhhcCCCCCeeEEeeeCC----CCCccCCCCCcccCCCCCCCCCCCCCcCCC
Q 006036          498 IFGTKILPAKYIMKTDDDAFVRIDEVLSNLKEKPSNGLLFGLMSYD----SSPQRDKDSKWYISNEEWPHSSYPPWAHGP  573 (663)
Q Consensus       498 ~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~~~~~~ly~G~v~~~----~~P~Rd~~~KwyVs~eeyp~~~YPpYc~G~  573 (663)
                      ..+......+|++.+|+|..+..+.|.+.+..........|.....    ....+-...++...    ......+ .++.
T Consensus        65 n~g~~~a~~~~i~~~D~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~----~~~~~~~-~~~~  139 (221)
T cd02522          65 NAGAAAARGDWLLFLHADTRLPPDWDAAIIETLRADGAVAGAFRLRFDDPGPRLRLLELGANLR----SRLFGLP-YGDQ  139 (221)
T ss_pred             HHHHHhccCCEEEEEcCCCCCChhHHHHHHHHhhcCCcEEEEEEeeecCCccchhhhhhcccce----ecccCCC-cCCc
Confidence            3444445689999999999999887777665522233333332211    11111000111110    0001112 2356


Q ss_pred             ccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          574 GYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       574 GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      |.++++++...+--- .    ..+..||.-++.-+.+.
T Consensus       140 ~~~~r~~~~~~~G~f-d----~~~~~ED~d~~~r~~~~  172 (221)
T cd02522         140 GLFIRRELFEELGGF-P----ELPLMEDVELVRRLRRR  172 (221)
T ss_pred             eEEEEHHHHHHhCCC-C----ccccccHHHHHHHHHhC
Confidence            788999988777532 1    12278999887666554


No 60 
>PRK11234 nfrB bacteriophage N4 adsorption protein B; Provisional
Probab=45.72  E-value=5.4e+02  Score=31.44  Aligned_cols=193  Identities=9%  Similarity=-0.025  Sum_probs=98.6

Q ss_pred             CeEEEEEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCChhhhHHHHHHHhhcCCEEEEeecccCCcchHHH
Q 006036          414 RLVMLIGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKNRQVNFELWKEAQAYGDIQIMPFVDYYSLISLKT  493 (663)
Q Consensus       414 ~v~LlI~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDII~ldf~DsY~nLtlKt  493 (663)
                      ...+-|+|+..-...--.+.|...=.+.   .-.+..+++++. +.++.+...+++=.++|.++..+-... .. .+.|.
T Consensus        62 ~~~vsIlVPa~nE~~vi~~~i~~ll~~l---dYP~~eI~vi~~-~nD~~T~~~~~~l~~~~p~~~~v~~~~-~g-~~gKa  135 (727)
T PRK11234         62 EKPLAIMVPAWNETGVIGNMAELAATTL---DYENYHIFVGTY-PNDPATQADVDAVCARFPNVHKVVCAR-PG-PTSKA  135 (727)
T ss_pred             CCCEEEEEecCcchhhHHHHHHHHHHhC---CCCCeEEEEEec-CCChhHHHHHHHHHHHCCCcEEEEeCC-CC-CCCHH
Confidence            3556677776544443444444321111   112355555544 444444555666667888864433333 12 24576


Q ss_pred             HHHHHhhhc-------cC--CCcEEEEeCCceeeeHHHHHHHhhc-CCCCCeeEEeeeCCCCCccCCCCCcccCC---CC
Q 006036          494 IAICIFGTK-------IL--PAKYIMKTDDDAFVRIDEVLSNLKE-KPSNGLLFGLMSYDSSPQRDKDSKWYISN---EE  560 (663)
Q Consensus       494 la~l~w~~~-------~~--~akyvlKvDDDtfVnvd~Ll~~L~~-~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~---ee  560 (663)
                      .+. .++..       +.  .++.++-.|-|+.|..+.|. .+.. ......+-+.+.   +..|+ .+.| +..   .+
T Consensus       136 ~aL-N~~l~~~~~~e~~~~~~~~vvvi~DAD~~v~pd~L~-~~~~l~~~~~~VQ~p~~---p~~~~-~~~~-~~~~~~~E  208 (727)
T PRK11234        136 DCL-NNVLDAITQFERSANFAFAGFILHDAEDVISPMELR-LFNYLVERKDLIQIPVY---PFERE-WTHF-TSGTYIDE  208 (727)
T ss_pred             HHH-HHHHHHHHhhhcccCCcccEEEEEcCCCCCChhHHH-HHHhhcCCCCeEeeccc---CCCcc-HHHH-HHHHHHHH
Confidence            542 23211       12  34557779999999999997 3333 222233333222   11111 1111 100   12


Q ss_pred             CC----C-----CC--CCCCcCCCccccCHHHHHHHHhhhcc-cccCCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          561 WP----H-----SS--YPPWAHGPGYIISRDIAKFIVQGHQE-RDLKLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       561 yp----~-----~~--YPpYc~G~GYVLSrdla~~I~~~~~~-~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                      |.    .     ..  -+-.+.|.|..+++..++.+.+.-.. ......--||.-+|+-+...   |..+.+..
T Consensus       209 Fa~~~~~~~~~~~~lgg~~~l~G~~~af~Rr~l~al~~~ggg~~~~~~~lTED~dlg~rL~~~---G~~v~f~~  279 (727)
T PRK11234        209 FAELHGKDVPVREALAGQVPSAGVGTCFSRRAVTALLEDGDGIAFDVQSLTEDYDIGFRLKEK---GMREIFVR  279 (727)
T ss_pred             HHHHhhhhhHHHHHcCCCcccCCceEEEecccHHHHHHhcCCCCcCCCcchHHHHHHHHHHHC---CCEEEEcc
Confidence            21    0     11  24467899999998876666553100 12233457999999999876   45565544


No 61 
>PRK11498 bcsA cellulose synthase catalytic subunit; Provisional
Probab=42.67  E-value=1.8e+02  Score=36.11  Aligned_cols=125  Identities=14%  Similarity=0.063  Sum_probs=68.0

Q ss_pred             cchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeC-CCCC-ccCCCCCc-ccCCCC-
Q 006036          488 LISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSY-DSSP-QRDKDSKW-YISNEE-  560 (663)
Q Consensus       488 nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~-~~~P-~Rd~~~Kw-yVs~ee-  560 (663)
                      |.-.|.- .+..+.+..+.+|++..|.|+.+..+-|...+..   ++.-.++-+.... +..| .|+- +.. ..+.+. 
T Consensus       323 n~~gKAG-nLN~aL~~a~GEyIavlDAD~ip~pdfL~~~V~~f~~dP~VglVQtp~~f~n~dp~~rnl-~~~~~~~~e~~  400 (852)
T PRK11498        323 HEHAKAG-NINNALKYAKGEFVAIFDCDHVPTRSFLQMTMGWFLKDKKLAMMQTPHHFFSPDPFERNL-GRFRKTPNEGT  400 (852)
T ss_pred             CCcchHH-HHHHHHHhCCCCEEEEECCCCCCChHHHHHHHHHHHhCCCeEEEEcceeccCCchHHHhh-HHHhhcccchh
Confidence            3334543 2455555568899999999999998888776543   3332222221111 1111 1110 000 000000 


Q ss_pred             --C----CC--CCCCCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHhhcCCCeeeecc
Q 006036          561 --W----PH--SSYPPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQFKNTGQEVHYMS  622 (663)
Q Consensus       561 --y----p~--~~YPpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l~~~gi~v~~~~  622 (663)
                        |    +.  ..--.+|.|++.++.+++++.+--- ..    ....||..+++-+...   |..+.|..
T Consensus       401 ~fy~~iq~g~~~~~a~~~~Gs~aviRReaLeeVGGf-d~----~titED~dlslRL~~~---Gyrv~yl~  462 (852)
T PRK11498        401 LFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGI-AV----ETVTEDAHTSLRLHRR---GYTSAYMR  462 (852)
T ss_pred             HHHHHHHhHHHhhcccccccceeeeEHHHHHHhcCC-CC----CccCccHHHHHHHHHc---CCEEEEEe
Confidence              0    00  0012457899999999999988532 11    1246999999988865   45565543


No 62 
>TIGR01556 rhamnosyltran L-rhamnosyltransferase. Rhamnolipids are glycolipids containing mono- or di- L-rhamnose molecules. Rhamnolipid synthesis occurs by sequential glycosyltransferase reactions involving two distinct rhamnosyltransferase enzymes. In P.aeruginosa, the synthesis of mono-rhamnolipids is catalyzed by rhamnosyltransferase 1, and proceeds by a glycosyltransfer reaction catalyzed by rhamnosyltransferase 2 to yield di-rhamnolipids.
Probab=42.56  E-value=1.7e+02  Score=30.09  Aligned_cols=111  Identities=10%  Similarity=0.106  Sum_probs=54.4

Q ss_pred             HHhhhccCCCcEEEEeCCceeeeHHHHHHHhhc-C-CC-CCeeEEeeeCCC-CCccCC---CCCcccCCC--CCCCCC-C
Q 006036          497 CIFGTKILPAKYIMKTDDDAFVRIDEVLSNLKE-K-PS-NGLLFGLMSYDS-SPQRDK---DSKWYISNE--EWPHSS-Y  566 (663)
Q Consensus       497 l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~L~~-~-~~-~~ly~G~v~~~~-~P~Rd~---~~KwyVs~e--eyp~~~-Y  566 (663)
                      ++++.. .+++|++..|||+.+..+.|...+.. . .. .-.++|...... ...+.+   ...+.....  ...... -
T Consensus        66 i~~a~~-~~~d~i~~lD~D~~~~~~~l~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  144 (281)
T TIGR01556        66 LDASFR-RGVQGVLLLDQDSRPGNAFLAAQWKLLSAENGQACALGPRFFDRGTSRRLPAIHLDGLLLRQISLDGLTTPQK  144 (281)
T ss_pred             HHHHHH-CCCCEEEEECCCCCCCHHHHHHHHHHHHhcCCceEEECCeEEcCCCcccCCceeecccceeeecccccCCcee
Confidence            344432 27899999999999998777776654 2 21 223333222111 000000   000100000  000111 1


Q ss_pred             CCCcCCCccccCHHHHHHHHhhhcccccCCCCcchhHHHHHHHHh
Q 006036          567 PPWAHGPGYIISRDIAKFIVQGHQERDLKLFKLEDVAMGIWIEQF  611 (663)
Q Consensus       567 PpYc~G~GYVLSrdla~~I~~~~~~~~l~~f~lEDV~iGi~L~~l  611 (663)
                      ..++.++|.++++++++.+-- +. ..+ ....||+-+.+=+.+.
T Consensus       145 ~~~~~~sg~li~~~~~~~iG~-fd-e~~-fi~~~D~e~~~R~~~~  186 (281)
T TIGR01556       145 TSFLISSGCLITREVYQRLGM-MD-EEL-FIDHVDTEWSLRAQNY  186 (281)
T ss_pred             ccEEEcCcceeeHHHHHHhCC-cc-Hhh-cccchHHHHHHHHHHC
Confidence            235566777899999988843 11 111 2345788765544443


No 63 
>cd02514 GT13_GLCNAC-TI GT13_GLCNAC-TI is involved in an essential step in the synthesis of complex or hybrid-type N-linked oligosaccharides. Alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase (GLCNAC-T I , GNT-I)  transfers N-acetyl-D-glucosamine from UDP to high-mannose glycoprotein N-oligosaccharide, an essential step in the synthesis of complex or hybrid-type N-linked oligosaccharides. The enzyme is an integral membrane protein localized to the Golgi apparatus. The catalytic domain is located at the C-terminus. These proteins are members of the glycosy transferase family 13.
Probab=35.79  E-value=2.2e+02  Score=31.34  Aligned_cols=80  Identities=16%  Similarity=0.202  Sum_probs=45.4

Q ss_pred             HHHhhhccCCCcEEEEeCCceeeeHH---HHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccCCCCCCCCCCC-C
Q 006036          496 ICIFGTKILPAKYIMKTDDDAFVRID---EVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYISNEEWPHSSYP-P  568 (663)
Q Consensus       496 ~l~w~~~~~~akyvlKvDDDtfVnvd---~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~eeyp~~~YP-p  568 (663)
                      ++.++....++++++.+|||..+.++   .+.+.|..   +++-..+.|.- .        .|+....... |...|- .
T Consensus        88 aln~vF~~~~~~~vIILEDDl~~sPdFf~yf~~~l~~y~~D~~v~~ISa~N-d--------nG~~~~~~~~-~~~lyrs~  157 (334)
T cd02514          88 ALTQTFNLFGYSFVIILEDDLDIAPDFFSYFQATLPLLEEDPSLWCISAWN-D--------NGKEHFVDDT-PSLLYRTD  157 (334)
T ss_pred             HHHHHHHhcCCCEEEEECCCCccCHhHHHHHHHHHHHHhcCCCEEEEEeec-c--------CCcccccCCC-cceEEEec
Confidence            44444333479999999999999988   33333433   22222222321 1        1222111111 333333 6


Q ss_pred             CcCCCccccCHHHHHHH
Q 006036          569 WAHGPGYIISRDIAKFI  585 (663)
Q Consensus       569 Yc~G~GYVLSrdla~~I  585 (663)
                      |+.|.|.++.+++-+.+
T Consensus       158 ff~glGWml~r~~W~e~  174 (334)
T cd02514         158 FFPGLGWMLTRKLWKEL  174 (334)
T ss_pred             CCCchHHHHHHHHHHHh
Confidence            78899999999998877


No 64 
>cd04188 DPG_synthase DPG_synthase is involved in protein N-linked glycosylation. UDP-glucose:dolichyl-phosphate glucosyltransferase (DPG_synthase) is a transmembrane-bound enzyme of the endoplasmic reticulum involved in protein N-linked glycosylation. This enzyme catalyzes the transfer of glucose from UDP-glucose to dolichyl phosphate.
Probab=31.52  E-value=3.8e+02  Score=26.05  Aligned_cols=88  Identities=13%  Similarity=0.064  Sum_probs=50.8

Q ss_pred             CeEEEEEEeccCChhhhHHHHHHHhhcCCE-EEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHHHHHH
Q 006036          448 DLAVRFFIGLHKNRQVNFELWKEAQAYGDI-QIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDEVLSN  526 (663)
Q Consensus       448 ~V~v~FvvG~~~~~~~~~~L~~Ea~~ygDI-I~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~Ll~~  526 (663)
                      ...++.+-..+.+. ....+++..+.++.. ..+......    .+. ..+..+......+|++.+|+|..+..+.+...
T Consensus        30 ~~eiivvdd~S~D~-t~~~~~~~~~~~~~~i~~i~~~~n~----G~~-~a~~~g~~~a~gd~i~~ld~D~~~~~~~l~~l  103 (211)
T cd04188          30 SYEIIVVDDGSKDG-TAEVARKLARKNPALIRVLTLPKNR----GKG-GAVRAGMLAARGDYILFADADLATPFEELEKL  103 (211)
T ss_pred             CEEEEEEeCCCCCc-hHHHHHHHHHhCCCcEEEEEcccCC----CcH-HHHHHHHHHhcCCEEEEEeCCCCCCHHHHHHH
Confidence            45555554444443 334455555666664 333322221    111 22333444446799999999999999988888


Q ss_pred             hhc--CCCCCeeEEeee
Q 006036          527 LKE--KPSNGLLFGLMS  541 (663)
Q Consensus       527 L~~--~~~~~ly~G~v~  541 (663)
                      +..  ......++|...
T Consensus       104 ~~~~~~~~~~~v~g~r~  120 (211)
T cd04188         104 EEALKTSGYDIAIGSRA  120 (211)
T ss_pred             HHHHhccCCcEEEEEee
Confidence            875  444567777644


No 65 
>PRK05454 glucosyltransferase MdoH; Provisional
Probab=25.56  E-value=5.2e+02  Score=31.38  Aligned_cols=198  Identities=14%  Similarity=0.104  Sum_probs=102.4

Q ss_pred             CCeEEEEEEecCCCcHH-HHHHHHHHhcCCCCC-CCCCeEEEEEEeccCChhhhH----HHHHHHhhcC---CEEEEeec
Q 006036          413 KRLVMLIGVFSTGNNFE-RRMALRRSWMQYPAV-RSGDLAVRFFIGLHKNRQVNF----ELWKEAQAYG---DIQIMPFV  483 (663)
Q Consensus       413 ~~v~LlI~V~Sa~~n~~-rR~aIR~TW~~~~~v-~~~~V~v~FvvG~~~~~~~~~----~L~~Ea~~yg---DII~ldf~  483 (663)
                      ...++.|+|++.-...+ -+..|+.++.+-... ...++.+ |++..+.++++..    .+.+=.++|+   .|..   .
T Consensus       122 ~~~~VaVliP~yNEd~~~v~~~L~a~~~Sl~~~~~~~~~e~-~vLdD~~d~~~~~~e~~~~~~L~~~~~~~~~i~y---r  197 (691)
T PRK05454        122 PEARTAILMPIYNEDPARVFAGLRAMYESLAATGHGAHFDF-FILSDTRDPDIAAAEEAAWLELRAELGGEGRIFY---R  197 (691)
T ss_pred             CCCceEEEEeCCCCChHHHHHHHHHHHHHHHhcCCCCCEEE-EEEECCCChhHHHHHHHHHHHHHHhcCCCCcEEE---E
Confidence            44567777877665533 235666666532211 1224555 8888877665322    1122233443   3433   3


Q ss_pred             ccCCcchHHHHHHHHhhhcc-CCCcEEEEeCCceeeeHHHHHHHhhc---CCCCCeeEEeeeCCCCCccCCCCCcccCCC
Q 006036          484 DYYSLISLKTIAICIFGTKI-LPAKYIMKTDDDAFVRIDEVLSNLKE---KPSNGLLFGLMSYDSSPQRDKDSKWYISNE  559 (663)
Q Consensus       484 DsY~nLtlKtla~l~w~~~~-~~akyvlKvDDDtfVnvd~Ll~~L~~---~~~~~ly~G~v~~~~~P~Rd~~~KwyVs~e  559 (663)
                      ..-+|.-.|.-..-.+.... .+++|++-.|-|+.+..+.|.+.+..   ++.    +|-+.....+. +.. .++--..
T Consensus       198 ~R~~n~~~KaGNl~~~~~~~~~~~eyivvLDADs~m~~d~L~~lv~~m~~dP~----vGlVQt~~~~~-n~~-slfaR~q  271 (691)
T PRK05454        198 RRRRNVGRKAGNIADFCRRWGGAYDYMVVLDADSLMSGDTLVRLVRLMEANPR----AGLIQTLPVAV-GAD-TLFARLQ  271 (691)
T ss_pred             ECCcCCCccHHHHHHHHHhcCCCcCEEEEEcCCCCCCHHHHHHHHHHHhhCcC----EEEEeCCccCc-CCC-CHHHHHH
Confidence            33345556766555554432 47899999999999999999998865   332    45444221111 111 1110000


Q ss_pred             CCCCCCC-C-------------CCcCCCccccCHHHHHHHHhh--h-ccccc-CCCCcchhHHHHHHHHhhcCCCeeeec
Q 006036          560 EWPHSSY-P-------------PWAHGPGYIISRDIAKFIVQG--H-QERDL-KLFKLEDVAMGIWIEQFKNTGQEVHYM  621 (663)
Q Consensus       560 eyp~~~Y-P-------------pYc~G~GYVLSrdla~~I~~~--~-~~~~l-~~f~lEDV~iGi~L~~l~~~gi~v~~~  621 (663)
                      .+....| |             -.+.|...|+.++....+---  . ....+ ...--||..+|..++..   |..+.|.
T Consensus       272 qf~~~~y~~~~~~G~~~w~~~~g~f~G~naIiR~~af~~~~glp~L~g~~p~~~~~LseD~~~a~~l~~~---GyrV~~~  348 (691)
T PRK05454        272 QFATRVYGPLFAAGLAWWQGGEGNYWGHNAIIRVKAFAEHCGLPPLPGRGPFGGHILSHDFVEAALMRRA---GWGVWLA  348 (691)
T ss_pred             HHHHHHHHHHHHhhhhhhccCccccccceEEEEHHHHHHhcCCccccccCCCCCCcccHHHHHHHHHHHC---CCEEEEc
Confidence            0000000 0             012466677877776554210  0 00011 12356899999998875   4567666


Q ss_pred             cC
Q 006036          622 SD  623 (663)
Q Consensus       622 ~~  623 (663)
                      .+
T Consensus       349 pd  350 (691)
T PRK05454        349 PD  350 (691)
T ss_pred             Cc
Confidence            55


No 66 
>PF13704 Glyco_tranf_2_4:  Glycosyl transferase family 2
Probab=23.35  E-value=3.8e+02  Score=22.93  Aligned_cols=49  Identities=16%  Similarity=0.180  Sum_probs=29.9

Q ss_pred             cCCEEEEeecccCCcchHHHHHHHHhhhccCCCcEEEEeCCceeeeHHH
Q 006036          474 YGDIQIMPFVDYYSLISLKTIAICIFGTKILPAKYIMKTDDDAFVRIDE  522 (663)
Q Consensus       474 ygDII~ldf~DsY~nLtlKtla~l~w~~~~~~akyvlKvDDDtfVnvd~  522 (663)
                      +.++-...+.+.|..-.......-.+......++|++.+|-|=|+.++.
T Consensus        40 ~~~v~i~~~~~~~~~~~~~~~~~~~~~~~~~~~dWvl~~D~DEfl~~~~   88 (97)
T PF13704_consen   40 LPGVGIIRWVDPYRDERRQRAWRNALIERAFDADWVLFLDADEFLVPPP   88 (97)
T ss_pred             CCCcEEEEeCCCccchHHHHHHHHHHHHhCCCCCEEEEEeeeEEEecCC
Confidence            4556666666666543333221112223335899999999999988765


No 67 
>COG3306 Glycosyltransferase involved in LPS biosynthesis [Cell envelope biogenesis, outer membrane]
Probab=22.40  E-value=2.3e+02  Score=29.99  Aligned_cols=37  Identities=22%  Similarity=0.253  Sum_probs=26.7

Q ss_pred             EEEecCCCcHHHHHHHHHHhcCCCCCCCCCeEEEEEEeccCC
Q 006036          419 IGVFSTGNNFERRMALRRSWMQYPAVRSGDLAVRFFIGLHKN  460 (663)
Q Consensus       419 I~V~Sa~~n~~rR~aIR~TW~~~~~v~~~~V~v~FvvG~~~~  460 (663)
                      +.|.|-.+..+|+..++++-....    + +...||-+..+.
T Consensus         5 ~~vIsL~~s~~R~~~~~~~f~~~~----~-~~f~~~~av~~~   41 (255)
T COG3306           5 IHVISLKSSQERLEHVAETFEALG----G-LPFQRFDAVNGK   41 (255)
T ss_pred             eehhhhhhhHHHHHHHHHHHhhcc----C-CCceEeeccCcc
Confidence            456667778889999999987742    2 566777777664


No 68 
>PLN03181 glycosyltransferase; Provisional
Probab=22.40  E-value=4.6e+02  Score=30.05  Aligned_cols=88  Identities=16%  Similarity=0.080  Sum_probs=52.0

Q ss_pred             HHHHHHhcCCC--CCCCCCeEEEEEEeccC----C---hh-hhHHH---HHHHhhcC-CEEEEee-cc-cCCcchHHHHH
Q 006036          432 MALRRSWMQYP--AVRSGDLAVRFFIGLHK----N---RQ-VNFEL---WKEAQAYG-DIQIMPF-VD-YYSLISLKTIA  495 (663)
Q Consensus       432 ~aIR~TW~~~~--~v~~~~V~v~FvvG~~~----~---~~-~~~~L---~~Ea~~yg-DII~ldf-~D-sY~nLtlKtla  495 (663)
                      ++-|+.|.+..  ...+++-+++.|.|..+    +   .. +...+   .+=+++|| ++...+. .| .|...+.|..+
T Consensus       109 D~kR~~Wl~~~p~~~~~~~prVViVT~Sdp~~C~~~~gD~~LlriikNR~dYArrHGY~lf~~~a~Ld~~~p~~WaKipa  188 (453)
T PLN03181        109 DEKRAEWLKLHPSFAPGAEERVVMVTGSQPTPCKNPIGDHLLLRFFKNKVDYCRIHGYDIFYNNALLHPKMNSYWAKLPV  188 (453)
T ss_pred             HHHHHHHHHhCCCCCCCCCCCEEEEECCCCCCCCCcccHHHHHHHHHHHHHHHHHhCCcEEEeccccCccCchhhhHHHH
Confidence            34455676521  12244555666666541    1   11 22222   23377788 4543332 23 56667778777


Q ss_pred             HHHhhhccCCCcEEEEeCCceeee
Q 006036          496 ICIFGTKILPAKYIMKTDDDAFVR  519 (663)
Q Consensus       496 ~l~w~~~~~~akyvlKvDDDtfVn  519 (663)
                      +..-...+|+++||.-.|.|+++-
T Consensus       189 lRaAM~a~PeAEWfWWLDsDALIM  212 (453)
T PLN03181        189 VRAAMLAHPEAEWIWWVDSDAVFT  212 (453)
T ss_pred             HHHHHHHCCCceEEEEecCCceee
Confidence            666557799999999999999873


No 69 
>PF05679 CHGN:  Chondroitin N-acetylgalactosaminyltransferase;  InterPro: IPR008428 This family represents Chondroitin N-acetylgalactosaminyltransferase. Proteins have a type II transmembrane topology. The enzyme is involved in the biosynthetic initiation and elongation of chondroitin sulphate and is the key enzyme responsible for the selective chain assembly of chondroitin/dermatan sulphate on the linkage region tetrasaccharide common to various proteoglycans containing chondroitin/dermatan sulphate or heparin/heparan sulphate chains. ; GO: 0016758 transferase activity, transferring hexosyl groups, 0032580 Golgi cisterna membrane
Probab=20.14  E-value=1.3e+02  Score=34.89  Aligned_cols=58  Identities=26%  Similarity=0.351  Sum_probs=37.9

Q ss_pred             CCCcchhHHHHHHHHhhcCCCeeeeccCCccc-------c-------CCcccceEEEE-ecCHHHHHHHHHHhhc
Q 006036          596 LFKLEDVAMGIWIEQFKNTGQEVHYMSDDRFY-------N-------AGCESDYILAH-YQGPRMVLCLWEKLQK  655 (663)
Q Consensus       596 ~f~lEDV~iGi~L~~l~~~gi~v~~~~~~rf~-------~-------~~C~~~~I~~H-y~sP~~M~~lW~~l~~  655 (663)
                      +...||+.+|+|+.+.  +|++.......-++       .       ..-..+.+|+| -.+|..|+.+...+..
T Consensus        10 ~s~~~Dv~lGRCI~~~--~gi~Ct~~~q~l~y~~~~~~~~~~~~~~~~~~~~~AiTlHPvk~p~~mYrLH~y~~~   82 (499)
T PF05679_consen   10 YSNHEDVELGRCIKKF--TGISCTWSYQGLFYHNYELNKNDFIGDLKNKEFHNAITLHPVKSPAYMYRLHRYFLS   82 (499)
T ss_pred             CCCCchhHHHHHHHHh--cCCCeeecccceEEEeeccCCCcccccccchhhhcceeeccCCCHHHHHHHHHHHHH
Confidence            3467999999999976  45655433321111       0       11124679998 5779999999988764


No 70 
>PF06439 DUF1080:  Domain of Unknown Function (DUF1080);  InterPro: IPR010496 This is a family of proteins of unknown function.; PDB: 3IMM_B 3NMB_A 3S5Q_A 3OSD_A 3HBK_A 3H3L_A 3U1X_A.
Probab=20.14  E-value=2.5e+02  Score=26.87  Aligned_cols=39  Identities=21%  Similarity=0.114  Sum_probs=31.2

Q ss_pred             cCCCCCCCCcEEEEEEEecCeEEEEeCCeEeEEeecccc
Q 006036          327 SNFPFVDGNPFTTTIWVGLDGFHMTVNGRHETSLAYREK  365 (663)
Q Consensus       327 ~~fPF~~G~~F~l~i~~~~~gf~v~VnG~h~~sF~yR~~  365 (663)
                      ....+.+|+=.+++|.|..+.+.+.|||+.+.++.-...
T Consensus       120 ~~~~~~~~~W~~~~I~~~g~~i~v~vnG~~v~~~~d~~~  158 (185)
T PF06439_consen  120 VNVAIPPGEWNTVRIVVKGNRITVWVNGKPVADFTDPSF  158 (185)
T ss_dssp             S--S--TTSEEEEEEEEETTEEEEEETTEEEEEEETTSH
T ss_pred             ccccCCCCceEEEEEEEECCEEEEEECCEEEEEEEcCCC
Confidence            345678999999999999999999999999988876653


Done!