Query         001070
Match_columns 1165
No_of_seqs    226 out of 259
Neff          4.4 
Searched_HMMs 46136
Date          Thu Mar 28 15:00:13 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/001070.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/001070hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG1916 Nuclear protein, conta 100.0  1E-153  2E-158 1337.4  51.0 1077    6-1165    5-1283(1283)
  2 KOG1916 Nuclear protein, conta  99.7 1.5E-14 3.2E-19  173.3  31.1  140  198-361   274-453 (1283)
  3 KOG0271 Notchless-like WD40 re  99.5 1.6E-13 3.4E-18  153.8  10.8  118  107-244   126-277 (480)
  4 KOG0272 U4/U6 small nuclear ri  99.4 1.4E-12   3E-17  147.8   9.4  118  156-300   272-412 (459)
  5 KOG0266 WD40 repeat-containing  99.3 1.2E-11 2.7E-16  144.7  12.5  126  153-303   211-363 (456)
  6 KOG0275 Conserved WD40 repeat-  99.3   1E-11 2.2E-16  137.1   8.3  193   84-306   156-423 (508)
  7 KOG0295 WD40 repeat-containing  99.2 3.5E-11 7.6E-16  134.8  12.2  116  149-291   237-392 (406)
  8 KOG0285 Pleiotropic regulator   99.2 4.8E-11   1E-15  133.5  10.4  151  151-337   155-372 (460)
  9 KOG0266 WD40 repeat-containing  99.2 1.9E-10 4.2E-15  134.8  14.7  129  153-309   167-321 (456)
 10 KOG0263 Transcription initiati  99.2 5.7E-11 1.2E-15  142.4   9.9  131  140-298   447-642 (707)
 11 KOG0279 G protein beta subunit  99.1 6.5E-10 1.4E-14  121.7  14.5  175  153-342    71-298 (315)
 12 KOG0291 WD40-repeat-containing  99.1 2.1E-10 4.6E-15  136.9  11.1  143  138-307   332-553 (893)
 13 KOG0271 Notchless-like WD40 re  99.1 2.8E-10   6E-15  128.3   9.3   87  188-303   391-477 (480)
 14 KOG0295 WD40 repeat-containing  99.1 9.8E-10 2.1E-14  123.4  12.3  153  155-329   203-391 (406)
 15 KOG0276 Vesicle coat complex C  99.0 3.7E-10   8E-15  132.8   8.0  120  143-291    97-243 (794)
 16 PTZ00421 coronin; Provisional   99.0 5.9E-09 1.3E-13  124.0  18.1  112  156-293    87-229 (493)
 17 KOG0263 Transcription initiati  99.0   7E-10 1.5E-14  133.3   9.5   86  153-245   543-651 (707)
 18 PTZ00421 coronin; Provisional   99.0 6.4E-09 1.4E-13  123.7  15.8  132  153-307   131-291 (493)
 19 KOG0316 Conserved WD40 repeat-  99.0 4.3E-09 9.3E-14  113.4  12.4  147  153-337    25-195 (307)
 20 KOG0279 G protein beta subunit  99.0 3.3E-09 7.2E-14  116.2  11.5  144  132-305     4-179 (315)
 21 KOG0274 Cdc4 and related F-box  99.0 7.2E-10 1.6E-14  132.8   6.9  119  150-297   294-433 (537)
 22 KOG0281 Beta-TrCP (transducin   99.0   6E-10 1.3E-14  124.4   5.6  105  149-265   317-447 (499)
 23 KOG0319 WD40-repeat-containing  98.9 2.5E-09 5.4E-14  127.9   8.9  180  153-359   471-703 (775)
 24 PTZ00420 coronin; Provisional   98.9 2.9E-08 6.2E-13  119.9  17.6  154  156-335   136-316 (568)
 25 KOG0274 Cdc4 and related F-box  98.9 6.6E-09 1.4E-13  124.7  11.6   93  153-266   255-370 (537)
 26 KOG0281 Beta-TrCP (transducin   98.9 1.3E-09 2.8E-14  121.7   5.2  186  156-370   206-448 (499)
 27 PTZ00420 coronin; Provisional   98.9 2.6E-08 5.7E-13  120.3  16.5  128  157-307    87-249 (568)
 28 PLN00181 protein SPA1-RELATED;  98.9   3E-08 6.6E-13  123.4  17.0  128  156-306   587-738 (793)
 29 KOG0272 U4/U6 small nuclear ri  98.9 3.9E-09 8.4E-14  120.4   8.2  151  107-297   272-452 (459)
 30 cd00200 WD40 WD40 domain, foun  98.8 1.1E-07 2.3E-12   96.0  16.5  159  156-350    20-208 (289)
 31 KOG0293 WD40 repeat-containing  98.8 1.3E-08 2.8E-13  116.0  10.4  150  152-337   231-407 (519)
 32 KOG0273 Beta-transducin family  98.8 2.4E-08 5.1E-13  115.3  12.5  120  157-305   371-522 (524)
 33 cd00200 WD40 WD40 domain, foun  98.8 1.2E-07 2.6E-12   95.7  16.1  159  156-350    62-250 (289)
 34 KOG0276 Vesicle coat complex C  98.8 1.2E-08 2.7E-13  120.3   9.6  121  156-302    66-211 (794)
 35 PLN00181 protein SPA1-RELATED;  98.8 4.9E-08 1.1E-12  121.5  15.5  125  155-307   493-649 (793)
 36 KOG0286 G-protein beta subunit  98.8 7.3E-08 1.6E-12  106.5  13.3  164  108-304   109-301 (343)
 37 KOG0284 Polyadenylation factor  98.8 1.6E-08 3.5E-13  115.1   8.1  117  153-296   146-285 (464)
 38 KOG0313 Microtubule binding pr  98.7 3.1E-08 6.8E-13  112.0   9.8  113  157-298   115-323 (423)
 39 KOG0265 U5 snRNP-specific prot  98.7 4.5E-08 9.7E-13  108.4  10.7  155  134-303    36-243 (338)
 40 KOG0286 G-protein beta subunit  98.7 5.2E-08 1.1E-12  107.6  10.4  110  153-288   105-242 (343)
 41 KOG0315 G-protein beta subunit  98.7 1.2E-07 2.6E-12  103.1  12.4  168  107-306    51-245 (311)
 42 KOG0973 Histone transcription   98.6 7.2E-08 1.6E-12  119.5   9.9  135  151-306    75-250 (942)
 43 KOG0288 WD40 repeat protein Ti  98.6 1.8E-07   4E-12  106.8  12.0  118  156-297   230-453 (459)
 44 KOG0283 WD40 repeat-containing  98.6 1.2E-07 2.7E-12  115.0  10.9  138  133-298   251-474 (712)
 45 KOG0639 Transducin-like enhanc  98.6 4.6E-06   1E-10   97.3  22.7  235   85-348   409-703 (705)
 46 KOG0273 Beta-transducin family  98.6 2.3E-07 5.1E-12  107.3  11.5  122  153-297   241-474 (524)
 47 KOG0291 WD40-repeat-containing  98.6 4.2E-07 9.1E-12  109.5  13.4  131  153-309   313-469 (893)
 48 KOG0289 mRNA splicing factor [  98.6 3.3E-07 7.1E-12  105.3  12.0   94  188-310   371-464 (506)
 49 KOG0294 WD40 repeat-containing  98.6 7.3E-07 1.6E-11   99.6  14.1  162  114-307    10-200 (362)
 50 KOG0318 WD40 repeat stress pro  98.5 7.7E-07 1.7E-11  104.2  12.9   62  188-268   214-278 (603)
 51 KOG0292 Vesicle coat complex C  98.5 5.7E-07 1.2E-11  109.7  12.1  132  151-295    55-226 (1202)
 52 KOG0264 Nucleosome remodeling   98.5 5.2E-07 1.1E-11  104.0  11.0  165  112-307   146-348 (422)
 53 TIGR03866 PQQ_ABC_repeats PQQ-  98.5 2.1E-06 4.6E-11   90.7  14.0  120  158-305     2-144 (300)
 54 KOG0319 WD40-repeat-containing  98.5 7.9E-07 1.7E-11  107.1  11.7  135  135-296   401-568 (775)
 55 KOG0305 Anaphase promoting com  98.4 2.1E-06 4.5E-11  101.9  14.0  171  107-298   228-454 (484)
 56 KOG0645 WD40 repeat protein [G  98.4 3.7E-06   8E-11   92.6  14.5  168  104-303    23-224 (312)
 57 KOG0310 Conserved WD40 repeat-  98.4   9E-07   2E-11  102.9  10.1  113  153-293   162-297 (487)
 58 KOG0308 Conserved WD40 repeat-  98.4 5.2E-07 1.1E-11  107.5   8.2  130  154-300    34-195 (735)
 59 KOG0299 U3 snoRNP-associated p  98.4   2E-06 4.2E-11   99.7  12.0   33  155-187   212-245 (479)
 60 KOG0640 mRNA cleavage stimulat  98.4 6.5E-07 1.4E-11   99.7   7.9  101  150-268   219-348 (430)
 61 KOG0310 Conserved WD40 repeat-  98.4 1.9E-06 4.2E-11  100.2  11.7  125  156-308    79-227 (487)
 62 KOG0293 WD40 repeat-containing  98.4 6.9E-07 1.5E-11  102.3   7.5   87  151-243   401-513 (519)
 63 KOG0284 Polyadenylation factor  98.3 8.5E-07 1.8E-11  101.4   7.6  127  153-306   188-337 (464)
 64 KOG0315 G-protein beta subunit  98.3   2E-06 4.3E-11   93.9   9.6  144  156-337     9-179 (311)
 65 KOG0300 WD40 repeat-containing  98.3 2.1E-06 4.6E-11   95.8   9.7   91  157-266   284-398 (481)
 66 KOG1539 WD repeat protein [Gen  98.3 2.3E-06 5.1E-11  104.2  10.6  125  151-303   497-645 (910)
 67 KOG0265 U5 snRNP-specific prot  98.3 4.4E-06 9.4E-11   93.1  11.0  119  157-302   186-334 (338)
 68 KOG0296 Angio-associated migra  98.3 5.6E-06 1.2E-10   94.0  11.7  196  107-349   117-398 (399)
 69 KOG0313 Microtubule binding pr  98.3 2.9E-06 6.2E-11   96.6   9.4  129  153-306   199-376 (423)
 70 KOG0301 Phospholipase A2-activ  98.2 1.8E-06 3.8E-11  103.7   7.7  107  156-294    70-198 (745)
 71 KOG0641 WD40 repeat protein [G  98.2 7.9E-06 1.7E-10   88.2  11.7  128  155-304    99-261 (350)
 72 TIGR03866 PQQ_ABC_repeats PQQ-  98.2 5.1E-05 1.1E-09   80.3  17.2  128  153-308    38-189 (300)
 73 KOG0640 mRNA cleavage stimulat  98.2 9.5E-06 2.1E-10   90.7  11.8  166  111-306    82-335 (430)
 74 KOG0647 mRNA export protein (c  98.2 7.4E-06 1.6E-10   91.3  10.9  123  157-309    40-187 (347)
 75 KOG0646 WD40 repeat protein [G  98.2 9.3E-06   2E-10   94.3  11.9  150  131-307    61-248 (476)
 76 KOG0285 Pleiotropic regulator   98.2 2.6E-06 5.7E-11   96.4   6.5  135  145-309   228-392 (460)
 77 KOG0308 Conserved WD40 repeat-  98.2 1.1E-05 2.4E-10   96.6  11.8   93  154-265   127-253 (735)
 78 KOG0267 Microtubule severing p  98.1 2.1E-06 4.5E-11  103.4   5.6   83  156-245    81-186 (825)
 79 KOG1034 Transcriptional repres  98.1 4.7E-06   1E-10   93.7   7.4   82  158-245   106-213 (385)
 80 KOG1273 WD40 repeat protein [G  98.1 1.4E-05 3.1E-10   89.6  10.8  111  149-307    27-138 (405)
 81 KOG0302 Ribosome Assembly prot  98.1 5.8E-06 1.2E-10   94.2   7.3   83  157-245   270-380 (440)
 82 KOG0296 Angio-associated migra  98.1 1.9E-05   4E-10   89.9  11.2  127  140-296   186-389 (399)
 83 KOG0269 WD40 repeat-containing  98.1   5E-06 1.1E-10  100.8   6.9   95  156-264   145-264 (839)
 84 KOG0292 Vesicle coat complex C  98.1 1.7E-05 3.8E-10   97.2  11.0  130  138-294     2-154 (1202)
 85 PRK11028 6-phosphogluconolacto  98.0 0.00017 3.8E-09   80.3  18.0  141  152-307    84-259 (330)
 86 KOG1408 WD40 repeat protein [F  98.0 2.8E-05   6E-10   93.8  12.1  144  152-317   464-680 (1080)
 87 KOG0289 mRNA splicing factor [  98.0 1.5E-05 3.3E-10   92.1   9.6  117  153-293   355-494 (506)
 88 KOG0306 WD40-repeat-containing  98.0 3.6E-05 7.8E-10   93.4  12.9  213  112-365   343-586 (888)
 89 KOG0302 Ribosome Assembly prot  98.0   7E-05 1.5E-09   85.7  14.5  150  131-307   141-381 (440)
 90 KOG0282 mRNA splicing factor [  98.0 8.9E-06 1.9E-10   94.8   7.4  100  157-265   227-350 (503)
 91 KOG1924 RhoA GTPase effector D  98.0 7.9E-06 1.7E-10   99.0   7.1    9  114-122   616-624 (1102)
 92 KOG0306 WD40-repeat-containing  97.9   2E-05 4.3E-10   95.6   8.6  117  153-296   516-655 (888)
 93 KOG0282 mRNA splicing factor [  97.9 1.9E-05 4.2E-10   92.1   8.2  151  126-305   158-329 (503)
 94 KOG0321 WD40 repeat-containing  97.9   3E-05 6.6E-10   92.8  10.0  129  159-306   114-301 (720)
 95 KOG4283 Transcription-coupled   97.9 3.2E-05 6.9E-10   86.2   9.5   90  157-252   158-285 (397)
 96 KOG0278 Serine/threonine kinas  97.9 2.1E-05 4.6E-10   86.1   7.7   94  156-262   154-310 (334)
 97 KOG0644 Uncharacterized conser  97.9 1.3E-05 2.9E-10   97.7   6.4   84  149-243   187-300 (1113)
 98 KOG0277 Peroxisomal targeting   97.9 1.3E-05 2.7E-10   88.0   5.2   53  188-246   215-268 (311)
 99 KOG4283 Transcription-coupled   97.9 0.00012 2.6E-09   81.8  12.4  126  157-307    56-220 (397)
100 KOG0267 Microtubule severing p  97.9 1.3E-05 2.8E-10   96.9   5.1   80  157-243   124-226 (825)
101 KOG0301 Phospholipase A2-activ  97.9  0.0001 2.2E-09   89.1  12.3  122  153-307   147-289 (745)
102 KOG0772 Uncharacterized conser  97.9 6.4E-05 1.4E-09   88.4  10.4  170  159-365   283-499 (641)
103 KOG1445 Tumor-specific antigen  97.8 0.00012 2.6E-09   87.6  12.5  159  134-308   626-846 (1012)
104 KOG0649 WD40 repeat protein [G  97.8   5E-05 1.1E-09   83.0   8.5  139  107-267    71-247 (325)
105 KOG0270 WD40 repeat-containing  97.8 0.00011 2.3E-09   85.4  11.6   81  157-243   192-317 (463)
106 KOG0303 Actin-binding protein   97.8 0.00015 3.3E-09   83.4  12.5  168  133-328    59-312 (472)
107 KOG0643 Translation initiation  97.8 5.7E-05 1.2E-09   83.5   8.7   80  188-295   171-251 (327)
108 KOG0275 Conserved WD40 repeat-  97.8 0.00015 3.2E-09   81.6  11.6  134  153-310   271-471 (508)
109 KOG0277 Peroxisomal targeting   97.8 0.00027 5.9E-09   77.9  12.6  125  157-307    73-222 (311)
110 KOG0303 Actin-binding protein   97.7 9.6E-05 2.1E-09   84.9   9.2  133  133-297    25-195 (472)
111 KOG1332 Vesicle coat complex C  97.7 6.4E-05 1.4E-09   82.3   6.7   87  157-248    23-139 (299)
112 KOG0278 Serine/threonine kinas  97.7 8.2E-05 1.8E-09   81.7   7.4  117  155-296    27-205 (334)
113 KOG2139 WD40 repeat protein [G  97.7 0.00033 7.1E-09   80.1  12.0  152  147-307    98-312 (445)
114 KOG4328 WD40 protein [Function  97.7  0.0002 4.4E-09   83.5  10.5  137  146-305   183-398 (498)
115 KOG0288 WD40 repeat protein Ti  97.7 3.8E-05 8.3E-10   88.4   4.6   93  156-267   186-303 (459)
116 KOG1063 RNA polymerase II elon  97.6 0.00016 3.4E-09   87.5   9.3  137  159-299    71-291 (764)
117 KOG0645 WD40 repeat protein [G  97.6 0.00037 8.1E-09   77.3  11.1  132  150-306    15-180 (312)
118 KOG1332 Vesicle coat complex C  97.6 0.00025 5.5E-09   77.8   9.5  125  157-302   116-282 (299)
119 KOG1407 WD40 repeat protein [F  97.6  0.0008 1.7E-08   74.5  13.0  136  153-296    26-210 (313)
120 PF08662 eIF2A:  Eukaryotic tra  97.6 0.00028 6.1E-09   74.6   9.0  119  108-243    32-179 (194)
121 KOG1274 WD40 repeat protein [G  97.5 0.00028   6E-09   87.5  10.1  135  188-350   120-263 (933)
122 KOG0264 Nucleosome remodeling   97.5 0.00043 9.4E-09   80.6  10.9  136  157-304   240-402 (422)
123 KOG1445 Tumor-specific antigen  97.5 0.00036 7.8E-09   83.7  10.3  172  160-361   143-360 (1012)
124 KOG0646 WD40 repeat protein [G  97.5 0.00015 3.3E-09   84.5   7.1   95  152-264   130-316 (476)
125 KOG0973 Histone transcription   97.5 0.00029 6.3E-09   88.5   9.9  121  156-298    24-152 (942)
126 KOG4378 Nuclear protein COP1 [  97.5 0.00031 6.8E-09   82.5   9.3  124  157-307    91-281 (673)
127 KOG0270 WD40 repeat-containing  97.5 0.00043 9.3E-09   80.6  10.3  128  107-247   191-408 (463)
128 KOG0299 U3 snoRNP-associated p  97.5 0.00018 3.9E-09   83.9   6.8  134  138-298   135-309 (479)
129 KOG1188 WD40 repeat protein [G  97.5 0.00088 1.9E-08   76.2  11.8   83  157-244    84-197 (376)
130 KOG1009 Chromatin assembly com  97.5  0.0006 1.3E-08   78.8  10.6  160  153-353    21-231 (434)
131 KOG0294 WD40 repeat-containing  97.4 0.00022 4.9E-09   80.3   6.9   53  188-245   231-283 (362)
132 KOG2048 WD40 repeat protein [G  97.4 0.00073 1.6E-08   81.9  11.4  101  227-336   337-441 (691)
133 PRK11028 6-phosphogluconolacto  97.4  0.0023 4.9E-08   71.5  14.3  132  155-308   135-306 (330)
134 KOG1446 Histone H3 (Lys4) meth  97.4  0.0014 2.9E-08   74.0  12.0  122  154-304    23-170 (311)
135 KOG0643 Translation initiation  97.4 0.00085 1.8E-08   74.5   9.9   79  188-294    34-112 (327)
136 KOG0321 WD40 repeat-containing  97.4 0.00028   6E-09   84.9   6.7  104  134-243    36-175 (720)
137 KOG0316 Conserved WD40 repeat-  97.4  0.0005 1.1E-08   75.3   7.9  110  156-296    70-204 (307)
138 KOG1007 WD repeat protein TSSC  97.3 0.00045 9.8E-09   77.2   7.6   84  148-245   182-291 (370)
139 KOG0268 Sof1-like rRNA process  97.3 0.00048   1E-08   78.8   7.7  121  160-307    82-260 (433)
140 KOG1446 Histone H3 (Lys4) meth  97.3  0.0032   7E-08   71.1  13.8  196  107-348    25-261 (311)
141 KOG0305 Anaphase promoting com  97.3 0.00055 1.2E-08   81.8   8.3  125  155-307   227-374 (484)
142 KOG0639 Transducin-like enhanc  97.3  0.0005 1.1E-08   80.9   7.5  125  153-304   517-704 (705)
143 KOG0772 Uncharacterized conser  97.3  0.0029 6.2E-08   75.1  13.6  184  141-346   157-442 (641)
144 KOG0269 WD40 repeat-containing  97.3 0.00037   8E-09   85.3   6.6  114  156-294    99-239 (839)
145 COG2319 FOG: WD40 repeat [Gene  97.2  0.0037 8.1E-08   65.6  12.7  124  156-308   121-273 (466)
146 KOG0322 G-protein beta subunit  97.2 0.00045 9.7E-09   76.5   5.7   48  188-242   275-322 (323)
147 KOG2096 WD40 repeat protein [G  97.2  0.0024 5.2E-08   72.4  11.4  138  150-310    91-262 (420)
148 KOG1034 Transcriptional repres  97.2 0.00082 1.8E-08   76.2   7.8   83  188-293   117-199 (385)
149 KOG0307 Vesicle coat complex C  97.2  0.0012 2.7E-08   83.6   9.8  168  112-307    89-285 (1049)
150 KOG0300 WD40 repeat-containing  97.1  0.0019 4.2E-08   72.9   9.6  118  114-251   295-436 (481)
151 KOG1408 WD40 repeat protein [F  97.1 0.00059 1.3E-08   82.9   5.9   85  153-244   602-714 (1080)
152 KOG0641 WD40 repeat protein [G  97.0  0.0019 4.1E-08   70.3   7.4  118  107-245   151-305 (350)
153 KOG0771 Prolactin regulatory e  96.9  0.0045 9.8E-08   72.0  10.3  133  149-297   144-303 (398)
154 COG2319 FOG: WD40 repeat [Gene  96.8   0.014 3.1E-07   61.3  12.8  120  156-301    76-224 (466)
155 KOG1036 Mitotic spindle checkp  96.8  0.0023 4.9E-08   72.2   6.9  116  105-244    23-164 (323)
156 KOG0650 WD40 repeat nucleolar   96.8 0.00091   2E-08   80.2   3.9   37  151-187   404-445 (733)
157 PRK01742 tolB translocation pr  96.8   0.018 3.9E-07   67.7  14.1  125  153-308   211-363 (429)
158 KOG1274 WD40 repeat protein [G  96.8  0.0068 1.5E-07   75.8  11.0  132  150-306    99-262 (933)
159 KOG4328 WD40 protein [Function  96.8  0.0074 1.6E-07   71.0  10.6  123  163-304   297-448 (498)
160 PRK04922 tolB translocation pr  96.7   0.024 5.2E-07   66.6  15.0  128  153-306   211-368 (433)
161 KOG0649 WD40 repeat protein [G  96.7   0.014   3E-07   64.6  11.9   95  188-303   138-234 (325)
162 KOG4547 WD40 repeat-containing  96.7  0.0079 1.7E-07   72.3  10.7  132  182-336   160-292 (541)
163 KOG2096 WD40 repeat protein [G  96.7   0.011 2.3E-07   67.3  10.9  171  116-306   158-362 (420)
164 KOG0642 Cell-cycle nuclear pro  96.6  0.0022 4.8E-08   76.6   5.5   54  132-187   331-397 (577)
165 KOG0974 WD-repeat protein WDR6  96.6  0.0017 3.7E-08   81.6   4.6   82  156-244   186-289 (967)
166 PRK01742 tolB translocation pr  96.6   0.016 3.6E-07   68.0  12.1  115  165-307   182-325 (429)
167 PF00400 WD40:  WD domain, G-be  96.6  0.0024 5.1E-08   49.6   3.5   39  196-241     1-39  (39)
168 KOG2048 WD40 repeat protein [G  96.5   0.013 2.9E-07   71.4  11.2  129  152-307   115-277 (691)
169 KOG2111 Uncharacterized conser  96.5  0.0049 1.1E-07   69.9   7.0   84  156-245   147-258 (346)
170 KOG1036 Mitotic spindle checkp  96.5   0.021 4.6E-07   64.7  11.8  142  155-327    23-187 (323)
171 KOG2055 WD40 repeat protein [G  96.5   0.012 2.6E-07   69.4  10.0  163  114-306   236-467 (514)
172 PRK05137 tolB translocation pr  96.4   0.039 8.4E-07   64.9  14.1  126  153-306   209-366 (435)
173 KOG1517 Guanine nucleotide bin  96.4   0.012 2.5E-07   74.7   9.7  127  157-304  1178-1333(1387)
174 KOG3914 WD repeat protein WDR4  96.4   0.005 1.1E-07   71.3   6.2   76  153-268   159-236 (390)
175 PF10282 Lactonase:  Lactonase,  96.4    0.21 4.5E-06   57.3  19.0  177  153-349    92-322 (345)
176 PF08662 eIF2A:  Eukaryotic tra  96.4   0.048   1E-06   57.9  13.0  117  188-343    41-159 (194)
177 TIGR02800 propeller_TolB tol-p  96.3   0.034 7.3E-07   63.8  12.6  127  153-307   197-355 (417)
178 KOG0283 WD40 repeat-containing  96.3   0.019 4.1E-07   71.3  10.9  129  155-307   420-577 (712)
179 KOG2110 Uncharacterized conser  96.2    0.11 2.3E-06   60.5  15.3  130  153-309    91-251 (391)
180 KOG0647 mRNA export protein (c  96.2   0.013 2.9E-07   66.2   7.8   82  154-245    81-186 (347)
181 PRK03629 tolB translocation pr  96.2   0.058 1.2E-06   63.7  13.6  130  152-307   205-364 (429)
182 KOG4227 WD40 repeat protein [G  96.2   0.013 2.8E-07   67.9   7.7   88  152-244    63-226 (609)
183 KOG2321 WD40 repeat protein [G  96.1   0.016 3.5E-07   69.8   8.5  128  153-307   181-347 (703)
184 KOG0318 WD40 repeat stress pro  96.1   0.047   1E-06   65.4  11.9   32  156-187   331-364 (603)
185 KOG2445 Nuclear pore complex c  96.0   0.062 1.3E-06   61.2  12.2  151  157-348    25-175 (361)
186 KOG1524 WD40 repeat-containing  96.0   0.034 7.3E-07   66.7  10.2  113  153-293   112-245 (737)
187 KOG3881 Uncharacterized conser  95.9   0.026 5.7E-07   65.6   9.0  157  103-298   105-270 (412)
188 PRK02889 tolB translocation pr  95.9   0.067 1.5E-06   63.0  12.7  130  152-307   202-361 (427)
189 KOG0268 Sof1-like rRNA process  95.8   0.012 2.6E-07   67.8   5.7  162  111-298   144-338 (433)
190 KOG1272 WD40-repeat-containing  95.8   0.021 4.5E-07   67.6   7.6   76  160-242   224-322 (545)
191 KOG1063 RNA polymerase II elon  95.8   0.096 2.1E-06   64.5  13.3  112  156-304   205-344 (764)
192 PRK04922 tolB translocation pr  95.8   0.088 1.9E-06   62.0  12.8  115  167-307   184-325 (433)
193 KOG1273 WD40 repeat protein [G  95.8   0.051 1.1E-06   62.0  10.1   53  112-176    44-96  (405)
194 KOG0290 Conserved WD40 repeat-  95.7   0.025 5.4E-07   63.9   7.3   52  188-245   268-320 (364)
195 KOG2394 WD40 protein DMR-N9 [G  95.7   0.041   9E-07   66.0   9.3   62  153-215   298-382 (636)
196 COG2706 3-carboxymuconate cycl  95.6    0.48   1E-05   55.0  17.3  177  107-310    50-278 (346)
197 PRK04792 tolB translocation pr  95.5    0.28 6.1E-06   58.4  15.7  129  152-306   224-382 (448)
198 KOG0650 WD40 repeat nucleolar   95.5   0.041 8.9E-07   66.7   8.4   82  199-308   393-474 (733)
199 PRK03629 tolB translocation pr  95.4    0.16 3.5E-06   60.0  13.1  113  167-307   179-320 (429)
200 KOG2919 Guanine nucleotide-bin  95.1   0.056 1.2E-06   61.9   7.8  166  107-306   169-369 (406)
201 TIGR02800 propeller_TolB tol-p  95.1    0.22 4.9E-06   57.2  12.7  114  166-307   169-311 (417)
202 KOG2110 Uncharacterized conser  95.0   0.055 1.2E-06   62.7   7.3   83  156-246   140-251 (391)
203 KOG1407 WD40 repeat protein [F  94.9   0.098 2.1E-06   58.6   8.8   86  188-299    44-130 (313)
204 KOG2314 Translation initiation  94.9    0.17 3.6E-06   61.3  11.0  113  218-359   454-583 (698)
205 PRK05137 tolB translocation pr  94.7    0.22 4.7E-06   58.7  11.4  111  167-306   182-322 (435)
206 KOG0644 Uncharacterized conser  94.6   0.069 1.5E-06   66.8   7.2   42  153-194   238-300 (1113)
207 PF10282 Lactonase:  Lactonase,  94.6    0.84 1.8E-05   52.4  15.5  150  154-328   152-341 (345)
208 KOG0642 Cell-cycle nuclear pro  94.5   0.029 6.3E-07   67.5   3.8   81  158-245   307-428 (577)
209 PRK00178 tolB translocation pr  94.5    0.84 1.8E-05   53.4  15.7  127  153-307   206-364 (430)
210 KOG1188 WD40 repeat protein [G  94.3    0.21 4.4E-06   57.7   9.7  140  132-306    26-196 (376)
211 KOG1923 Rac1 GTPase effector F  94.3   0.074 1.6E-06   66.1   6.6   16  349-364   466-481 (830)
212 KOG2919 Guanine nucleotide-bin  94.3    0.29 6.2E-06   56.4  10.6   90  149-245    53-189 (406)
213 KOG2445 Nuclear pore complex c  94.2    0.12 2.5E-06   59.1   7.4  109  137-269   225-335 (361)
214 KOG1009 Chromatin assembly com  94.2   0.082 1.8E-06   61.9   6.2  156  115-293    38-248 (434)
215 PRK02889 tolB translocation pr  94.1    0.31 6.8E-06   57.5  11.1  122  160-307   166-317 (427)
216 KOG0309 Conserved WD40 repeat-  94.1    0.03 6.4E-07   69.1   2.6   64  188-265   182-246 (1081)
217 PF02239 Cytochrom_D1:  Cytochr  94.0     0.6 1.3E-05   54.7  13.0  135  148-306    39-202 (369)
218 PLN02919 haloacid dehalogenase  93.9    0.65 1.4E-05   61.3  14.4   78  210-307   806-889 (1057)
219 KOG1517 Guanine nucleotide bin  93.8    0.11 2.3E-06   66.6   6.8   82  157-245  1221-1335(1387)
220 PRK01029 tolB translocation pr  93.6     1.6 3.5E-05   51.9  15.9   83  199-308   319-405 (428)
221 PF06705 SF-assemblin:  SF-asse  93.6      10 0.00022   42.2  21.0   76  740-824    71-157 (247)
222 PF02239 Cytochrom_D1:  Cytochr  93.6     0.4 8.7E-06   56.1  10.5   96  182-305    12-107 (369)
223 KOG2695 WD40 repeat protein [G  93.5    0.22 4.8E-06   57.6   8.0  132  148-303   255-424 (425)
224 KOG4378 Nuclear protein COP1 [  93.3    0.19 4.1E-06   60.2   7.2   76  207-306   164-239 (673)
225 KOG1007 WD repeat protein TSSC  93.0    0.48   1E-05   54.0   9.5   96  143-245   117-247 (370)
226 KOG0290 Conserved WD40 repeat-  92.9    0.93   2E-05   51.8  11.6  173  135-335    96-336 (364)
227 KOG1539 WD repeat protein [Gen  92.9    0.23   5E-06   62.4   7.5   81  160-246   175-278 (910)
228 KOG1310 WD40 repeat protein [G  92.7    0.64 1.4E-05   56.5  10.5   32  156-187    61-94  (758)
229 KOG2055 WD40 repeat protein [G  92.4    0.45 9.8E-06   56.7   8.6  119  107-242   355-511 (514)
230 KOG1310 WD40 repeat protein [G  92.3    0.24 5.2E-06   59.9   6.4   51  188-244    74-126 (758)
231 KOG0307 Vesicle coat complex C  92.2    0.35 7.5E-06   62.4   8.0   80  159-245    82-194 (1049)
232 KOG1587 Cytoplasmic dynein int  92.1    0.38 8.1E-06   59.4   7.9  115  159-298   363-509 (555)
233 PRK00178 tolB translocation pr  92.0     1.7 3.7E-05   50.9  13.0  112  168-307   180-320 (430)
234 PF00400 WD40:  WD domain, G-be  92.0    0.16 3.5E-06   39.3   3.1   18  156-173    22-39  (39)
235 COG5170 CDC55 Serine/threonine  91.8    0.34 7.4E-06   55.5   6.5  135  157-308    38-205 (460)
236 KOG0322 G-protein beta subunit  91.8    0.39 8.5E-06   54.1   6.9   25  270-294   288-312 (323)
237 KOG3671 Actin regulatory prote  91.7    0.27 5.9E-06   58.9   5.9    6   25-30    375-380 (569)
238 KOG2106 Uncharacterized conser  91.1     1.4 3.1E-05   53.2  10.9   77  157-242   213-315 (626)
239 COG5178 PRP8 U5 snRNP spliceos  90.9    0.14   3E-06   65.6   2.5   19 1057-1075 1204-1222(2365)
240 KOG1272 WD40-repeat-containing  90.8    0.35 7.6E-06   57.7   5.6   91  150-241   296-419 (545)
241 KOG1645 RING-finger-containing  90.8     2.6 5.6E-05   50.1  12.4  153  181-367   169-324 (463)
242 PRK04792 tolB translocation pr  90.7     2.7 5.9E-05   50.2  13.1   93  188-308   244-340 (448)
243 KOG4497 Uncharacterized conser  90.6     1.3 2.7E-05   51.5   9.5   92  152-251    15-130 (447)
244 KOG2236 Uncharacterized conser  90.4    0.58 1.3E-05   55.9   6.9   44   15-61    404-447 (483)
245 PLN02919 haloacid dehalogenase  90.2     3.5 7.5E-05   54.8  14.4  137  152-307   572-771 (1057)
246 KOG3881 Uncharacterized conser  89.9    0.58 1.3E-05   54.9   6.3   95  139-244   202-321 (412)
247 PRK01029 tolB translocation pr  89.6     3.7   8E-05   49.0  12.9   78  209-308   282-361 (428)
248 KOG1963 WD40 repeat protein [G  89.5     2.6 5.6E-05   53.6  11.8  164  153-365   213-390 (792)
249 KOG1923 Rac1 GTPase effector F  89.4     1.3 2.7E-05   55.9   8.9    8   56-63    313-320 (830)
250 KOG4190 Uncharacterized conser  89.2    0.84 1.8E-05   55.3   7.0  117  156-291   746-892 (1034)
251 KOG0994 Extracellular matrix g  89.1      99  0.0021   41.7  25.7   33  279-311   656-691 (1758)
252 KOG2675 Adenylate cyclase-asso  88.9    0.39 8.5E-06   56.9   4.0   28  223-252   421-448 (480)
253 PF08450 SGL:  SMP-30/Gluconola  88.7     7.1 0.00015   42.2  13.3   97  188-309    62-167 (246)
254 smart00320 WD40 WD40 repeats.   88.3       1 2.2E-05   31.3   4.5   39  196-241     2-40  (40)
255 PF15492 Nbas_N:  Neuroblastoma  87.9     4.5 9.8E-05   46.2  11.3   41  147-187    43-86  (282)
256 KOG1354 Serine/threonine prote  87.8       2 4.2E-05   50.2   8.5  140  156-308    36-197 (433)
257 KOG0280 Uncharacterized conser  87.6     1.2 2.6E-05   51.0   6.7   81  157-245   223-335 (339)
258 KOG1240 Protein kinase contain  87.5     1.6 3.4E-05   57.4   8.3  128  148-298  1050-1218(1431)
259 KOG1409 Uncharacterized conser  87.5    0.76 1.6E-05   53.4   5.0   30  158-187   210-241 (404)
260 KOG1830 Wiskott Aldrich syndro  86.5     3.2 6.9E-05   49.4   9.4    6  150-155   494-499 (518)
261 KOG1912 WD40 repeat protein [G  86.3     6.1 0.00013   50.2  12.0  209  115-325    35-313 (1062)
262 PRK15319 AIDA autotransporter-  86.1     1.3 2.8E-05   60.2   6.8    7  283-289  1912-1918(2039)
263 KOG2139 WD40 repeat protein [G  85.6     7.9 0.00017   45.7  11.8  150  188-361   220-433 (445)
264 PF02897 Peptidase_S9_N:  Proly  85.5       5 0.00011   46.7  10.6   59  233-308   200-262 (414)
265 KOG1538 Uncharacterized conser  85.3     1.1 2.5E-05   55.4   5.3  101  188-296    35-153 (1081)
266 KOG1963 WD40 repeat protein [G  85.2     7.1 0.00015   49.9  12.0   88  199-303   448-535 (792)
267 KOG0309 Conserved WD40 repeat-  84.4     1.3 2.7E-05   55.6   5.1   34  153-187   167-202 (1081)
268 KOG2106 Uncharacterized conser  84.2     5.7 0.00012   48.4  10.1   48  188-242   224-274 (626)
269 KOG1334 WD40 repeat protein [G  83.6     1.6 3.4E-05   52.7   5.3   68  157-251   406-474 (559)
270 KOG1240 Protein kinase contain  83.0      25 0.00053   47.1  15.6  201  157-382  1162-1401(1431)
271 KOG0771 Prolactin regulatory e  82.9     5.5 0.00012   47.4   9.2  123  153-307   194-357 (398)
272 KOG2695 WD40 repeat protein [G  82.9     1.6 3.5E-05   50.9   4.9   80  188-292   276-363 (425)
273 KOG1587 Cytoplasmic dynein int  82.7     5.3 0.00011   49.7   9.5  111  156-296   254-378 (555)
274 KOG1524 WD40 repeat-containing  82.3     8.2 0.00018   47.4  10.5  121  146-307   161-288 (737)
275 COG4946 Uncharacterized protei  81.4      39 0.00085   41.4  15.4  161  107-295   277-463 (668)
276 smart00320 WD40 WD40 repeats.   81.1     1.2 2.7E-05   30.9   2.2   18  156-173    23-40  (40)
277 KOG0132 RNA polymerase II C-te  81.1       4 8.8E-05   51.7   7.7    6  369-374   837-842 (894)
278 KOG0974 WD-repeat protein WDR6  81.1     2.4 5.2E-05   54.8   6.0   84  150-242   138-245 (967)
279 KOG2079 Vacuolar assembly/sort  80.6     3.2   7E-05   54.1   6.8   65  153-218    95-183 (1206)
280 KOG4672 Uncharacterized conser  80.0     7.2 0.00016   46.5   8.8   14    8-21    286-299 (487)
281 TIGR02658 TTQ_MADH_Hv methylam  79.6      14 0.00031   43.6  11.2   79  232-331    74-153 (352)
282 PF11101 DUF2884:  Protein of u  79.6 1.1E+02  0.0024   34.2  18.4   24  814-837    46-69  (229)
283 PF05308 Mito_fiss_reg:  Mitoch  79.4       3 6.6E-05   47.0   5.5    7   86-92    238-244 (253)
284 TIGR02658 TTQ_MADH_Hv methylam  79.4      29 0.00062   41.1  13.5  138  135-308   182-332 (352)
285 KOG2315 Predicted translation   79.3     4.9 0.00011   49.3   7.4  120  108-245   244-392 (566)
286 TIGR03300 assembly_YfgL outer   79.1      21 0.00045   41.1  12.3   81  157-245   241-340 (377)
287 KOG2111 Uncharacterized conser  78.7      35 0.00076   40.0  13.5   93  188-306   161-256 (346)
288 PF01442 Apolipoprotein:  Apoli  78.7      82  0.0018   32.2  23.5   23  744-766     3-25  (202)
289 COG3386 Gluconolactonase [Carb  78.7      25 0.00054   40.8  12.6  140  150-307    37-194 (307)
290 PRK04043 tolB translocation pr  78.2      24 0.00053   42.3  12.8  127  153-308   195-359 (419)
291 KOG2675 Adenylate cyclase-asso  78.0     3.2 6.9E-05   49.7   5.2   10   85-95    265-274 (480)
292 COG2706 3-carboxymuconate cycl  77.2      55  0.0012   38.8  14.7   90  206-308    87-177 (346)
293 PF01442 Apolipoprotein:  Apoli  75.7      99  0.0021   31.6  25.8   49  773-821    13-64  (202)
294 KOG3914 WD repeat protein WDR4  75.6      15 0.00032   43.8   9.7   93  188-311   134-228 (390)
295 PF01213 CAP_N:  Adenylate cycl  75.5    0.91   2E-05   52.5   0.0    7   88-94    265-271 (312)
296 COG5354 Uncharacterized protei  73.8     7.9 0.00017   47.3   7.1   95  135-245   274-397 (561)
297 KOG1064 RAVE (regulator of V-A  73.0       3 6.4E-05   56.9   3.7   72  156-281  2347-2419(2439)
298 KOG1925 Rac1 GTPase effector F  71.2     3.4 7.3E-05   50.0   3.3    6  822-827   483-488 (817)
299 KOG2321 WD40 repeat protein [G  70.6     7.6 0.00016   48.0   6.0   61  157-221   240-325 (703)
300 KOG4849 mRNA cleavage factor I  70.4      15 0.00032   43.2   7.9   14   23-36    224-237 (498)
301 KOG4547 WD40 repeat-containing  70.1      17 0.00038   44.9   8.9   61  188-269   126-186 (541)
302 PRK06800 fliH flagellar assemb  69.9 1.5E+02  0.0033   32.6  14.7  101  744-851    36-140 (228)
303 PF04286 DUF445:  Protein of un  69.6 1.8E+02   0.004   33.2  16.7   17  785-801   184-200 (367)
304 KOG4714 Nucleoporin [Nuclear s  69.6      11 0.00024   43.0   6.7   51  188-244   204-255 (319)
305 PF07250 Glyoxal_oxid_N:  Glyox  69.5      40 0.00087   38.1  11.0  143  115-301    48-194 (243)
306 KOG0132 RNA polymerase II C-te  68.8      12 0.00026   47.8   7.2   21   51-71    621-641 (894)
307 KOG1354 Serine/threonine prote  68.3      24 0.00053   41.7   9.1  138  158-303   227-431 (433)
308 PF05694 SBP56:  56kDa selenium  67.3      23 0.00049   43.2   9.0   58  231-306   218-277 (461)
309 COG5354 Uncharacterized protei  65.1      71  0.0015   39.5  12.4  121  107-244   145-307 (561)
310 PRK04043 tolB translocation pr  65.0      74  0.0016   38.3  12.8   98  185-308   212-311 (419)
311 KOG4849 mRNA cleavage factor I  64.9      15 0.00033   43.1   6.6   13    4-16    232-244 (498)
312 PF06705 SF-assemblin:  SF-asse  64.8 2.4E+02  0.0051   31.6  25.1   37  788-824     9-45  (247)
313 PF14783 BBS2_Mid:  Ciliary BBS  64.4      27 0.00058   35.2   7.5   54  152-229    48-101 (111)
314 PF03938 OmpH:  Outer membrane   63.9      93   0.002   31.9  11.6   79  737-820    27-112 (158)
315 PF03178 CPSF_A:  CPSF A subuni  63.5 1.1E+02  0.0025   34.7  13.4  152  156-355    41-208 (321)
316 PF11715 Nup160:  Nucleoporin N  63.1      15 0.00033   44.9   6.7   99  150-266   148-259 (547)
317 KOG1538 Uncharacterized conser  62.7      14  0.0003   46.5   6.1   74  200-300     5-78  (1081)
318 COG5178 PRP8 U5 snRNP spliceos  62.1     4.9 0.00011   52.6   2.4   17  135-151    98-114 (2365)
319 KOG0971 Microtubule-associated  61.2 5.4E+02   0.012   34.5  27.3  217  740-990   263-547 (1243)
320 KOG2236 Uncharacterized conser  60.9      19 0.00042   43.7   6.8    9   77-85    465-473 (483)
321 PRK09752 adhesin; Provisional   60.6     9.5 0.00021   50.8   4.6    8   81-88    955-962 (1250)
322 KOG1008 Uncharacterized conser  59.1     3.7   8E-05   51.2   0.6   49  188-242   131-183 (783)
323 PF04762 IKI3:  IKI3 family;  I  58.5      53  0.0011   43.6  10.8  108  156-289   220-362 (928)
324 KOG1920 IkappaB kinase complex  57.3      95  0.0021   41.9  12.4  100  150-265   207-334 (1265)
325 KOG4227 WD40 repeat protein [G  57.0      84  0.0018   37.8  10.8  125  157-296   207-378 (609)
326 PF04100 Vps53_N:  Vps53-like,   56.1 3.5E+02  0.0076   32.5  16.1   85 1030-1122  122-218 (383)
327 PF04286 DUF445:  Protein of un  55.5 3.7E+02   0.008   30.8  20.0    7  606-612    35-41  (367)
328 KOG4497 Uncharacterized conser  55.2      28  0.0006   41.0   6.6   19  157-175   222-240 (447)
329 KOG2315 Predicted translation   54.6 1.1E+02  0.0023   38.4  11.6  187  108-342   140-369 (566)
330 PF07464 ApoLp-III:  Apolipopho  54.5 1.4E+02   0.003   31.8  11.1   85  753-854     7-91  (155)
331 PF02333 Phytase:  Phytase;  In  54.3 4.4E+02  0.0095   32.0  16.4   91  209-317   157-248 (381)
332 KOG1645 RING-finger-containing  53.7      53  0.0011   39.7   8.6  170  107-297   145-352 (463)
333 KOG2391 Vacuolar sorting prote  53.5      24 0.00053   41.5   5.8    7  819-825   265-271 (365)
334 PF06152 Phage_min_cap2:  Phage  53.1 4.7E+02    0.01   31.3  19.3   23  769-791    14-36  (361)
335 PF01690 PLRV_ORF5:  Potato lea  53.0      11 0.00023   45.9   3.0   26  285-310   192-218 (465)
336 PF13360 PQQ_2:  PQQ-like domai  52.0 2.6E+02  0.0057   29.4  13.0   25  283-308   208-232 (238)
337 COG4946 Uncharacterized protei  51.7      38 0.00082   41.5   7.1   72  148-223   400-502 (668)
338 PF03022 MRJP:  Major royal jel  51.4      99  0.0021   35.4  10.3  113  236-362    35-172 (287)
339 PF04912 Dynamitin:  Dynamitin   50.0      56  0.0012   38.9   8.3   51  746-802   336-386 (388)
340 PF10691 DUF2497:  Protein of u  49.6      50  0.0011   31.1   6.2   28  818-845    43-70  (73)
341 KOG4368 Predicted RNA binding   49.4 6.8E+02   0.015   32.1  17.0   30  929-958   255-284 (757)
342 KOG1912 WD40 repeat protein [G  49.0   1E+02  0.0022   40.1  10.4   56  188-246    91-146 (1062)
343 KOG3621 WD40 repeat-containing  48.1      67  0.0015   41.1   8.7  131  151-306    39-199 (726)
344 KOG4640 Anaphase-promoting com  47.4      16 0.00034   45.9   3.3   50  107-176    41-93  (665)
345 COG3851 UhpB Signal transducti  47.0   2E+02  0.0043   34.8  11.8   28  797-824   271-298 (497)
346 PRK14142 heat shock protein Gr  46.7 1.1E+02  0.0024   34.4   9.3   45  788-840    58-102 (223)
347 PRK14163 heat shock protein Gr  46.6 2.2E+02  0.0047   31.9  11.5   46  787-840    64-109 (214)
348 KOG0280 Uncharacterized conser  46.4      57  0.0012   38.1   7.2   78  160-243   136-241 (339)
349 PF15450 DUF4631:  Domain of un  46.0 7.2E+02   0.016   31.4  29.0   82  740-824   168-258 (531)
350 KOG1064 RAVE (regulator of V-A  46.0      29 0.00064   48.2   5.6   46  188-242  2317-2365(2439)
351 KOG2394 WD40 protein DMR-N9 [G  46.0      26 0.00057   43.3   4.8   51  209-285   334-384 (636)
352 PF07569 Hira:  TUP1-like enhan  45.2      57  0.0012   36.0   6.9   58  146-203     8-85  (219)
353 PF07433 DUF1513:  Protein of u  44.5 1.2E+02  0.0026   35.5   9.6   85  188-296    30-119 (305)
354 PF14583 Pectate_lyase22:  Olig  44.3      88  0.0019   37.7   8.7   71  107-187    46-123 (386)
355 PF11768 DUF3312:  Protein of u  44.2      46   0.001   41.5   6.5   62  156-245   270-331 (545)
356 KOG4673 Transcription factor T  44.0 8.8E+02   0.019   31.8  26.3  136  748-891   507-673 (961)
357 KOG1334 WD40 repeat protein [G  43.2      61  0.0013   39.9   7.1   99  188-307   166-264 (559)
358 TIGR03300 assembly_YfgL outer   43.1      73  0.0016   36.7   7.7   63  153-215   275-359 (377)
359 KOG4190 Uncharacterized conser  43.1      30 0.00065   42.8   4.7   77  199-295   728-804 (1034)
360 PF05879 RHD3:  Root hair defec  43.0 9.1E+02    0.02   31.7  22.4   51  904-954   425-475 (742)
361 PF09726 Macoilin:  Transmembra  41.6 9.4E+02    0.02   31.5  24.1   37  959-995   617-656 (697)
362 KOG3397 Acetyltransferases [Ge  41.5      21 0.00046   38.6   2.8    9   30-38    174-182 (225)
363 PF10498 IFT57:  Intra-flagella  40.4 7.3E+02   0.016   29.9  15.3  103  738-851   219-326 (359)
364 PF06003 SMN:  Survival motor n  39.3     9.9 0.00021   43.1   0.0   14   23-36    172-185 (264)
365 KOG2180 Late Golgi protein sor  39.2 5.4E+02   0.012   33.7  14.4   40 1083-1122  186-233 (793)
366 KOG2079 Vacuolar assembly/sort  39.2      37 0.00081   45.0   4.9   74  124-215   124-204 (1206)
367 PLN03229 acetyl-coenzyme A car  38.6 1.1E+03   0.023   31.3  20.3   38  757-796   494-540 (762)
368 PRK14143 heat shock protein Gr  37.7   3E+02  0.0064   31.4  11.0   44  788-839    92-135 (238)
369 PRK09866 hypothetical protein;  37.5 1.1E+03   0.024   31.1  22.4   45  915-959   644-688 (741)
370 PRK14164 heat shock protein Gr  37.4 1.9E+02  0.0041   32.5   9.3   46  787-840    94-139 (218)
371 PF09731 Mitofilin:  Mitochondr  37.2 9.3E+02    0.02   30.2  22.1  165  743-915   259-423 (582)
372 PF08553 VID27:  VID27 cytoplas  36.8 1.2E+02  0.0026   39.8   8.8   62  230-311   593-654 (794)
373 PF03938 OmpH:  Outer membrane   36.5 3.9E+02  0.0085   27.3  11.0   13  791-803    57-69  (158)
374 COG1770 PtrB Protease II [Amin  36.1 8.9E+02   0.019   31.6  15.7  115  153-307   136-257 (682)
375 PF13360 PQQ_2:  PQQ-like domai  36.1 5.4E+02   0.012   27.1  15.0   27  154-180    32-60  (238)
376 COG4913 Uncharacterized protei  35.2 1.2E+03   0.026   30.9  20.6   23  755-783   633-655 (1104)
377 PF07433 DUF1513:  Protein of u  35.2 2.9E+02  0.0062   32.6  10.7   33  275-307   216-248 (305)
378 PRK10115 protease 2; Provision  35.2 4.5E+02  0.0098   33.9  13.5   25  152-176   133-162 (686)
379 KOG3973 Uncharacterized conser  35.1 8.9E+02   0.019   29.3  14.8   12  772-783    52-63  (465)
380 PHA01972 structural protein     34.4 1.3E+03   0.028   31.0  17.4   33  754-793     9-41  (828)
381 PF10168 Nup88:  Nuclear pore c  34.2 1.2E+03   0.026   30.6  19.1  151  740-913   556-715 (717)
382 KOG0972 Huntingtin interacting  34.1 8.6E+02   0.019   28.8  14.1   68  769-843   256-325 (384)
383 PF09726 Macoilin:  Transmembra  34.0 1.2E+03   0.026   30.5  23.9    8  360-367   197-204 (697)
384 PRK11138 outer membrane biogen  33.2 2.7E+02  0.0058   32.7  10.4   24  153-176   290-313 (394)
385 TIGR03185 DNA_S_dndD DNA sulfu  32.9 1.2E+03   0.025   30.0  27.7   11 1081-1091  560-570 (650)
386 PRK14157 heat shock protein Gr  31.8 2.6E+02  0.0056   31.7   9.3   44  788-839   102-145 (227)
387 KOG4673 Transcription factor T  31.5 1.3E+03   0.029   30.3  28.2   65  731-807   401-465 (961)
388 PRK14628 hypothetical protein;  31.0      64  0.0014   32.9   4.1   22  743-764    16-37  (118)
389 PRK14155 heat shock protein Gr  30.9 2.8E+02   0.006   31.0   9.3   46  787-840    37-82  (208)
390 KOG1897 Damage-specific DNA bi  30.7 7.8E+02   0.017   33.4  14.3  187  117-331    94-315 (1096)
391 PRK14140 heat shock protein Gr  30.7 4.7E+02    0.01   28.9  10.9   54  773-839    52-105 (191)
392 PRK14148 heat shock protein Gr  30.6 4.1E+02  0.0089   29.4  10.4   43  789-839    66-108 (195)
393 PF12868 DUF3824:  Domain of un  30.6 1.1E+02  0.0025   31.9   6.0   13   20-32     76-88  (137)
394 cd09236 V_AnPalA_UmRIM20_like   30.5 9.1E+02    0.02   28.6  14.1   81  736-824   189-286 (353)
395 PRK14141 heat shock protein Gr  30.3 5.9E+02   0.013   28.5  11.7   45  788-840    56-100 (209)
396 PHA01750 hypothetical protein   30.0 1.9E+02  0.0041   27.1   6.4   33  776-808    27-59  (75)
397 KOG1922 Rho GTPase effector BN  29.8      91   0.002   40.6   6.4    7  934-940   735-741 (833)
398 PRK15362 pathogenicity island   29.7 1.2E+03   0.026   29.1  23.0   12  446-457    20-31  (473)
399 PRK14156 heat shock protein Gr  29.7 6.2E+02   0.013   27.7  11.5   44  788-839    52-95  (177)
400 PF08450 SGL:  SMP-30/Gluconola  29.7 7.5E+02   0.016   26.8  13.7   92  188-306    24-123 (246)
401 PRK14154 heat shock protein Gr  29.6 2.5E+02  0.0054   31.4   8.6   45  787-839    76-120 (208)
402 PF12252 SidE:  Dot/Icm substra  29.4 1.7E+03   0.037   30.8  25.0   79  747-826  1029-1112(1439)
403 PF05096 Glu_cyclase_2:  Glutam  29.2 5.7E+02   0.012   29.7  11.6   53  254-306   202-261 (264)
404 PF07250 Glyoxal_oxid_N:  Glyox  28.9 1.8E+02   0.004   33.0   7.7   94  183-296    43-138 (243)
405 KOG1275 PAB-dependent poly(A)   28.9      26 0.00056   45.7   1.2   34  154-187   184-218 (1118)
406 PF10737 GerPC:  Spore germinat  28.7 3.7E+02   0.008   29.4   9.5   71  877-951    99-174 (176)
407 PF04003 Utp12:  Dip2/Utp12 Fam  28.7      97  0.0021   29.8   4.9   99 1053-1155    2-108 (110)
408 PF10154 DUF2362:  Uncharacteri  28.3 5.4E+02   0.012   32.5  12.0   77  734-811    89-176 (510)
409 PF06248 Zw10:  Centromere/kine  27.9 1.3E+03   0.029   29.1  18.8   26  966-992   210-235 (593)
410 PF14817 HAUS5:  HAUS augmin-li  27.8 1.5E+03   0.032   29.5  20.0   57  790-852   388-448 (632)
411 PF06657 Cep57_MT_bd:  Centroso  27.6 3.5E+02  0.0077   25.7   8.2   54  738-803    16-69  (79)
412 PRK13616 lipoprotein LpqB; Pro  27.6 7.6E+02   0.016   31.5  13.5  138  152-310   356-530 (591)
413 PRK02888 nitrous-oxide reducta  27.6 5.4E+02   0.012   33.2  12.0  162  107-296   287-452 (635)
414 PF11101 DUF2884:  Protein of u  27.6 9.1E+02    0.02   27.1  17.2   19  964-982   199-217 (229)
415 PRK14151 heat shock protein Gr  27.5 5.9E+02   0.013   27.7  10.9   46  787-840    44-89  (176)
416 COG1283 NptA Na+/phosphate sym  27.3 1.4E+03    0.03   29.2  15.5   13  769-781   363-375 (533)
417 PF09903 DUF2130:  Uncharacteri  27.2 5.2E+02   0.011   29.8  11.0   47  777-824   192-238 (267)
418 KOG2203 GTP-binding protein [G  27.2 1.5E+03   0.032   29.4  16.6  187  759-973   283-475 (772)
419 PRK14144 heat shock protein Gr  26.8 5.9E+02   0.013   28.4  10.8   45  788-840    70-114 (199)
420 KOG2444 WD40 repeat protein [G  26.5      42 0.00091   37.8   2.2   21  156-176   113-133 (238)
421 PF09477 Type_III_YscG:  Bacter  26.5      60  0.0013   33.0   3.0   31 1029-1059   44-74  (116)
422 PRK14158 heat shock protein Gr  26.5 6.3E+02   0.014   28.0  11.0   45  788-840    65-109 (194)
423 PRK10325 heat shock protein Gr  26.5 3.4E+02  0.0073   29.9   9.0   45  787-839    63-107 (197)
424 PF14712 Snapin_Pallidin:  Snap  26.3 5.5E+02   0.012   24.2   9.4   27  738-764    13-39  (92)
425 smart00135 LY Low-density lipo  26.1      94   0.002   24.1   3.6   31  276-306     9-39  (43)
426 PF13570 PQQ_3:  PQQ-like domai  26.0      85  0.0019   25.1   3.3   24  153-176    17-40  (40)
427 PF05960 DUF885:  Bacterial pro  25.8 5.1E+02   0.011   31.9  11.4   30  746-775    23-52  (549)
428 cd00179 SynN Syntaxin N-termin  25.7 4.7E+02    0.01   26.4   9.4    9  740-748     7-15  (151)
429 PF01025 GrpE:  GrpE;  InterPro  25.7 2.4E+02  0.0052   29.3   7.4   30  771-805    24-53  (165)
430 KOG2444 WD40 repeat protein [G  25.6 1.1E+02  0.0023   34.7   5.0   17  159-175    72-88  (238)
431 PF00780 CNH:  CNH domain;  Int  25.3 4.8E+02    0.01   28.6  10.1  100  152-266   143-266 (275)
432 PF11715 Nup160:  Nucleoporin N  25.3      55  0.0012   40.1   3.1   24  156-179   229-252 (547)
433 KOG1832 HIV-1 Vpr-binding prot  25.2      99  0.0021   40.8   5.2   42  135-176  1091-1132(1516)
434 PF14644 DUF4456:  Domain of un  25.1 9.4E+02    0.02   26.4  14.7   76  744-824    53-148 (208)
435 PF15469 Sec5:  Exocyst complex  25.1 8.3E+02   0.018   25.8  18.7   62  889-959    89-152 (182)
436 KOG0119 Splicing factor 1/bran  25.1 1.9E+02  0.0041   36.0   7.2   71   22-94    436-538 (554)
437 PF08703 PLC-beta_C:  PLC-beta   25.0 9.6E+02   0.021   26.5  16.9   87  755-843    69-159 (185)
438 PRK14162 heat shock protein Gr  24.9 6.9E+02   0.015   27.7  10.9   44  788-839    64-107 (194)
439 smart00502 BBC B-Box C-termina  24.7 6.2E+02   0.013   24.2  15.1   20  744-763     5-24  (127)
440 PRK14160 heat shock protein Gr  24.7 7.6E+02   0.017   27.7  11.3   45  787-839    85-129 (211)
441 COG0576 GrpE Molecular chapero  24.4 4.4E+02  0.0096   28.9   9.4   45  787-839    60-104 (193)
442 KOG4640 Anaphase-promoting com  24.4 1.4E+02  0.0031   37.9   6.3   62  159-247    34-96  (665)
443 PRK14149 heat shock protein Gr  24.3 3.5E+02  0.0076   29.9   8.5   44  788-839    61-104 (191)
444 KOG0804 Cytoplasmic Zn-finger   24.1 3.8E+02  0.0082   33.2   9.4   62  743-821   379-440 (493)
445 PRK14147 heat shock protein Gr  23.9 3.5E+02  0.0076   29.2   8.4   44  788-839    43-86  (172)
446 PRK14150 heat shock protein Gr  23.9 4.4E+02  0.0096   29.0   9.3   44  788-839    63-106 (193)
447 KOG3859 Septins (P-loop GTPase  23.9 5.8E+02   0.013   30.2  10.4   74  743-818   327-400 (406)
448 PRK14139 heat shock protein Gr  23.8 3.7E+02   0.008   29.5   8.5   56  771-839    45-100 (185)
449 PF10241 KxDL:  Uncharacterized  23.4 6.7E+02   0.015   24.1  10.0   71  734-808     9-81  (88)
450 KOG4191 Histone acetyltransfer  23.3 7.9E+02   0.017   30.6  11.7   99  734-841   403-501 (516)
451 KOG4590 Signal transduction pr  23.3 1.1E+02  0.0024   37.1   5.0   12  132-143   241-252 (409)
452 COG3823 Glutamine cyclotransfe  23.0 3.3E+02  0.0071   31.0   8.0   34  273-306   226-259 (262)
453 PRK14145 heat shock protein Gr  22.5 5.2E+02   0.011   28.7   9.4   46  787-840    69-114 (196)
454 TIGR03513 GldL_gliding gliding  22.4 9.5E+02   0.021   26.9  11.3   53  943-995   134-192 (202)
455 KOG3156 Uncharacterized membra  22.0 1.2E+03   0.026   26.5  13.6  141  816-975    65-210 (220)
456 TIGR03185 DNA_S_dndD DNA sulfu  22.0 1.7E+03   0.038   28.4  24.4   15  769-783   206-220 (650)
457 cd00179 SynN Syntaxin N-termin  21.9 8.3E+02   0.018   24.6  14.3   20  880-899   106-125 (151)
458 KOG2129 Uncharacterized conser  21.6 1.6E+03   0.035   27.9  18.1   29 1037-1065  442-470 (552)
459 TIGR03752 conj_TIGR03752 integ  21.3 6.7E+02   0.014   31.4  10.8   53 1041-1095  412-464 (472)
460 PF03276 Gag_spuma:  Spumavirus  21.3 2.9E+02  0.0063   34.9   7.8   11  177-187   309-319 (582)
461 PRK15361 pathogenicity island   21.2 1.2E+03   0.025   26.1  16.2   32  806-837   130-168 (195)
462 PF01690 PLRV_ORF5:  Potato lea  20.9      64  0.0014   39.6   2.4    8  300-307   182-189 (465)
463 PRK14153 heat shock protein Gr  20.8 4.5E+02  0.0098   29.1   8.5   45  787-839    57-101 (194)
464 PF05918 API5:  Apoptosis inhib  20.8 1.3E+03   0.028   29.6  13.4   88  742-843    95-188 (556)
465 PRK14146 heat shock protein Gr  20.6 4.3E+02  0.0094   29.6   8.5   44  788-839    79-122 (215)
466 PF14781 BBS2_N:  Ciliary BBSom  20.5 1.4E+02   0.003   31.3   4.4   76  165-245    37-127 (136)
467 COG1480 Predicted membrane-ass  20.3 9.7E+02   0.021   31.4  12.2   38  782-819    86-123 (700)
468 PF05694 SBP56:  56kDa selenium  20.2 2.4E+02  0.0051   34.9   6.8  108  188-307   224-343 (461)
469 PRK02888 nitrous-oxide reducta  20.2 3.5E+02  0.0077   34.8   8.5   73  167-245   271-353 (635)
470 KOG1937 Uncharacterized conser  20.1 5.9E+02   0.013   31.7   9.8   67  736-811   449-515 (521)
471 KOG4714 Nucleoporin [Nuclear s  20.1 1.9E+02  0.0042   33.5   5.7   31  157-187   192-224 (319)
472 PF10186 Atg14:  UV radiation r  20.0 1.2E+03   0.027   25.9  14.3   28  740-767    21-48  (302)

No 1  
>KOG1916 consensus Nuclear protein, contains WD40 repeats [General function prediction only]
Probab=100.00  E-value=1.1e-153  Score=1337.39  Aligned_cols=1077  Identities=44%  Similarity=0.656  Sum_probs=923.7

Q ss_pred             cCCCCCCCccccccccccCCCCCCCCCCCCCCCCCCC------CCCCCCCCCCCCCCCCC-----------CCCCCCCCC
Q 001070            6 QSQSPNQNQKQFDMRNWFPPYPPPSSSAAGDNFFPYP------PPPPPPPPEPHANMHPH-----------PYPHGPHRL   68 (1165)
Q Consensus         6 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~------~ppp~p~p~~~~~~~~~-----------~~~~~~~~~   68 (1165)
                      .+.+..+|.++||..++|-|-++|.++..|++-+.--      ||--.--|   -+-+-.           .+-.-+.++
T Consensus         5 psnt~p~~~p~~dlg~l~~P~~~~~~~~t~p~~n~Q~~qvi~~~~~~s~t~---~gV~~~~~~vvsss~~t~~~~~Rt~~   81 (1283)
T KOG1916|consen    5 PSNTNPHNKPPFDLGNLFKPSSNPYPPPTGPFLNNQYCQVIYAPPGISATP---SGVHQRQQDVVSSSNATNLKPQRTLS   81 (1283)
T ss_pred             CCCCCCCCCChhhcccccCCCCCCCCCCCCchhhhhhceeEecCCCccccc---cccccccchhhccccccccchhhhcc
Confidence            4556678999999999999999998874444333211      11111000   011110           122245888


Q ss_pred             CCCCC-CCCCCCCCCCChHHHHHhhcCC-------CCC--CC---------CCCCCC--------CceeecCCceEEecc
Q 001070           69 LPYTP-LPTTTVVSPNAGPQILALLNNN-------KSK--HV---------GSTAPI--------YGKRVFGDYVAYDVD  121 (1165)
Q Consensus        69 ~~~~~-~~~~~~~~~~~~~~~~~~l~~~-------~~~--~~---------~~~~p~--------~Gr~l~g~~~~~dVd  121 (1165)
                      ||.|| ....+..+.|+|..|.++|++-       |++  |.         +..+|+        +||++.|++.|||||
T Consensus        82 yp~~pva~~~~~~~~~yg~~I~~~~~~~~~~vrvaN~~~sm~~~~l~kgf~G~v~dl~fah~~~pk~~~~vg~lfVy~vd  161 (1283)
T KOG1916|consen   82 YPTPPVAVQSPRKNHNYGTHILALLNGMENGVRVANQEPSMRHNELAKGFPGGVGDLQFAHTKCPKGRRLVGELFVYDVD  161 (1283)
T ss_pred             CCCCcccccCcccccchHHHHHHHhhchhhhhhhccCcchhHHHHHHhcCCCCcccccccccCChHHHHHhhhhheeehH
Confidence            88888 4448889999999999999632       555  21         234555        999999999999999


Q ss_pred             cCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhHhhcCCcc--------------
Q 001070          122 AVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK--------------  187 (1165)
Q Consensus       122 ~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q--------------  187 (1165)
                      + ..||.| |+|+|+||++|++++.++.|++|+||..|||||.++|.||+++|+++.|.+||||++              
T Consensus       162 ~-l~G~iq-~~l~v~~~~p~gs~~~~V~wcp~~~~~~~ic~~~~~~~i~lL~~~ra~~~l~rsHs~~~~d~a~~~~g~~~  239 (1283)
T KOG1916|consen  162 V-LQGEIQ-PQLEVTPITPYGSDPQLVSWCPIAVNKVYICYGLKGGEIRLLNINRALRSLFRSHSQRVTDMAFFAEGVLK  239 (1283)
T ss_pred             h-hccccc-cceEEeecCcCCCCcceeeecccccccceeeeccCCCceeEeeechHHHHHHHhcCCCcccHHHHhhchhh
Confidence            9 999999 999999999999999999999999999999999999999999999999999999999              


Q ss_pred             --------------------------------------------------------------------------------
Q 001070          188 --------------------------------------------------------------------------------  187 (1165)
Q Consensus       188 --------------------------------------------------------------------------------  187 (1165)
                                                                                                      
T Consensus       240 l~~lSpDGtv~a~a~~dG~v~f~Qiyi~g~~~~rclhewkphd~~p~vC~lc~~~~~~~v~i~~w~~~Itttd~nre~k~  319 (1283)
T KOG1916|consen  240 LASLSPDGTVFAWAISDGSVGFYQIYITGKIVHRCLHEWKPHDKHPRVCWLCHKQEILVVSIGKWVLRITTTDVNREEKF  319 (1283)
T ss_pred             heeeCCCCcEEEEeecCCccceeeeeeeccccHhhhhccCCCCCCCceeeeeccccccCCccceeEEEEecccCCcceeE
Confidence                                                                                            


Q ss_pred             ------------------------------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCC
Q 001070          188 ------------------------------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAP  219 (1165)
Q Consensus       188 ------------------------------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP  219 (1165)
                                                                      |+||..++.+|+.+.+||+||+|.|..|.++|
T Consensus       320 w~~a~w~Cll~~~~d~v~iV~p~~~~v~~~~~~~~~~~~~v~r~v~~~i~~~qn~~a~~~~vs~~~~~hpV~S~i~v~S~  399 (1283)
T KOG1916|consen  320 WAEAPWQCLLDKLIDGVQIVGPHDGEVTDLSMCQWMTTRLVSRSVDGTIKIWQNRKAQPLVVSRPHDGHPVLSAIFVTSP  399 (1283)
T ss_pred             eeccchhhhhhhcccceEeecCCCccccchhhhHHHHHHHHHhhhHHHHHHhhcchhhhhhhhhhhhcceeccccccccC
Confidence                                                            77888888889999999999999999999999


Q ss_pred             CCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCC-cceEEE-E-eccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          220 NQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAES-WKCTQT-L-DLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       220 ~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~-w~C~QT-L-e~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      ++++|+.++++|++||++|+|..++.+||+.+++.+. |+|+|| | .+.++.|+..++||||+|..+...+++++| ++
T Consensus       400 ~R~~h~e~~~~~~~nr~~~i~~s~g~~g~ls~a~v~~k~rcv~tklqd~~~~~ePq~~~d~~n~~~als~h~~~~~a-~s  478 (1283)
T KOG1916|consen  400 ERPDHIELITGGPLNRELKIWVSAGEEGWLSPADVESKWRCVQTKLQDLKSSTEPQAEPDFFNQVIALSEHGLLLLA-AS  478 (1283)
T ss_pred             CCccccccccCCcchhhhhhhhhcccccccchhhhhhhHHHhhhhhhhcccccCCccchhhhcchHHHHHHHHHHHh-hh
Confidence            9999999999999999999999999999999999986 999999 7 678889999999999999999999999999 99


Q ss_pred             CCcEEEEEeecCCCccccccccccccccccceeeeeeccCCCCcceEEEEEeehhhhhhhccccccccCCCCCCCCCCCC
Q 001070          297 KNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPSEHIIKLYCVQTQAIQQYSLNLFQCLPPPAESGGLERP  376 (1165)
Q Consensus       297 r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~ge~~vq~yCvQtqAIQqy~l~~~~c~pp~~~~~~~e~~  376 (1165)
                      ||++|.+|++|+..+.-++||||.||+++||||||. +.|+..+-.+++|||||-|||||.++      |+.+++|++++
T Consensus       479 r~el~sv~l~~~a~~~e~~~~~~~e~~~p~d~Ls~~-te~pp~~~~~~v~~vqt~alqq~Ta~------p~r~s~Gssss  551 (1283)
T KOG1916|consen  479 RNELYSVHLDYGASPVETDMDYLSEFTVPMDILSFI-TEDPPEEPTVKVYCVQTLALQQYTAD------PPRESSGSSSS  551 (1283)
T ss_pred             hhhhhhccCCcccCCCcchhhhhhhcCCCccceeec-cCCCCCCCCCceeeeehHHHHHHhcC------CcccccCcccc
Confidence            999999999999999999999999999999999999 88888999999999999999999999      77899999999


Q ss_pred             CCCccccc-cCC---cccccccCCCCCCCCcccccCccccCCCCCCccccccccccCCCCCCCCcccccccCCCcccccC
Q 001070          377 DSSVSNDA-NGS---RLSEFLFPSSTSKPSFSETTGAVRYPQLSTSHEATTSQENLTSKTESQPLSLARTTSDTNVVCVA  452 (1165)
Q Consensus       377 ~~~~s~~~-~~~---~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  452 (1165)
                      +++|||.+ .++   -+.-+..+...++|+.+..+++.....+++...+ +...++.++.+++.       +.+.+++++
T Consensus       552 ~ssvs~~a~av~sms~tsa~kpt~~~p~P~~l~~~s~~~n~~S~~a~sa-ss~aa~p~~~~p~t-------s~~p~a~~~  623 (1283)
T KOG1916|consen  552 DSSVSREANAVESMSETSAVKPTLLPPKPSILVNRSELANDLSFPASSA-SSLAAVPPNGEPKT-------SGAPSAYAL  623 (1283)
T ss_pred             hhHHHHHhhhhhhhcccccCCcccCCCCchhhhccHhhhhccCCCcccc-ccccccCCCCCCCC-------CCCCccccc
Confidence            99999976 443   2223333444578999999999877777766665 33557777777776       223367788


Q ss_pred             CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCccCCCcCCCcccccc-cccCCCCCCCCCcccccCCCCC-ccc
Q 001070          453 SPPLPLSPSFSRKHSGSINPPNSSELGSLLNEPGGSQPIIDSSFDGKTDTTQV-LSHVPSLDSDANNDKINIAPND-ISR  530 (1165)
Q Consensus       453 s~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~d~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~d-~~~  530 (1165)
                      ||.+|.  ++++++|++..+-..+|+..+....++++++.|| +.++++++.. ..|+-+.+.+.|+.+.++..+| .+.
T Consensus       624 sp~~pg--q~~S~~Sa~~~~v~~~epv~~~~~~~~~t~s~d~-vi~~~~~v~~r~~~~~s~e~~sR~k~s~v~~~~e~~~  700 (1283)
T KOG1916|consen  624 SPQLPG--QLSSKLSAYHTPVEAVEPVGPHHALGGKTRSADY-VIRQADTVGSRNLDVSSVEELSRSKDSNVTPDDEVSG  700 (1283)
T ss_pred             CCCCCC--cccchhhhhhhhHHhhcccCCcccCCCCCcchHH-HhhhcchhhcccchhHHHHHhhhcccCCCCCCCCcch
Confidence            899988  8999999999999999999999999999999999 9999999998 6677788899999888888554 677


Q ss_pred             CCCCCCCCCCCcccChhHhhhccCCCCcc--cccCCccccceeeccCCCCcceeEEEeccCcccc-cccCcccccchhhh
Q 001070          531 ALNPSMFKHPTHLITPSEILMSASSSETT--NIIGGKNEEEVVVNSDAGNAEVEVKVLDETRFTH-DEFGSRGESQNLVS  607 (1165)
Q Consensus       531 ~~~~~~f~~~~hl~tpsei~~~~~~s~~~--~~~~~~~~~~v~~~~~~~~~e~~~k~v~~~~~~~-~~~~~~~~~~~~~~  607 (1165)
                      +.+|..   ||||+||+   +.+..+=++  ..+++.++.||  |||.+..|||+|.++++...| ++...+-...+...
T Consensus       701 m~s~as---~~hl~SP~---~~~~~~i~tqd~~D~~~~~~d~--~ndp~dlE~el~~~ss~~~sqv~~t~p~it~e~cSs  772 (1283)
T KOG1916|consen  701 MRSPAS---PTHLVSPV---SSPEASITTQDGRDRDANIGDV--NNDPRDLEVELKEESSAPDSQVGETNPHITTENCSS  772 (1283)
T ss_pred             hhCccc---ccccCCCC---CCcccccccccccccCcccccc--cCCcchhHHHHHhccCCCccccCCCCCcccccccch
Confidence            777733   99999992   222222222  78999999987  999999999999999999999 99988888888899


Q ss_pred             HhhhhhhhcccCCccccccccccCCCcccccccccccccccccccccCCCCCCCccccccccccCCCCCCCCcccccccc
Q 001070          608 ENREKYLRYQATDPRIGMAAKCAGTSAETCVAEEAQEVDGAGIMETLAQPPCNDEAEVEDSTQDLDGGVSDSTMTTTFAQ  687 (1165)
Q Consensus       608 ~~~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  687 (1165)
                      |.+|..||+|++.++.+|+|+|+.      .+|+....++..+...+.+    ..++.....+..++|+++++       
T Consensus       773 e~~~~~~~sQa~~~S~~~~rppy~------~t~g~~~~~~S~~~s~~~~----~~a~~~s~S~g~sak~p~~~-------  835 (1283)
T KOG1916|consen  773 EAREPRFCSQASNLSTEMARPPYP------LTEGRDIPGASAAYSQPDD----AGAELGSDSRGFSAKLPAPR-------  835 (1283)
T ss_pred             hhhhhhHHHHhhhhccccCCCCcc------ccccCCCCCcccccCCccc----hhhhhccccCCCcccCCCcc-------
Confidence            999999999999999999999987      5566666666666533333    24556666777777777655       


Q ss_pred             CCCccchhhhcccccccCCCCCCCCccccccccCCCCCCCCCCCCCChhhHHHHHHHHHHHHHHHHHHHHHHHHhhhhcc
Q 001070          688 TGASSAKGKKQKEKKYQASSQCSPSSTVLNLANLSNEPAGSSSLPSAPAAFSQVIAMQDMLNQLMTMQKELQKQMSNLVT  767 (1165)
Q Consensus       688 ~~~~~~~~k~~k~~~~q~~~~~s~~~~~~n~~~s~~e~~~~~~~~~~~~~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~  767 (1165)
                        .| +||||+|++++|.+|.++.+....|.+|++++.....+.|..+ .++|+.++|+.|+|||+-|||||.|+.+-++
T Consensus       836 --l~-ak~~k~kg~~~~spgl~~t~s~~~~lad~~~~qs~qln~p~ed-~~~~l~~qQe~~a~l~~sQ~el~~~l~~ql~  911 (1283)
T KOG1916|consen  836 --LP-AKGKKQKGKNSQSPGLSSTSSNVANLADSFNEQSQQLNHPMED-LLPQLLAQQETMAQLMASQKELQRQLSNQLT  911 (1283)
T ss_pred             --cc-ccccccCCCcCCCCCccccccchHHHHHHHHHHHhhhcCChhh-HHHHHHHHHHHHHHHHHhHHHHHHHHHHhhc
Confidence              44 7999999999999999999999999999999999999976543 3899999999999999999999999999777


Q ss_pred             cchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-hh
Q 001070          768 LPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKKELAA-VG  846 (1165)
Q Consensus       768 ~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKkeV~s-Vv  846 (1165)
                      .|       ||-.|++.|||.+|.+-|++|+||+|+-+++|++.++.|++|++.+++++.+.+++++||+||+||+. |+
T Consensus       912 g~-------le~~l~~~iEk~lks~~d~~~~rl~e~la~~e~~~r~~~~qi~q~ltq~~s~~~~~~~e~ti~~El~~tv~  984 (1283)
T KOG1916|consen  912 GP-------LEVALGRMIEKSLKSNADALWARLQEELAKNEKALRDLQQQITQQLTQFLSKELNAMFEKTIKKELAKTVG  984 (1283)
T ss_pred             ch-------HHHHHHHHHHHHHHhhHHHHHHHHHHHHHhhhhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhcc
Confidence            76       99999999999999999999999999999999999999999999999999999999999999999995 99


Q ss_pred             hhhHhhhhhhHHHHHHHHHHHHHhh-cchhhhHHHHHHHHHHHhHHHHHHHHHHhhhhhhhHHHHHHHHHHhHhhcchhH
Q 001070          847 PAIVRTISPSIEKTITSAIVESFQR-GVGDKAVNQLERSVNSRLEATVGRQIQAQFQTSGKHALQDALKSSVEASVIPAF  925 (1165)
Q Consensus       847 PAI~~~t~~avekqlss~l~eslq~-~l~dk~vnqLeK~V~s~Lp~aVaraIq~~vqtsv~qaIqdavr~af~stLIPAF  925 (1165)
                      |+|.+.+.+.+++.+++++.+.++. +++++.++||.|+++  |.++|+|+++.+||+++.  ||++|+++|+++|||+|
T Consensus       985 P~v~rs~~p~~~q~~~s~itkl~~~eg~~kenI~ql~KSkn--l~dtvar~i~~~~Qtsg~--lQ~a~resm~SsviPaf 1060 (1283)
T KOG1916|consen  985 PCVARSVEPVIEQTVSSAITKLFQREGIGKENINQLLKSKN--LEDTVARQIQAQFQTSGP--LQEALRESMESSVIPAF 1060 (1283)
T ss_pred             hhhhhhhHHHHHHHHHHHHHHHHHhhchHHHHHHHHHhhcc--HHHHHHHHHHHHHhccch--HHHHHHHHhhhhccHHH
Confidence            9999999999999999999999999 999999999999998  999999999999999877  99999999999999999


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhcCchHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhhcccCCCCCCC
Q 001070          926 EKSCKAMFEQVDATFQKGMVEHTTATLQHFESTHSPLALVLRESVNSVSSMAQTLSGEFVDGQRKLFDLAGVRNNTSAFN 1005 (1165)
Q Consensus       926 E~scq~MFqQV~~~F~rGm~E~~~qlQqq~dSaKtsLv~~L~etIssmaa~q~~LqsEll~lQrQL~~~a~s~qns~as~ 1005 (1165)
                      |++|++||+||+++|+.|+.||++|+...+.+.-                ..+++.+|..+.|..++....+.++.++.+
T Consensus      1061 EKScqaMF~Qi~daF~~Gi~e~~~q~~s~~~s~~----------------qr~a~nrE~~~~ql~~L~~t~~sa~~~~~~ 1124 (1283)
T KOG1916|consen 1061 EKSCQAMFQQIDDAFQKGIQEHTQQLISSASSVP----------------QRQALNRELAEAQLNGLALTAASATEQGSN 1124 (1283)
T ss_pred             HHHHHHHHHHHHHHHHHhHHHHHHHHHHHHhccc----------------hhhhhhhhHHHHHHHHHHHHHHHHhhcCCc
Confidence            9999999999999999999999997754433321                012344455455544443333333333444


Q ss_pred             CCC-CCCCCCCCCCcc-ccccCCCcHHHHHHhhccCcHHHHHHHHHhcCCHHHHHHHhhccCcccccccCCCCcchhHHH
Q 001070         1006 PSV-PLSNGPLLGLHE-KVEATMDPTKELSRLVSDRKYEEAFTTALQRSDVSIVSWLCSQVDMHGLLSMVPLPLSQGVLL 1083 (1165)
Q Consensus      1006 Ps~-Qp~~~P~~as~E-~vEa~lDp~~eI~qLI~eGqyEEAF~kALqSsDlsLV~~LcsrvDP~~Lfsl~PlpLSQgVLL 1083 (1165)
                      |.. +...+|..++=+ +.++..+|+.+|.|||.+|+|||||++||+++|++||.|+|+++|...+|.++||+|+|+|||
T Consensus      1125 pl~~~l~~~~~~~~~~a~~~a~~~P~~~i~~ll~~~~~~~af~~al~~~d~~lv~~~~~~~d~~~~~a~~~~~l~q~vll 1204 (1283)
T KOG1916|consen 1125 PLVTQLSAGPVGALLEAMRSAAMTPTTEISQLLSEGKYNEAFTQALQASDLSLVSWLCSQVDLRQLFAMNPCPLSQGVLL 1204 (1283)
T ss_pred             chHHHHhcchHHHHHHHHHHccCCcHHHHHHHHhcchHHHHHHHHHHhccchhhhHhhhccCHHHhcCCCCCcchHHHHH
Confidence            443 222333322223 456788999999999999999999999999999999999999999999999999999999999


Q ss_pred             HHHHHHhhhcccChHHHHHHHHHHHHHcCCCCchhHHhHHHHHHHHHHHHHhhhcCCCCccccchhHHHHHHHHHHHhhh
Q 001070         1084 SLLQQLACDINKDTARKLAWLTDVAAAINPADPMIAVHARPIFEQVYQRLHHQRSSPTISGAELSSIRLLIHVINSMLMT 1163 (1165)
Q Consensus      1084 SLIQQLSsDL~tdt~lKL~WLEeal~aLDpsDP~IrehvPkIL~~L~qrL~~~~slp~~s~~d~~~lRLl~hvinslL~s 1163 (1165)
                      ||||||+||+.+++.+|++||.+|+.+||++||+||+|+|+|+++||++|++|++.|   +.+.+++|||||+||++|++
T Consensus      1205 sliqqla~d~s~~~~~k~~~~~~~~~ain~sd~~~~~ha~~v~~~~y~~~~~~~~~~---~~~~s~vrlim~~i~s~~~~ 1281 (1283)
T KOG1916|consen 1205 SLIQQLACDISTDTSLKLRYLTEAVLAINPSDPITRVHARPVFEQVYQILHQFRNAP---PSNVSAVRLIMHVINSYLMS 1281 (1283)
T ss_pred             HHHHHHHhhcccchHHHHHHHHHHHHhcCccCchhHhhhhHHHHHHHHHHHHHhcCC---ccchHHHHHHHHHHHHhhcc
Confidence            999999999999999999999999999999999999999999999999999999866   56789999999999999999


Q ss_pred             cC
Q 001070         1164 FK 1165 (1165)
Q Consensus      1164 ~k 1165 (1165)
                      ||
T Consensus      1282 ~k 1283 (1283)
T KOG1916|consen 1282 LK 1283 (1283)
T ss_pred             CC
Confidence            98


No 2  
>KOG1916 consensus Nuclear protein, contains WD40 repeats [General function prediction only]
Probab=99.69  E-value=1.5e-14  Score=173.28  Aligned_cols=140  Identities=21%  Similarity=0.257  Sum_probs=107.4

Q ss_pred             eeEEecCCCCCCcceeEeecC----CCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceE-----EEEeccCC
Q 001070          198 PLIILKPHGGQPVNSAQYLTA----PNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCT-----QTLDLKSS  268 (1165)
Q Consensus       198 pl~~lephdG~sV~SVaFl~a----P~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~-----QTLe~~~s  268 (1165)
                      +++-|+||||++-.|..|.+.    ++-+.|+|+||+...||++|+|++            ..|+|.     +++...+ 
T Consensus       274 clhewkphd~~p~vC~lc~~~~~~~v~i~~w~~~Itttd~nre~k~w~~------------a~w~Cll~~~~d~v~iV~-  340 (1283)
T KOG1916|consen  274 CLHEWKPHDKHPRVCWLCHKQEILVVSIGKWVLRITTTDVNREEKFWAE------------APWQCLLDKLIDGVQIVG-  340 (1283)
T ss_pred             hhhccCCCCCCCceeeeeccccccCCccceeEEEEecccCCcceeEeec------------cchhhhhhhcccceEeec-
Confidence            599999999886666668663    667889999999999999999997            569999     5555432 


Q ss_pred             CCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeecc-------------
Q 001070          269 AKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTI-------------  335 (1165)
Q Consensus       269 ~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~-------------  335 (1165)
                      .    | +  .+|..+...+|+.+.+..|+.+|.|.+-....   +.+..+.+|...|||+|-+...             
T Consensus       341 p----~-~--~~v~~~~~~~~~~~~~v~r~v~~~i~~~qn~~---a~~~~vs~~~~~hpV~S~i~v~S~~R~~h~e~~~~  410 (1283)
T KOG1916|consen  341 P----H-D--GEVTDLSMCQWMTTRLVSRSVDGTIKIWQNRK---AQPLVVSRPHDGHPVLSAIFVTSPERPDHIELITG  410 (1283)
T ss_pred             C----C-C--ccccchhhhHHHHHHHHHhhhHHHHHHhhcch---hhhhhhhhhhhcceeccccccccCCCccccccccC
Confidence            1    0 1  14555667889999999999999999887544   7899999999999999943321             


Q ss_pred             CC----------CCcc--------eEEEEEeehhhhhhhccccc
Q 001070          336 DP----------PSEH--------IIKLYCVQTQAIQQYSLNLF  361 (1165)
Q Consensus       336 d~----------~ge~--------~vq~yCvQtqAIQqy~l~~~  361 (1165)
                      ++          .|++        ..++|||||+ ||.|...++
T Consensus       411 ~~~nr~~~i~~s~g~~g~ls~a~v~~k~rcv~tk-lqd~~~~~e  453 (1283)
T KOG1916|consen  411 GPLNRELKIWVSAGEEGWLSPADVESKWRCVQTK-LQDLKSSTE  453 (1283)
T ss_pred             CcchhhhhhhhhcccccccchhhhhhhHHHhhhh-hhhcccccC
Confidence            11          2332        3689999999 999987765


No 3  
>KOG0271 consensus Notchless-like WD40 repeat-containing protein [Function unknown]
Probab=99.47  E-value=1.6e-13  Score=153.80  Aligned_cols=118  Identities=22%  Similarity=0.430  Sum_probs=92.7

Q ss_pred             Cceee-cC--C--ceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc--hhh
Q 001070          107 YGKRV-FG--D--YVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT--ATR  179 (1165)
Q Consensus       107 ~Gr~l-~g--~--~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t--~ir  179 (1165)
                      .|++| +|  |  ...+|.+++-|      ..-++      .-...++-=-++.||+.||+|++||.||+||-.+  .+-
T Consensus       126 ~g~~l~tGsGD~TvR~WD~~TeTp------~~t~K------gH~~WVlcvawsPDgk~iASG~~dg~I~lwdpktg~~~g  193 (480)
T KOG0271|consen  126 TGSRLVTGSGDTTVRLWDLDTETP------LFTCK------GHKNWVLCVAWSPDGKKIASGSKDGSIRLWDPKTGQQIG  193 (480)
T ss_pred             CCceEEecCCCceEEeeccCCCCc------ceeec------CCccEEEEEEECCCcchhhccccCCeEEEecCCCCCccc
Confidence            78898 55  3  45689988554      32222      2222333344778999999999999999999888  566


Q ss_pred             HhhcCCcc---------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecC
Q 001070          180 SLLRGHTK---------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGP  232 (1165)
Q Consensus       180 ~llrGH~q---------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGs  232 (1165)
                      ..|+||++                           |||||+.-|.++..+-+|. .+|.+|.|     |+++  ||-+||
T Consensus       194 ~~l~gH~K~It~Lawep~hl~p~~r~las~skDg~vrIWd~~~~~~~~~lsgHT-~~VTCvrw-----GG~g--liySgS  265 (480)
T KOG0271|consen  194 RALRGHKKWITALAWEPLHLVPPCRRLASSSKDGSVRIWDTKLGTCVRTLSGHT-ASVTCVRW-----GGEG--LIYSGS  265 (480)
T ss_pred             ccccCcccceeEEeecccccCCCccceecccCCCCEEEEEccCceEEEEeccCc-cceEEEEE-----cCCc--eEEecC
Confidence            69999999                           9999999999999999884 69999999     3232  688999


Q ss_pred             CCceEEEeEccC
Q 001070          233 LNREVKLWASAS  244 (1165)
Q Consensus       233 lnrtIKLW~~a~  244 (1165)
                      .|||||||+...
T Consensus       266 ~DrtIkvw~a~d  277 (480)
T KOG0271|consen  266 QDRTIKVWRALD  277 (480)
T ss_pred             CCceEEEEEccc
Confidence            999999999754


No 4  
>KOG0272 consensus U4/U6 small nuclear ribonucleoprotein Prp4 (contains WD40 repeats) [RNA processing and modification]
Probab=99.36  E-value=1.4e-12  Score=147.84  Aligned_cols=118  Identities=19%  Similarity=0.327  Sum_probs=101.7

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      +|+||.|+.-|..=|+||+.| ..-.+.+||+.                      -||||.|+|.++..|++|- +.||+
T Consensus       272 sG~~L~TasfD~tWRlWD~~tk~ElL~QEGHs~~v~~iaf~~DGSL~~tGGlD~~~RvWDlRtgr~im~L~gH~-k~I~~  350 (459)
T KOG0272|consen  272 SGKFLGTASFDSTWRLWDLETKSELLLQEGHSKGVFSIAFQPDGSLAATGGLDSLGRVWDLRTGRCIMFLAGHI-KEILS  350 (459)
T ss_pred             CCceeeecccccchhhcccccchhhHhhcccccccceeEecCCCceeeccCccchhheeecccCcEEEEecccc-cceee
Confidence            699999999999999999999 77779999999                      7999999999999999884 59999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEE
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF  292 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL  292 (1165)
                      |+|  +|||   . .+++|+.|.++||||+-..            .|+.|+.        +|...+.+|.+.|+.|..|+
T Consensus       351 V~f--sPNG---y-~lATgs~Dnt~kVWDLR~r------------~~ly~ip--------AH~nlVS~Vk~~p~~g~fL~  404 (459)
T KOG0272|consen  351 VAF--SPNG---Y-HLATGSSDNTCKVWDLRMR------------SELYTIP--------AHSNLVSQVKYSPQEGYFLV  404 (459)
T ss_pred             EeE--CCCc---e-EEeecCCCCcEEEeeeccc------------ccceecc--------cccchhhheEecccCCeEEE
Confidence            999  5777   2 4567999999999999554            7888888        58899999999998887777


Q ss_pred             eccCCCcE
Q 001070          293 ANAKKNAI  300 (1165)
Q Consensus       293 an~~r~aI  300 (1165)
                      +..+-|.+
T Consensus       405 TasyD~t~  412 (459)
T KOG0272|consen  405 TASYDNTV  412 (459)
T ss_pred             EcccCcce
Confidence            66655543


No 5  
>KOG0266 consensus WD40 repeat-containing protein [General function prediction only]
Probab=99.29  E-value=1.2e-11  Score=144.75  Aligned_cols=126  Identities=17%  Similarity=0.368  Sum_probs=101.0

Q ss_pred             eeecCceEEEeecCCcEEEEeCc-c-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLN-T-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~-t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      ++-||+||++|+.|++|||||+. . .....|+||+.                      |||||+++|.++..|.+|++ 
T Consensus       211 fs~d~~~l~s~s~D~tiriwd~~~~~~~~~~l~gH~~~v~~~~f~p~g~~i~Sgs~D~tvriWd~~~~~~~~~l~~hs~-  289 (456)
T KOG0266|consen  211 FSPDGSYLLSGSDDKTLRIWDLKDDGRNLKTLKGHSTYVTSVAFSPDGNLLVSGSDDGTVRIWDVRTGECVRKLKGHSD-  289 (456)
T ss_pred             ECCCCcEEEEecCCceEEEeeccCCCeEEEEecCCCCceEEEEecCCCCEEEEecCCCcEEEEeccCCeEEEeeeccCC-
Confidence            45589999999999999999994 3 55568899999                      99999999999999999975 


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcc--eEEEEeccCCCCCccccccEEEEEeecC
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWK--CTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~--C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      .|.+++|  .   +++.+|+ +|+.|++|+|||+.++            .  |+.++......     . -+.+|..+|+
T Consensus       290 ~is~~~f--~---~d~~~l~-s~s~d~~i~vwd~~~~------------~~~~~~~~~~~~~~-----~-~~~~~~fsp~  345 (456)
T KOG0266|consen  290 GISGLAF--S---PDGNLLV-SASYDGTIRVWDLETG------------SKLCLKLLSGAENS-----A-PVTSVQFSPN  345 (456)
T ss_pred             ceEEEEE--C---CCCCEEE-EcCCCccEEEEECCCC------------ceeeeecccCCCCC-----C-ceeEEEECCC
Confidence            9999999  3   4445466 4688999999998554            5  88888863211     2 5778999999


Q ss_pred             CcEEEEeccCCC-cEEEE
Q 001070          287 AGLLLFANAKKN-AIYSV  303 (1165)
Q Consensus       287 a~~ilLan~~r~-aIYal  303 (1165)
                      +.+|+.+...+. .+|-+
T Consensus       346 ~~~ll~~~~d~~~~~w~l  363 (456)
T KOG0266|consen  346 GKYLLSASLDRTLKLWDL  363 (456)
T ss_pred             CcEEEEecCCCeEEEEEc
Confidence            999999888843 34433


No 6  
>KOG0275 consensus Conserved WD40 repeat-containing protein [General function prediction only]
Probab=99.25  E-value=1e-11  Score=137.07  Aligned_cols=193  Identities=20%  Similarity=0.308  Sum_probs=129.5

Q ss_pred             ChHHHHHhhcCC--CCCCCCCCCCCCceee---cCCceEEe-cccCCCCCCCCCCcccccccccCCCcccccccEeeecC
Q 001070           84 AGPQILALLNNN--KSKHVGSTAPIYGKRV---FGDYVAYD-VDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNK  157 (1165)
Q Consensus        84 ~~~~~~~~l~~~--~~~~~~~~~p~~Gr~l---~g~~~~~d-Vd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~  157 (1165)
                      |..|||+||+..  -|+|.+--||  |--+   .|-+..-| +|-+-|     .+|  +---||+..-. +---+++.||
T Consensus       156 ppSRLlaLlGQaLKWQqHQGLLPP--Gt~iDLFRGkAA~K~~~Ee~~P-----t~l--~r~IKFg~KSh-~EcA~FSPDg  225 (508)
T KOG0275|consen  156 PPSRLLALLGQALKWQQHQGLLPP--GTTIDLFRGKAAMKDQEEERYP-----TQL--ARSIKFGQKSH-VECARFSPDG  225 (508)
T ss_pred             ChHHHHHHHHHHhhhHhhcCCCCC--CceeeeccchhhhhhhHhhhch-----HHh--hhheecccccc-hhheeeCCCC
Confidence            678999999765  3345432334  4333   55444333 222233     121  12224444332 2233489999


Q ss_pred             ceEEEeecCCcEEEEeCcc-hhhHhhcCCcc------------------------------EEEeecCCCceeEEec-CC
Q 001070          158 HYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK------------------------------IKIWEDSKVAPLIILK-PH  205 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t-~ir~llrGH~q------------------------------VriWD~~~g~pl~~le-ph  205 (1165)
                      .||++|+.||-|.|||-.+ .+|.=|+=..|                              ||||.+++|.|+++|+ .|
T Consensus       226 qyLvsgSvDGFiEVWny~~GKlrKDLkYQAqd~fMMmd~aVlci~FSRDsEMlAsGsqDGkIKvWri~tG~ClRrFdrAH  305 (508)
T KOG0275|consen  226 QYLVSGSVDGFIEVWNYTTGKLRKDLKYQAQDNFMMMDDAVLCISFSRDSEMLASGSQDGKIKVWRIETGQCLRRFDRAH  305 (508)
T ss_pred             ceEeeccccceeeeehhccchhhhhhhhhhhcceeecccceEEEeecccHHHhhccCcCCcEEEEEEecchHHHHhhhhh
Confidence            9999999999999999998 88886665555                              9999999999999998 44


Q ss_pred             CCCCcceeEeecC-------------------------------------CCCCCceEEEeecCCCceEEEeEccCcCCC
Q 001070          206 GGQPVNSAQYLTA-------------------------------------PNQAGHIILVTAGPLNREVKLWASASEEGW  248 (1165)
Q Consensus       206 dG~sV~SVaFl~a-------------------------------------P~~~d~~~lvtsGslnrtIKLW~~a~~~~~  248 (1165)
                       .+-|.++.|.-.                                     -...|+.++| ++|.|.+||+|+.-+    
T Consensus       306 -tkGvt~l~FSrD~SqiLS~sfD~tvRiHGlKSGK~LKEfrGHsSyvn~a~ft~dG~~ii-saSsDgtvkvW~~Kt----  379 (508)
T KOG0275|consen  306 -TKGVTCLSFSRDNSQILSASFDQTVRIHGLKSGKCLKEFRGHSSYVNEATFTDDGHHII-SASSDGTVKVWHGKT----  379 (508)
T ss_pred             -ccCeeEEEEccCcchhhcccccceEEEeccccchhHHHhcCccccccceEEcCCCCeEE-EecCCccEEEecCcc----
Confidence             345777777210                                     0013344345 799999999999744    


Q ss_pred             CCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          249 SLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       249 ~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                              ..|++||.-      .+.+.-+|+|.+.|-.-=-++-.-+.|.||.+.+.
T Consensus       380 --------teC~~Tfk~------~~~d~~vnsv~~~PKnpeh~iVCNrsntv~imn~q  423 (508)
T KOG0275|consen  380 --------TECLSTFKP------LGTDYPVNSVILLPKNPEHFIVCNRSNTVYIMNMQ  423 (508)
T ss_pred             --------hhhhhhccC------CCCcccceeEEEcCCCCceEEEEcCCCeEEEEecc
Confidence                    499999984      24677899999999876434444567999999875


No 7  
>KOG0295 consensus WD40 repeat-containing protein [Function unknown]
Probab=99.25  E-value=3.5e-11  Score=134.81  Aligned_cols=116  Identities=22%  Similarity=0.356  Sum_probs=100.5

Q ss_pred             cccEeeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------------------E
Q 001070          149 IGRQIAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------------------I  188 (1165)
Q Consensus       149 ~GR~IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------------------V  188 (1165)
                      .-|.|+||  |..||++..|.++|||-.++ ..+.+||+|+.                                     |
T Consensus       237 wvr~v~v~~DGti~As~s~dqtl~vW~~~t~~~k~~lR~hEh~vEci~wap~~~~~~i~~at~~~~~~~~l~s~SrDktI  316 (406)
T KOG0295|consen  237 WVRMVRVNQDGTIIASCSNDQTLRVWVVATKQCKAELREHEHPVECIAWAPESSYPSISEATGSTNGGQVLGSGSRDKTI  316 (406)
T ss_pred             hEEEEEecCCeeEEEecCCCceEEEEEeccchhhhhhhccccceEEEEecccccCcchhhccCCCCCccEEEeecccceE
Confidence            56889995  88999999999999999999 66779999999                                     9


Q ss_pred             EEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCC
Q 001070          189 KIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSS  268 (1165)
Q Consensus       189 riWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s  268 (1165)
                      ||||+.+|.+|-++.+| +++|.+++|.     |+|+||+ |..-|++|++||+...            .|..|++    
T Consensus       317 k~wdv~tg~cL~tL~gh-dnwVr~~af~-----p~Gkyi~-ScaDDktlrvwdl~~~------------~cmk~~~----  373 (406)
T KOG0295|consen  317 KIWDVSTGMCLFTLVGH-DNWVRGVAFS-----PGGKYIL-SCADDKTLRVWDLKNL------------QCMKTLE----  373 (406)
T ss_pred             EEEeccCCeEEEEEecc-cceeeeeEEc-----CCCeEEE-EEecCCcEEEEEeccc------------eeeeccC----
Confidence            99999999999999999 4799999993     5667788 6779999999999555            9999999    


Q ss_pred             CCCccccccEEEEEeecCCcEEE
Q 001070          269 AKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       269 ~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                          .|.-|++.+.++-.+-+++
T Consensus       374 ----ah~hfvt~lDfh~~~p~Vv  392 (406)
T KOG0295|consen  374 ----AHEHFVTSLDFHKTAPYVV  392 (406)
T ss_pred             ----CCcceeEEEecCCCCceEE
Confidence                3788998887776666554


No 8  
>KOG0285 consensus Pleiotropic regulator 1 [RNA processing and modification]
Probab=99.20  E-value=4.8e-11  Score=133.46  Aligned_cols=151  Identities=23%  Similarity=0.388  Sum_probs=110.9

Q ss_pred             cEeeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------------------------
Q 001070          151 RQIAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------------------------  187 (1165)
Q Consensus       151 R~IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------------------------  187 (1165)
                      |-||||  ..|+|+|+-|++|+|||++| .++..|.||--                                        
T Consensus       155 r~vavdP~n~wf~tgs~DrtikIwDlatg~LkltltGhi~~vr~vavS~rHpYlFs~gedk~VKCwDLe~nkvIR~YhGH  234 (460)
T KOG0285|consen  155 RSVAVDPGNEWFATGSADRTIKIWDLATGQLKLTLTGHIETVRGVAVSKRHPYLFSAGEDKQVKCWDLEYNKVIRHYHGH  234 (460)
T ss_pred             EEEeeCCCceeEEecCCCceeEEEEcccCeEEEeecchhheeeeeeecccCceEEEecCCCeeEEEechhhhhHHHhccc
Confidence            568887  68999999999999999999 88889999976                                        


Q ss_pred             ------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          188 ------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       188 ------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                                              +||||+|+..+|+++.+|++ +|.+|.|  .|-.|.    |.+||-|.||+|||+.
T Consensus       235 lS~V~~L~lhPTldvl~t~grDst~RvWDiRtr~~V~~l~GH~~-~V~~V~~--~~~dpq----vit~S~D~tvrlWDl~  307 (460)
T KOG0285|consen  235 LSGVYCLDLHPTLDVLVTGGRDSTIRVWDIRTRASVHVLSGHTN-PVASVMC--QPTDPQ----VITGSHDSTVRLWDLR  307 (460)
T ss_pred             cceeEEEeccccceeEEecCCcceEEEeeecccceEEEecCCCC-cceeEEe--ecCCCc----eEEecCCceEEEeeec
Confidence                                    99999999999999999974 9999999  444444    4479999999999997


Q ss_pred             CcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccc
Q 001070          244 SEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFT  323 (1165)
Q Consensus       244 ~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~  323 (1165)
                      .+            +-.-||.        .|+.-+--++++|.-.  ++|.+..+.|-..-+-.|     .++.+++.- 
T Consensus       308 ag------------kt~~tlt--------~hkksvral~lhP~e~--~fASas~dnik~w~~p~g-----~f~~nlsgh-  359 (460)
T KOG0285|consen  308 AG------------KTMITLT--------HHKKSVRALCLHPKEN--LFASASPDNIKQWKLPEG-----EFLQNLSGH-  359 (460)
T ss_pred             cC------------ceeEeee--------cccceeeEEecCCchh--hhhccCCccceeccCCcc-----chhhccccc-
Confidence            66            5555665        3555555666777643  445666666665554432     133332221 


Q ss_pred             cccceeeeeeccCC
Q 001070          324 VTMPVLSFTGTIDP  337 (1165)
Q Consensus       324 v~~PILSft~~~d~  337 (1165)
                       .-=|+++.+.+|+
T Consensus       360 -~~iintl~~nsD~  372 (460)
T KOG0285|consen  360 -NAIINTLSVNSDG  372 (460)
T ss_pred             -cceeeeeeeccCc
Confidence             1246777888777


No 9  
>KOG0266 consensus WD40 repeat-containing protein [General function prediction only]
Probab=99.18  E-value=1.9e-10  Score=134.81  Aligned_cols=129  Identities=22%  Similarity=0.367  Sum_probs=108.3

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-h--hhHhhcCCcc----------------------EEEeec-CCCceeEEecCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-A--TRSLLRGHTK----------------------IKIWED-SKVAPLIILKPHG  206 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~--ir~llrGH~q----------------------VriWD~-~~g~pl~~lephd  206 (1165)
                      ++-||+||+++.-|+.||+|+..+ .  ....|.||..                      |||||. ..+..+.++++|.
T Consensus       167 fs~~g~~l~~~~~~~~i~~~~~~~~~~~~~~~l~~h~~~v~~~~fs~d~~~l~s~s~D~tiriwd~~~~~~~~~~l~gH~  246 (456)
T KOG0266|consen  167 FSPDGRALAAASSDGLIRIWKLEGIKSNLLRELSGHTRGVSDVAFSPDGSYLLSGSDDKTLRIWDLKDDGRNLKTLKGHS  246 (456)
T ss_pred             EcCCCCeEEEccCCCcEEEeecccccchhhccccccccceeeeEECCCCcEEEEecCCceEEEeeccCCCeEEEEecCCC
Confidence            677999999999999999999966 4  4445589988                      999999 5568899999995


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                       ..||+++|  +|.+ .   +|.||+.|++|||||+.+            ++|+.+|.+        |++.+..+++.++
T Consensus       247 -~~v~~~~f--~p~g-~---~i~Sgs~D~tvriWd~~~------------~~~~~~l~~--------hs~~is~~~f~~d  299 (456)
T KOG0266|consen  247 -TYVTSVAF--SPDG-N---LLVSGSDDGTVRIWDVRT------------GECVRKLKG--------HSDGISGLAFSPD  299 (456)
T ss_pred             -CceEEEEe--cCCC-C---EEEEecCCCcEEEEeccC------------CeEEEeeec--------cCCceEEEEECCC
Confidence             59999999  5666 4   788999999999999844            499999995        7889999999999


Q ss_pred             CcEEEEeccCCCcEEEEEeecCC
Q 001070          287 AGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      +++|+.+.. ...|.+--+..+.
T Consensus       300 ~~~l~s~s~-d~~i~vwd~~~~~  321 (456)
T KOG0266|consen  300 GNLLVSASY-DGTIRVWDLETGS  321 (456)
T ss_pred             CCEEEEcCC-CccEEEEECCCCc
Confidence            999999954 6777666666544


No 10 
>KOG0263 consensus Transcription initiation factor TFIID, subunit TAF5 (also component of histone acetyltransferase SAGA) [Transcription]
Probab=99.17  E-value=5.7e-11  Score=142.43  Aligned_cols=131  Identities=19%  Similarity=0.372  Sum_probs=107.5

Q ss_pred             ccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------------
Q 001070          140 KYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------------  187 (1165)
Q Consensus       140 ~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------------  187 (1165)
                      .||.. +-+.|-.++.+.+||.+++||+.||+|+..| ..--..+||--                               
T Consensus       447 L~GH~-GPVyg~sFsPd~rfLlScSED~svRLWsl~t~s~~V~y~GH~~PVwdV~F~P~GyYFatas~D~tArLWs~d~~  525 (707)
T KOG0263|consen  447 LYGHS-GPVYGCSFSPDRRFLLSCSEDSSVRLWSLDTWSCLVIYKGHLAPVWDVQFAPRGYYFATASHDQTARLWSTDHN  525 (707)
T ss_pred             eecCC-CceeeeeecccccceeeccCCcceeeeecccceeEEEecCCCcceeeEEecCCceEEEecCCCceeeeeecccC
Confidence            44433 4566888999999999999999999999999 44448889987                               


Q ss_pred             ---------------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCC
Q 001070          188 ---------------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLN  234 (1165)
Q Consensus       188 ---------------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsln  234 (1165)
                                                       ||+||+.+|..|++|.+|.| +|.+|+|.  |   ++++|+ +|+-|
T Consensus       526 ~PlRifaghlsDV~cv~FHPNs~Y~aTGSsD~tVRlWDv~~G~~VRiF~GH~~-~V~al~~S--p---~Gr~La-Sg~ed  598 (707)
T KOG0263|consen  526 KPLRIFAGHLSDVDCVSFHPNSNYVATGSSDRTVRLWDVSTGNSVRIFTGHKG-PVTALAFS--P---CGRYLA-SGDED  598 (707)
T ss_pred             CchhhhcccccccceEEECCcccccccCCCCceEEEEEcCCCcEEEEecCCCC-ceEEEEEc--C---CCceEe-ecccC
Confidence                                             99999999999999998865 99999994  5   556576 69999


Q ss_pred             ceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          235 REVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       235 rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      +.|||||++++            +-+.+|.        +|.+-+.++.+..+++.|+.+.+...
T Consensus       599 ~~I~iWDl~~~------------~~v~~l~--------~Ht~ti~SlsFS~dg~vLasgg~Dns  642 (707)
T KOG0263|consen  599 GLIKIWDLANG------------SLVKQLK--------GHTGTIYSLSFSRDGNVLASGGADNS  642 (707)
T ss_pred             CcEEEEEcCCC------------cchhhhh--------cccCceeEEEEecCCCEEEecCCCCe
Confidence            99999999776            3444454        47778889999999998888877643


No 11 
>KOG0279 consensus G protein beta subunit-like protein [Signal transduction mechanisms]
Probab=99.13  E-value=6.5e-10  Score=121.70  Aligned_cols=175  Identities=17%  Similarity=0.252  Sum_probs=118.6

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      +.-||.|-.+|..||.+|+||+++ .-+..|.||+.                      |++|++-.+|-+.+-+...-++
T Consensus        71 ~s~dg~~alS~swD~~lrlWDl~~g~~t~~f~GH~~dVlsva~s~dn~qivSGSrDkTiklwnt~g~ck~t~~~~~~~~W  150 (315)
T KOG0279|consen   71 LSSDGNFALSASWDGTLRLWDLATGESTRRFVGHTKDVLSVAFSTDNRQIVSGSRDKTIKLWNTLGVCKYTIHEDSHREW  150 (315)
T ss_pred             EccCCceEEeccccceEEEEEecCCcEEEEEEecCCceEEEEecCCCceeecCCCcceeeeeeecccEEEEEecCCCcCc
Confidence            445799999999999999999999 77779999998                      9999998877666665322359


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccC--------------------cCCCCCCCCCC----------Ccce
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS--------------------EEGWSLPTHAE----------SWKC  259 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~--------------------~~~~~~~~~~~----------~w~C  259 (1165)
                      |.+|.|  .|+....  .|.+++-||++|+||+.+                    ..|-+.-++++          ..+|
T Consensus       151 Vscvrf--sP~~~~p--~Ivs~s~DktvKvWnl~~~~l~~~~~gh~~~v~t~~vSpDGslcasGgkdg~~~LwdL~~~k~  226 (315)
T KOG0279|consen  151 VSCVRF--SPNESNP--IIVSASWDKTVKVWNLRNCQLRTTFIGHSGYVNTVTVSPDGSLCASGGKDGEAMLWDLNEGKN  226 (315)
T ss_pred             EEEEEE--cCCCCCc--EEEEccCCceEEEEccCCcchhhccccccccEEEEEECCCCCEEecCCCCceEEEEEccCCce
Confidence            999999  4664332  366899999999999954                    11222222221          3568


Q ss_pred             EEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeeccCCCC
Q 001070          260 TQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPS  339 (1165)
Q Consensus       260 ~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~g  339 (1165)
                      +++|+         +.+.++++++.|..-||.+|-+..  |-...++-+.-=...+.|-+..=.-.-.+.++.-++-.||
T Consensus       227 lysl~---------a~~~v~sl~fspnrywL~~at~~s--IkIwdl~~~~~v~~l~~d~~g~s~~~~~~~clslaws~dG  295 (315)
T KOG0279|consen  227 LYSLE---------AFDIVNSLCFSPNRYWLCAATATS--IKIWDLESKAVVEELKLDGIGPSSKAGDPICLSLAWSADG  295 (315)
T ss_pred             eEecc---------CCCeEeeEEecCCceeEeeccCCc--eEEEeccchhhhhhccccccccccccCCcEEEEEEEcCCC
Confidence            88877         578899999999999988877665  4444444433323445555555122222233333344455


Q ss_pred             cce
Q 001070          340 EHI  342 (1165)
Q Consensus       340 e~~  342 (1165)
                      ...
T Consensus       296 ~tL  298 (315)
T KOG0279|consen  296 QTL  298 (315)
T ss_pred             cEE
Confidence            543


No 12 
>KOG0291 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=99.12  E-value=2.1e-10  Score=136.91  Aligned_cols=143  Identities=21%  Similarity=0.373  Sum_probs=110.3

Q ss_pred             ccccCCCcccccccE---------ee--ecCceEEEeecCCcEEEEeCcchhhH-hhcCCcc------------------
Q 001070          138 ITKYGSDPELLIGRQ---------IA--VNKHYVCYGLKGGNVRVLNLNTATRS-LLRGHTK------------------  187 (1165)
Q Consensus       138 It~Y~sd~~~~~GR~---------IA--Vn~~yIayG~kdg~IRVwdi~t~ir~-llrGH~q------------------  187 (1165)
                      |-+|+|--..++=.|         ++  -||.|||||++||.|||||+.+..|- +|.-|+-                  
T Consensus       332 LlVweWqsEsYVlKQQgH~~~i~~l~YSpDgq~iaTG~eDgKVKvWn~~SgfC~vTFteHts~Vt~v~f~~~g~~llssS  411 (893)
T KOG0291|consen  332 LLVWEWQSESYVLKQQGHSDRITSLAYSPDGQLIATGAEDGKVKVWNTQSGFCFVTFTEHTSGVTAVQFTARGNVLLSSS  411 (893)
T ss_pred             EEEEEeeccceeeeccccccceeeEEECCCCcEEEeccCCCcEEEEeccCceEEEEeccCCCceEEEEEEecCCEEEEee
Confidence            556777655544333         23  37999999999999999999995555 8998887                  


Q ss_pred             ------------------------------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCC
Q 001070          188 ------------------------------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAP  219 (1165)
Q Consensus       188 ------------------------------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP  219 (1165)
                                                                      |.||++++|..+.+|.+|.| +|.+++|  .|
T Consensus       412 LDGtVRAwDlkRYrNfRTft~P~p~QfscvavD~sGelV~AG~~d~F~IfvWS~qTGqllDiLsGHEg-PVs~l~f--~~  488 (893)
T KOG0291|consen  412 LDGTVRAWDLKRYRNFRTFTSPEPIQFSCVAVDPSGELVCAGAQDSFEIFVWSVQTGQLLDILSGHEG-PVSGLSF--SP  488 (893)
T ss_pred             cCCeEEeeeecccceeeeecCCCceeeeEEEEcCCCCEEEeeccceEEEEEEEeecCeeeehhcCCCC-cceeeEE--cc
Confidence                                                            88999999999999999988 9999999  45


Q ss_pred             CCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC-CC
Q 001070          220 NQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK-KN  298 (1165)
Q Consensus       220 ~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~-r~  298 (1165)
                      ++.    +++|||-|+|||||++-..           |.-+-||+..       ++  ++.|.+.|+|.=|-+|-.. --
T Consensus       489 ~~~----~LaS~SWDkTVRiW~if~s-----------~~~vEtl~i~-------sd--vl~vsfrPdG~elaVaTldgqI  544 (893)
T KOG0291|consen  489 DGS----LLASGSWDKTVRIWDIFSS-----------SGTVETLEIR-------SD--VLAVSFRPDGKELAVATLDGQI  544 (893)
T ss_pred             ccC----eEEeccccceEEEEEeecc-----------CceeeeEeec-------cc--eeEEEEcCCCCeEEEEEecceE
Confidence            553    5668999999999998443           4556778752       23  3478889999988887776 44


Q ss_pred             cEEEEEeec
Q 001070          299 AIYSVHLGY  307 (1165)
Q Consensus       299 aIYalhl~~  307 (1165)
                      +||-+..++
T Consensus       545 tf~d~~~~~  553 (893)
T KOG0291|consen  545 TFFDIKEAV  553 (893)
T ss_pred             EEEEhhhce
Confidence            566555554


No 13 
>KOG0271 consensus Notchless-like WD40 repeat-containing protein [Function unknown]
Probab=99.08  E-value=2.8e-10  Score=128.26  Aligned_cols=87  Identities=17%  Similarity=0.264  Sum_probs=67.2

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      ||+||-++|.-|..|++|=+ +||-|||.     .|-+ ||+|||.|.|||+|++.+.            +-.+.|.   
T Consensus       391 VkLW~g~tGk~lasfRGHv~-~VYqvaws-----aDsR-LlVS~SkDsTLKvw~V~tk------------Kl~~DLp---  448 (480)
T KOG0271|consen  391 VKLWDGRTGKFLASFRGHVA-AVYQVAWS-----ADSR-LLVSGSKDSTLKVWDVRTK------------KLKQDLP---  448 (480)
T ss_pred             eeeeeCCCcchhhhhhhccc-eeEEEEec-----cCcc-EEEEcCCCceEEEEEeeee------------eecccCC---
Confidence            99999999999999998854 99999995     5556 6779999999999998554            5556666   


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCCcEEEE
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYal  303 (1165)
                           ||+|=+.-|--.|||+.|.  ...++-+|.+
T Consensus       449 -----Gh~DEVf~vDwspDG~rV~--sggkdkv~~l  477 (480)
T KOG0271|consen  449 -----GHADEVFAVDWSPDGQRVA--SGGKDKVLRL  477 (480)
T ss_pred             -----CCCceEEEEEecCCCceee--cCCCceEEEe
Confidence                 4666555889999999764  3344444443


No 14 
>KOG0295 consensus WD40 repeat-containing protein [Function unknown]
Probab=99.05  E-value=9.8e-10  Score=123.43  Aligned_cols=153  Identities=16%  Similarity=0.264  Sum_probs=119.0

Q ss_pred             ecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      ..|.||++..+|..|+.||++| --..+|.||.+                      ||+|=+.++.+...|+.|. ++|-
T Consensus       203 P~gd~ilS~srD~tik~We~~tg~cv~t~~~h~ewvr~v~v~~DGti~As~s~dqtl~vW~~~t~~~k~~lR~hE-h~vE  281 (406)
T KOG0295|consen  203 PLGDHILSCSRDNTIKAWECDTGYCVKTFPGHSEWVRMVRVNQDGTIIASCSNDQTLRVWVVATKQCKAELREHE-HPVE  281 (406)
T ss_pred             ecCCeeeecccccceeEEecccceeEEeccCchHhEEEEEecCCeeEEEecCCCceEEEEEeccchhhhhhhccc-cceE
Confidence            3589999999999999999999 44459999999                      8899888888888899884 7999


Q ss_pred             eeEeec----------CCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEE
Q 001070          212 SAQYLT----------APNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQV  281 (1165)
Q Consensus       212 SVaFl~----------aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV  281 (1165)
                      +++|..          .|++..+++|. +||.||+|||||..++            .|+-||-        +|+..+-.+
T Consensus       282 ci~wap~~~~~~i~~at~~~~~~~~l~-s~SrDktIk~wdv~tg------------~cL~tL~--------ghdnwVr~~  340 (406)
T KOG0295|consen  282 CIAWAPESSYPSISEATGSTNGGQVLG-SGSRDKTIKIWDVSTG------------MCLFTLV--------GHDNWVRGV  340 (406)
T ss_pred             EEEecccccCcchhhccCCCCCccEEE-eecccceEEEEeccCC------------eEEEEEe--------cccceeeee
Confidence            999933          12333456566 7999999999999666            9999999        488999999


Q ss_pred             EeecCCcEEE-EeccCCCcEEEEEeecC--CCcccccccccccccccccee
Q 001070          282 VVLSQAGLLL-FANAKKNAIYSVHLGYG--NNSAATRIDYIAEFTVTMPVL  329 (1165)
Q Consensus       282 ~~~p~a~~il-Lan~~r~aIYalhl~~g--~~~~~~r~dyiaeF~v~~PIL  329 (1165)
                      +++|.|+||+ .||-+--.||-+.-..-  --++.++|..+-+|-.+.|..
T Consensus       341 af~p~Gkyi~ScaDDktlrvwdl~~~~cmk~~~ah~hfvt~lDfh~~~p~V  391 (406)
T KOG0295|consen  341 AFSPGGKYILSCADDKTLRVWDLKNLQCMKTLEAHEHFVTSLDFHKTAPYV  391 (406)
T ss_pred             EEcCCCeEEEEEecCCcEEEEEeccceeeeccCCCcceeEEEecCCCCceE
Confidence            9999999876 34444444443321110  012678999999999999943


No 15 
>KOG0276 consensus Vesicle coat complex COPI, beta' subunit [Intracellular trafficking, secretion, and vesicular transport]
Probab=99.03  E-value=3.7e-10  Score=132.77  Aligned_cols=120  Identities=24%  Similarity=0.414  Sum_probs=102.4

Q ss_pred             CCcccccccEeeec--CceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCC
Q 001070          143 SDPELLIGRQIAVN--KHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSK  195 (1165)
Q Consensus       143 sd~~~~~GR~IAVn--~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~  195 (1165)
                      +||    .|-|||.  .-|+.+++.|-+|+.||-..  +...+|.||++                       ||||..-.
T Consensus        97 ~Dy----IR~iavHPt~P~vLtsSDDm~iKlW~we~~wa~~qtfeGH~HyVMqv~fnPkD~ntFaS~sLDrTVKVWslgs  172 (794)
T KOG0276|consen   97 SDY----IRSIAVHPTLPYVLTSSDDMTIKLWDWENEWACEQTFEGHEHYVMQVAFNPKDPNTFASASLDRTVKVWSLGS  172 (794)
T ss_pred             ccc----eeeeeecCCCCeEEecCCccEEEEeeccCceeeeeEEcCcceEEEEEEecCCCccceeeeeccccEEEEEcCC
Confidence            566    8999997  56999999999999999998  67779999999                       99999988


Q ss_pred             CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccc
Q 001070          196 VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEE  275 (1165)
Q Consensus       196 g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~  275 (1165)
                      -.|.-+|++|+ .-|++|.|++.+|.|.   || +|+-|++||+||..+.            .|+|||++        |-
T Consensus       173 ~~~nfTl~gHe-kGVN~Vdyy~~gdkpy---lI-sgaDD~tiKvWDyQtk------------~CV~TLeG--------Ht  227 (794)
T KOG0276|consen  173 PHPNFTLEGHE-KGVNCVDYYTGGDKPY---LI-SGADDLTIKVWDYQTK------------SCVQTLEG--------HT  227 (794)
T ss_pred             CCCceeeeccc-cCcceEEeccCCCcce---EE-ecCCCceEEEeecchH------------HHHHHhhc--------cc
Confidence            88899999885 4799999998888877   77 5999999999998776            99999996        44


Q ss_pred             ccEEEEEeecCCcEEE
Q 001070          276 AFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       276 aff~sV~~~p~a~~il  291 (1165)
                      .=++.|..+|.=-+|+
T Consensus       228 ~Nvs~v~fhp~lpiii  243 (794)
T KOG0276|consen  228 NNVSFVFFHPELPIII  243 (794)
T ss_pred             ccceEEEecCCCcEEE
Confidence            5556667777766654


No 16 
>PTZ00421 coronin; Provisional
Probab=99.02  E-value=5.9e-09  Score=124.03  Aligned_cols=112  Identities=13%  Similarity=0.265  Sum_probs=84.9

Q ss_pred             cCceEEEeecCCcEEEEeCcch--------hhHhhcCCcc-----------------------EEEeecCCCceeEEecC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTA--------TRSLLRGHTK-----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~--------ir~llrGH~q-----------------------VriWD~~~g~pl~~lep  204 (1165)
                      |+++|++|..||.|||||+.+.        ....|.||+.                       |||||++++.++..++.
T Consensus        87 d~~~LaSgS~DgtIkIWdi~~~~~~~~~~~~l~~L~gH~~~V~~l~f~P~~~~iLaSgs~DgtVrIWDl~tg~~~~~l~~  166 (493)
T PTZ00421         87 DPQKLFTASEDGTIMGWGIPEEGLTQNISDPIVHLQGHTKKVGIVSFHPSAMNVLASAGADMVVNVWDVERGKAVEVIKC  166 (493)
T ss_pred             CCCEEEEEeCCCEEEEEecCCCccccccCcceEEecCCCCcEEEEEeCcCCCCEEEEEeCCCEEEEEECCCCeEEEEEcC
Confidence            5789999999999999999762        1236789976                       99999999999999998


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      |. ..|++++|  +|++   . ++++|+.|++|+|||+..+            +++.++.++..       .....++..
T Consensus       167 h~-~~V~sla~--spdG---~-lLatgs~Dg~IrIwD~rsg------------~~v~tl~~H~~-------~~~~~~~w~  220 (493)
T PTZ00421        167 HS-DQITSLEW--NLDG---S-LLCTTSKDKKLNIIDPRDG------------TIVSSVEAHAS-------AKSQRCLWA  220 (493)
T ss_pred             CC-CceEEEEE--ECCC---C-EEEEecCCCEEEEEECCCC------------cEEEEEecCCC-------CcceEEEEc
Confidence            84 58999999  4554   4 3446889999999998443            78888876432       122345556


Q ss_pred             cCCcEEEEe
Q 001070          285 SQAGLLLFA  293 (1165)
Q Consensus       285 p~a~~ilLa  293 (1165)
                      ++.++|+.+
T Consensus       221 ~~~~~ivt~  229 (493)
T PTZ00421        221 KRKDLIITL  229 (493)
T ss_pred             CCCCeEEEE
Confidence            777766654


No 17 
>KOG0263 consensus Transcription initiation factor TFIID, subunit TAF5 (also component of histone acetyltransferase SAGA) [Transcription]
Probab=99.01  E-value=7e-10  Score=133.28  Aligned_cols=86  Identities=27%  Similarity=0.476  Sum_probs=76.1

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      +-.|..|++||+-|+++|+||+.+ ..+.+|.||..                      |+|||..+|.+|..+.+|.| .
T Consensus       543 FHPNs~Y~aTGSsD~tVRlWDv~~G~~VRiF~GH~~~V~al~~Sp~Gr~LaSg~ed~~I~iWDl~~~~~v~~l~~Ht~-t  621 (707)
T KOG0263|consen  543 FHPNSNYVATGSSDRTVRLWDVSTGNSVRIFTGHKGPVTALAFSPCGRYLASGDEDGLIKIWDLANGSLVKQLKGHTG-T  621 (707)
T ss_pred             ECCcccccccCCCCceEEEEEcCCCcEEEEecCCCCceEEEEEcCCCceEeecccCCcEEEEEcCCCcchhhhhcccC-c
Confidence            444799999999999999999999 77889999999                      99999999999999999954 9


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      |||+.|.     .|+.+|+ +|+.|.+|++||+...
T Consensus       622 i~SlsFS-----~dg~vLa-sgg~DnsV~lWD~~~~  651 (707)
T KOG0263|consen  622 IYSLSFS-----RDGNVLA-SGGADNSVRLWDLTKV  651 (707)
T ss_pred             eeEEEEe-----cCCCEEE-ecCCCCeEEEEEchhh
Confidence            9999994     6666566 6889999999998655


No 18 
>PTZ00421 coronin; Provisional
Probab=98.98  E-value=6.4e-09  Score=123.72  Aligned_cols=132  Identities=13%  Similarity=0.202  Sum_probs=98.7

Q ss_pred             eeec---CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCC
Q 001070          153 IAVN---KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHG  206 (1165)
Q Consensus       153 IAVn---~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephd  206 (1165)
                      |+.+   +.+|++|..||.|||||+.+ .....|.+|..                      |||||.+++.++..+.+|.
T Consensus       131 l~f~P~~~~iLaSgs~DgtVrIWDl~tg~~~~~l~~h~~~V~sla~spdG~lLatgs~Dg~IrIwD~rsg~~v~tl~~H~  210 (493)
T PTZ00421        131 VSFHPSAMNVLASAGADMVVNVWDVERGKAVEVIKCHSDQITSLEWNLDGSLLCTTSKDKKLNIIDPRDGTIVSSVEAHA  210 (493)
T ss_pred             EEeCcCCCCEEEEEeCCCEEEEEECCCCeEEEEEcCCCCceEEEEEECCCCEEEEecCCCEEEEEECCCCcEEEEEecCC
Confidence            5554   46999999999999999998 55667889986                      9999999999999999998


Q ss_pred             CCCcceeEeecCCCCCCceEEEeec---CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEe
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAG---PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVV  283 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsG---slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~  283 (1165)
                      |..+..+.|.  |++   ..++++|   +.|++|+|||+...           ..+..++.+.       +....+...+
T Consensus       211 ~~~~~~~~w~--~~~---~~ivt~G~s~s~Dr~VklWDlr~~-----------~~p~~~~~~d-------~~~~~~~~~~  267 (493)
T PTZ00421        211 SAKSQRCLWA--KRK---DLIITLGCSKSQQRQIMLWDTRKM-----------ASPYSTVDLD-------QSSALFIPFF  267 (493)
T ss_pred             CCcceEEEEc--CCC---CeEEEEecCCCCCCeEEEEeCCCC-----------CCceeEeccC-------CCCceEEEEE
Confidence            7666677884  433   2356555   56999999998432           1455555542       1223445678


Q ss_pred             ecCCcEEEEeccCCCcEEEEEeec
Q 001070          284 LSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       284 ~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ++++++|+++...-..|+...+..
T Consensus       268 d~d~~~L~lggkgDg~Iriwdl~~  291 (493)
T PTZ00421        268 DEDTNLLYIGSKGEGNIRCFELMN  291 (493)
T ss_pred             cCCCCEEEEEEeCCCeEEEEEeeC
Confidence            999999999876567888888864


No 19 
>KOG0316 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=98.97  E-value=4.3e-09  Score=113.36  Aligned_cols=147  Identities=20%  Similarity=0.296  Sum_probs=109.7

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      .-|||+|..+..+|++||+||... .+-....||..                      |.+||+.+|.-+++|++|+| -
T Consensus        25 yN~dGnY~ltcGsdrtvrLWNp~rg~liktYsghG~EVlD~~~s~Dnskf~s~GgDk~v~vwDV~TGkv~Rr~rgH~a-q  103 (307)
T KOG0316|consen   25 YNVDGNYCLTCGSDRTVRLWNPLRGALIKTYSGHGHEVLDAALSSDNSKFASCGGDKAVQVWDVNTGKVDRRFRGHLA-Q  103 (307)
T ss_pred             EccCCCEEEEcCCCceEEeecccccceeeeecCCCceeeeccccccccccccCCCCceEEEEEcccCeeeeecccccc-e
Confidence            446899999999999999999998 77778889887                      99999999999999999976 7


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |+.|.|      .+---+|.||+.|++|++|||-+.          +.+-+|+|.        .-.+=+.+|.+.  ...
T Consensus       104 VNtV~f------NeesSVv~SgsfD~s~r~wDCRS~----------s~ePiQild--------ea~D~V~Si~v~--~he  157 (307)
T KOG0316|consen  104 VNTVRF------NEESSVVASGSFDSSVRLWDCRSR----------SFEPIQILD--------EAKDGVSSIDVA--EHE  157 (307)
T ss_pred             eeEEEe------cCcceEEEeccccceeEEEEcccC----------CCCccchhh--------hhcCceeEEEec--ccE
Confidence            999999      222226779999999999999553          457889887        234556666443  344


Q ss_pred             EEEeccCCC-cEEEEEeecCCCccccccccccccccccceeeeeeccCC
Q 001070          290 LLFANAKKN-AIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDP  337 (1165)
Q Consensus       290 ilLan~~r~-aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~  337 (1165)
                      ||-..+..+ -.|-|..+.      ..-||     +.+||-|.....|+
T Consensus       158 IvaGS~DGtvRtydiR~G~------l~sDy-----~g~pit~vs~s~d~  195 (307)
T KOG0316|consen  158 IVAGSVDGTVRTYDIRKGT------LSSDY-----FGHPITSVSFSKDG  195 (307)
T ss_pred             EEeeccCCcEEEEEeecce------eehhh-----cCCcceeEEecCCC
Confidence            554444433 245555442      24456     46899888877766


No 20 
>KOG0279 consensus G protein beta subunit-like protein [Signal transduction mechanisms]
Probab=98.96  E-value=3.3e-09  Score=116.25  Aligned_cols=144  Identities=15%  Similarity=0.269  Sum_probs=109.3

Q ss_pred             CcccccccccCCCcccccccEeee---cCceEEEeecCCcEEEEeCcc------hhhHhhcCCcc---------------
Q 001070          132 QLEVNPITKYGSDPELLIGRQIAV---NKHYVCYGLKGGNVRVLNLNT------ATRSLLRGHTK---------------  187 (1165)
Q Consensus       132 qlev~pIt~Y~sd~~~~~GR~IAV---n~~yIayG~kdg~IRVwdi~t------~ir~llrGH~q---------------  187 (1165)
                      +|++.-+-+|..+-    -.+||+   |..-|..+.+|+.|-+|+.+.      .....|+||++               
T Consensus         4 ~l~l~~tl~gh~d~----Vt~la~~~~~~~~l~sasrDk~ii~W~L~~dd~~~G~~~r~~~GHsH~v~dv~~s~dg~~al   79 (315)
T KOG0279|consen    4 QLVLRGTLEGHTDW----VTALAIKIKNSDILVSASRDKTIIVWKLTSDDIKYGVPVRRLTGHSHFVSDVVLSSDGNFAL   79 (315)
T ss_pred             hheeeeeecCCCce----EEEEEeecCCCceEEEcccceEEEEEEeccCccccCceeeeeeccceEecceEEccCCceEE
Confidence            56666666666665    333443   456777899999999999986      33458999999               


Q ss_pred             -------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceE
Q 001070          188 -------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCT  260 (1165)
Q Consensus       188 -------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~  260 (1165)
                             +|+||..+|.+-++|++| +.-|.||+|  +||..-    |.+||-|||||||+.             .+.|.
T Consensus        80 S~swD~~lrlWDl~~g~~t~~f~GH-~~dVlsva~--s~dn~q----ivSGSrDkTiklwnt-------------~g~ck  139 (315)
T KOG0279|consen   80 SASWDGTLRLWDLATGESTRRFVGH-TKDVLSVAF--STDNRQ----IVSGSRDKTIKLWNT-------------LGVCK  139 (315)
T ss_pred             eccccceEEEEEecCCcEEEEEEec-CCceEEEEe--cCCCce----eecCCCcceeeeeee-------------cccEE
Confidence                   999999999999999999 679999999  455533    457999999999995             45899


Q ss_pred             EEEeccCCCCCccccccEEEEEeecCC-cEEEEeccCCCcEEEEEe
Q 001070          261 QTLDLKSSAKPRVEEAFFNQVVVLSQA-GLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       261 QTLe~~~s~~~~~~~aff~sV~~~p~a-~~ilLan~~r~aIYalhl  305 (1165)
                      -|+.-.      .|.+.++.|.++|.. ..++++.---..+-+--+
T Consensus       140 ~t~~~~------~~~~WVscvrfsP~~~~p~Ivs~s~DktvKvWnl  179 (315)
T KOG0279|consen  140 YTIHED------SHREWVSCVRFSPNESNPIIVSASWDKTVKVWNL  179 (315)
T ss_pred             EEEecC------CCcCcEEEEEEcCCCCCcEEEEccCCceEEEEcc
Confidence            998742      237899999999996 566665554445444433


No 21 
>KOG0274 consensus Cdc4 and related F-box and WD-40 proteins [General function prediction only]
Probab=98.96  E-value=7.2e-10  Score=132.82  Aligned_cols=119  Identities=25%  Similarity=0.428  Sum_probs=93.0

Q ss_pred             ccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------EEEeecCCCceeEEecCCCCC
Q 001070          150 GRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       150 GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      ||-|...+.++..|+.|.+|||||+.+ +.-+||+||+.                    |+|||.+++.+|..+++|.| 
T Consensus       294 v~~~~~~~~~~~sgs~D~tVkVW~v~n~~~l~l~~~h~~~V~~v~~~~~~lvsgs~d~~v~VW~~~~~~cl~sl~gH~~-  372 (537)
T KOG0274|consen  294 VRCLTIDPFLLVSGSRDNTVKVWDVTNGACLNLLRGHTGPVNCVQLDEPLLVSGSYDGTVKVWDPRTGKCLKSLSGHTG-  372 (537)
T ss_pred             EEEEEccCceEeeccCCceEEEEeccCcceEEEeccccccEEEEEecCCEEEEEecCceEEEEEhhhceeeeeecCCcc-
Confidence            666777888999999999999999998 77779999988                    99999999999999999975 


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      .||+++|-  .+    . .+.+|+.|++||+||+...           ++|++||.+        |..+++..  .....
T Consensus       373 ~V~sl~~~--~~----~-~~~Sgs~D~~IkvWdl~~~-----------~~c~~tl~~--------h~~~v~~l--~~~~~  424 (537)
T KOG0274|consen  373 RVYSLIVD--SE----N-RLLSGSLDTTIKVWDLRTK-----------RKCIHTLQG--------HTSLVSSL--LLRDN  424 (537)
T ss_pred             eEEEEEec--Cc----c-eEEeeeeccceEeecCCch-----------hhhhhhhcC--------Cccccccc--ccccc
Confidence            99999882  21    2 3558999999999998443           299999996        55555333  34455


Q ss_pred             EEEEeccCC
Q 001070          289 LLLFANAKK  297 (1165)
Q Consensus       289 ~ilLan~~r  297 (1165)
                      +|+=+.+.+
T Consensus       425 ~Lvs~~aD~  433 (537)
T KOG0274|consen  425 FLVSSSADG  433 (537)
T ss_pred             eeEeccccc
Confidence            555554444


No 22 
>KOG0281 consensus Beta-TrCP (transducin repeats containing)/Slimb proteins [Function unknown]
Probab=98.95  E-value=6e-10  Score=124.36  Aligned_cols=105  Identities=24%  Similarity=0.425  Sum_probs=85.9

Q ss_pred             cccEeeec-----CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------EEEeecCCCceeEEe
Q 001070          149 IGRQIAVN-----KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------IKIWEDSKVAPLIIL  202 (1165)
Q Consensus       149 ~GR~IAVn-----~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------VriWD~~~g~pl~~l  202 (1165)
                      .|..-|||     .|||++.+.|++|||||+.| ..-.+|.||.-                    ||+||+..|.+|++|
T Consensus       317 vGHrAaVNvVdfd~kyIVsASgDRTikvW~~st~efvRtl~gHkRGIAClQYr~rlvVSGSSDntIRlwdi~~G~cLRvL  396 (499)
T KOG0281|consen  317 VGHRAAVNVVDFDDKYIVSASGDRTIKVWSTSTCEFVRTLNGHKRGIACLQYRDRLVVSGSSDNTIRLWDIECGACLRVL  396 (499)
T ss_pred             hhhhhheeeeccccceEEEecCCceEEEEeccceeeehhhhcccccceehhccCeEEEecCCCceEEEEeccccHHHHHH
Confidence            46666775     89999999999999999999 66668899987                    999999999999999


Q ss_pred             cCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          203 KPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       203 ephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      ++|+ +-|.++-|      -+.+  |+||-.|.+||+||+..+.   -|-...+-.|+.|+.=
T Consensus       397 eGHE-eLvRciRF------d~kr--IVSGaYDGkikvWdl~aal---dpra~~~~~Cl~~lv~  447 (499)
T KOG0281|consen  397 EGHE-ELVRCIRF------DNKR--IVSGAYDGKIKVWDLQAAL---DPRAPASTLCLRTLVE  447 (499)
T ss_pred             hchH-Hhhhheee------cCce--eeeccccceEEEEeccccc---CCcccccchHHHhhhh
Confidence            9984 69999999      3434  5689999999999997763   2333344578888763


No 23 
>KOG0319 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=98.91  E-value=2.5e-09  Score=127.91  Aligned_cols=180  Identities=21%  Similarity=0.341  Sum_probs=130.6

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      ||-|++.||||+.|++.+||+... .+-..|+||+.                      ||||-+.+..++.+|++|+ -+
T Consensus       471 ia~ndkLiAT~SqDktaKiW~le~~~l~~vLsGH~RGvw~V~Fs~~dq~laT~SgD~TvKIW~is~fSClkT~eGH~-~a  549 (775)
T KOG0319|consen  471 IAPNDKLIATGSQDKTAKIWDLEQLRLLGVLSGHTRGVWCVSFSKNDQLLATCSGDKTVKIWSISTFSCLKTFEGHT-SA  549 (775)
T ss_pred             ecCCCceEEecccccceeeecccCceEEEEeeCCccceEEEEeccccceeEeccCCceEEEEEeccceeeeeecCcc-ce
Confidence            666899999999999999999997 78889999998                      9999999999999999885 49


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |..+.|+     .++.+|| |+..|..||||++.+.            .|.+||..        |.+=+-..+..+...+
T Consensus       550 Vlra~F~-----~~~~qli-S~~adGliKlWnikt~------------eC~~tlD~--------H~DrvWaL~~~~~~~~  603 (775)
T KOG0319|consen  550 VLRASFI-----RNGKQLI-SAGADGLIKLWNIKTN------------ECEMTLDA--------HNDRVWALSVSPLLDM  603 (775)
T ss_pred             eEeeeee-----eCCcEEE-eccCCCcEEEEeccch------------hhhhhhhh--------ccceeEEEeecCccce
Confidence            9999997     4445588 5778999999999554            99999994        6666667777777777


Q ss_pred             EEEeccCCCcEEEEEeecC-CCc-----------------ccccccccc----ccccccceeeeeecc----CCC----C
Q 001070          290 LLFANAKKNAIYSVHLGYG-NNS-----------------AATRIDYIA----EFTVTMPVLSFTGTI----DPP----S  339 (1165)
Q Consensus       290 ilLan~~r~aIYalhl~~g-~~~-----------------~~~r~dyia----eF~v~~PILSft~~~----d~~----g  339 (1165)
                      ++-+.+...-|..=-..-- .+.                 .-..-+|-.    -|++..|.+.|+.-.    +.+    |
T Consensus       604 ~~tgg~Dg~i~~wkD~Te~~~~ee~~K~~eaieq~QeL~n~l~~~~~~~A~~LA~tLd~P~~~f~vi~~~~r~r~~e~l~  683 (775)
T KOG0319|consen  604 FVTGGGDGRIIFWKDVTEEEQNEEQEKREEAIEQEQELENLLSQKRYTKAFVLALTLDKPHLVFTVINALYRERDPEELG  683 (775)
T ss_pred             eEecCCCeEEEEeecCcHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhHHHHHhHhhccCchhHHHHHHHHHhcCCcHHHH
Confidence            6655555433332111000 000                 011333433    357788999998854    333    3


Q ss_pred             cceEEEEEeehhhhhhhccc
Q 001070          340 EHIIKLYCVQTQAIQQYSLN  359 (1165)
Q Consensus       340 e~~vq~yCvQtqAIQqy~l~  359 (1165)
                      ..+-+|+-=|..++=||.+.
T Consensus       684 ~av~~L~~dq~~~Ll~~~~~  703 (775)
T KOG0319|consen  684 QAVFRLNEDQPEALLQFVVK  703 (775)
T ss_pred             HHHHHhhhhhHHHHHHHHHH
Confidence            45677777788877776543


No 24 
>PTZ00420 coronin; Provisional
Probab=98.90  E-value=2.9e-08  Score=119.94  Aligned_cols=154  Identities=16%  Similarity=0.190  Sum_probs=106.0

Q ss_pred             cCce-EEEeecCCcEEEEeCcc-hhhHhhcCCcc---------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          156 NKHY-VCYGLKGGNVRVLNLNT-ATRSLLRGHTK---------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       156 n~~y-IayG~kdg~IRVwdi~t-~ir~llrGH~q---------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      ++.+ ||+|..||.|||||+.+ .....+..|..                     |||||.+++..+..+..|.|. +.+
T Consensus       136 ~g~~iLaSgS~DgtIrIWDl~tg~~~~~i~~~~~V~SlswspdG~lLat~s~D~~IrIwD~Rsg~~i~tl~gH~g~-~~s  214 (568)
T PTZ00420        136 MNYYIMCSSGFDSFVNIWDIENEKRAFQINMPKKLSSLKWNIKGNLLSGTCVGKHMHIIDPRKQEIASSFHIHDGG-KNT  214 (568)
T ss_pred             CCCeEEEEEeCCCeEEEEECCCCcEEEEEecCCcEEEEEECCCCCEEEEEecCCEEEEEECCCCcEEEEEecccCC-cee
Confidence            3555 57999999999999987 32222322221                     999999999999999999873 333


Q ss_pred             eE-eecCCCCCCceEEEeecCCC---ceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          213 AQ-YLTAPNQAGHIILVTAGPLN---REVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       213 Va-Fl~aP~~~d~~~lvtsGsln---rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      .. |++.- +++..+++|+|..+   |+|+|||+...           ..|+.++.+....       -.+--.++++.+
T Consensus       215 ~~v~~~~f-s~d~~~IlTtG~d~~~~R~VkLWDlr~~-----------~~pl~~~~ld~~~-------~~L~p~~D~~tg  275 (568)
T PTZ00420        215 KNIWIDGL-GGDDNYILSTGFSKNNMREMKLWDLKNT-----------TSALVTMSIDNAS-------APLIPHYDESTG  275 (568)
T ss_pred             EEEEeeeE-cCCCCEEEEEEcCCCCccEEEEEECCCC-----------CCceEEEEecCCc-------cceEEeeeCCCC
Confidence            22 22110 13445578767554   79999998542           2577777653221       111234578888


Q ss_pred             EEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeecc
Q 001070          289 LLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTI  335 (1165)
Q Consensus       289 ~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~  335 (1165)
                      .++|+-..-..||...+..+      .+-||++|.-+-|+-.|+-..
T Consensus       276 ~l~lsGkGD~tIr~~e~~~~------~~~~l~~~~s~~p~~g~~f~P  316 (568)
T PTZ00420        276 LIYLIGKGDGNCRYYQHSLG------SIRKVNEYKSCSPFRSFGFLP  316 (568)
T ss_pred             CEEEEEECCCeEEEEEccCC------cEEeecccccCCCccceEEcc
Confidence            88888888899999998643      588899999999998887654


No 25 
>KOG0274 consensus Cdc4 and related F-box and WD-40 proteins [General function prediction only]
Probab=98.89  E-value=6.6e-09  Score=124.71  Aligned_cols=93  Identities=29%  Similarity=0.472  Sum_probs=80.7

Q ss_pred             eeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      |+..  +.+|++|..|++|||||.++ ..-+.|.||..                    |||||+++|..|..+++|. .+
T Consensus       255 l~~~~~~~~lvsgS~D~t~rvWd~~sg~C~~~l~gh~stv~~~~~~~~~~~sgs~D~tVkVW~v~n~~~l~l~~~h~-~~  333 (537)
T KOG0274|consen  255 LAFPSGGDKLVSGSTDKTERVWDCSTGECTHSLQGHTSSVRCLTIDPFLLVSGSRDNTVKVWDVTNGACLNLLRGHT-GP  333 (537)
T ss_pred             EEEecCCCEEEEEecCCcEEeEecCCCcEEEEecCCCceEEEEEccCceEeeccCCceEEEEeccCcceEEEecccc-cc
Confidence            6667  89999999999999999999 55569999998                    9999999999999999984 59


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      |++|.+-     .+   ++.+|+.|.+||+|+...            ++|+.+|.++
T Consensus       334 V~~v~~~-----~~---~lvsgs~d~~v~VW~~~~------------~~cl~sl~gH  370 (537)
T KOG0274|consen  334 VNCVQLD-----EP---LLVSGSYDGTVKVWDPRT------------GKCLKSLSGH  370 (537)
T ss_pred             EEEEEec-----CC---EEEEEecCceEEEEEhhh------------ceeeeeecCC
Confidence            9999992     22   566899999999999854            4999999973


No 26 
>KOG0281 consensus Beta-TrCP (transducin repeats containing)/Slimb proteins [Function unknown]
Probab=98.89  E-value=1.3e-09  Score=121.69  Aligned_cols=186  Identities=19%  Similarity=0.290  Sum_probs=132.4

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------EEEeecCCCceeEEecCCCCCCcceeE
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------IKIWEDSKVAPLIILKPHGGQPVNSAQ  214 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------VriWD~~~g~pl~~lephdG~sV~SVa  214 (1165)
                      |+.-|++|++|++|.|||.++ .+...|.||++                    |||||+.+|.||-++-.| -+.|-.+-
T Consensus       206 DD~kiVSGlrDnTikiWD~n~~~c~~~L~GHtGSVLCLqyd~rviisGSSDsTvrvWDv~tge~l~tlihH-ceaVLhlr  284 (499)
T KOG0281|consen  206 DDEKIVSGLRDNTIKIWDKNSLECLKILTGHTGSVLCLQYDERVIVSGSSDSTVRVWDVNTGEPLNTLIHH-CEAVLHLR  284 (499)
T ss_pred             cchhhhcccccCceEEeccccHHHHHhhhcCCCcEEeeeccceEEEecCCCceEEEEeccCCchhhHHhhh-cceeEEEE
Confidence            455578999999999999999 66669999999                    999999999999999877 47999999


Q ss_pred             eecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEec
Q 001070          215 YLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       215 Fl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan  294 (1165)
                      |.   +|    ++| +.|-||+|.+||++.+..         -.|..-|.        ||.|-+|.|.++.  .|||-|.
T Consensus       285 f~---ng----~mv-tcSkDrsiaVWdm~sps~---------it~rrVLv--------GHrAaVNvVdfd~--kyIVsAS  337 (499)
T KOG0281|consen  285 FS---NG----YMV-TCSKDRSIAVWDMASPTD---------ITLRRVLV--------GHRAAVNVVDFDD--KYIVSAS  337 (499)
T ss_pred             Ee---CC----EEE-EecCCceeEEEeccCchH---------HHHHHHHh--------hhhhheeeecccc--ceEEEec
Confidence            93   22    245 689999999999987643         36777676        5889999886554  4887776


Q ss_pred             cCCC-------cEEEEEeecCCCccccccccccccccccc----eeeeeecc-------CC----------------CC-
Q 001070          295 AKKN-------AIYSVHLGYGNNSAATRIDYIAEFTVTMP----VLSFTGTI-------DP----------------PS-  339 (1165)
Q Consensus       295 ~~r~-------aIYalhl~~g~~~~~~r~dyiaeF~v~~P----ILSft~~~-------d~----------------~g-  339 (1165)
                      -.|-       ..-++..-.|..-+.+...|=.+|.|+-.    |=.|.+..       ++                .| 
T Consensus       338 gDRTikvW~~st~efvRtl~gHkRGIAClQYr~rlvVSGSSDntIRlwdi~~G~cLRvLeGHEeLvRciRFd~krIVSGa  417 (499)
T KOG0281|consen  338 GDRTIKVWSTSTCEFVRTLNGHKRGIACLQYRDRLVVSGSSDNTIRLWDIECGACLRVLEGHEELVRCIRFDNKRIVSGA  417 (499)
T ss_pred             CCceEEEEeccceeeehhhhcccccceehhccCeEEEecCCCceEEEEeccccHHHHHHhchHHhhhheeecCceeeecc
Confidence            6542       12233334455566788889888887632    33343321       11                12 


Q ss_pred             -cceEEEEEeehhhhhhhccccccccCCCCCC
Q 001070          340 -EHIIKLYCVQTQAIQQYSLNLFQCLPPPAES  370 (1165)
Q Consensus       340 -e~~vq~yCvQtqAIQqy~l~~~~c~pp~~~~  370 (1165)
                       .|.|++.-.|+ |+|--...-..|+-...++
T Consensus       418 YDGkikvWdl~a-aldpra~~~~~Cl~~lv~h  448 (499)
T KOG0281|consen  418 YDGKIKVWDLQA-ALDPRAPASTLCLRTLVEH  448 (499)
T ss_pred             ccceEEEEeccc-ccCCcccccchHHHhhhhc
Confidence             25789988886 5555555555676544433


No 27 
>PTZ00420 coronin; Provisional
Probab=98.88  E-value=2.6e-08  Score=120.27  Aligned_cols=128  Identities=12%  Similarity=0.217  Sum_probs=89.7

Q ss_pred             CceEEEeecCCcEEEEeCcc-h--hh------HhhcCCcc-----------------------EEEeecCCCceeEEecC
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-A--TR------SLLRGHTK-----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~--ir------~llrGH~q-----------------------VriWD~~~g~pl~~lep  204 (1165)
                      +.+|++|..||.|||||+.+ .  +.      ..|.||..                       |||||++++..+..+. 
T Consensus        87 ~~lLASgS~DgtIrIWDi~t~~~~~~~i~~p~~~L~gH~~~V~sVaf~P~g~~iLaSgS~DgtIrIWDl~tg~~~~~i~-  165 (568)
T PTZ00420         87 SEILASGSEDLTIRVWEIPHNDESVKEIKDPQCILKGHKKKISIIDWNPMNYYIMCSSGFDSFVNIWDIENEKRAFQIN-  165 (568)
T ss_pred             CCEEEEEeCCCeEEEEECCCCCccccccccceEEeecCCCcEEEEEECCCCCeEEEEEeCCCeEEEEECCCCcEEEEEe-
Confidence            78999999999999999975 2  11      25788876                       9999999998777776 


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      | +..|+|++|  .|+|   .+|+ +|+.|++|+|||+..            +.|+++|.++....  ....++ .+.+.
T Consensus       166 ~-~~~V~Slsw--spdG---~lLa-t~s~D~~IrIwD~Rs------------g~~i~tl~gH~g~~--~s~~v~-~~~fs  223 (568)
T PTZ00420        166 M-PKKLSSLKW--NIKG---NLLS-GTCVGKHMHIIDPRK------------QEIASSFHIHDGGK--NTKNIW-IDGLG  223 (568)
T ss_pred             c-CCcEEEEEE--CCCC---CEEE-EEecCCEEEEEECCC------------CcEEEEEecccCCc--eeEEEE-eeeEc
Confidence            3 358999999  4554   4354 577899999999843            48889998654221  111222 22345


Q ss_pred             cCCcEEEEeccCC---CcEEEEEeec
Q 001070          285 SQAGLLLFANAKK---NAIYSVHLGY  307 (1165)
Q Consensus       285 p~a~~ilLan~~r---~aIYalhl~~  307 (1165)
                      +++++|+-+...+   +.|+.-.+..
T Consensus       224 ~d~~~IlTtG~d~~~~R~VkLWDlr~  249 (568)
T PTZ00420        224 GDDNYILSTGFSKNNMREMKLWDLKN  249 (568)
T ss_pred             CCCCEEEEEEcCCCCccEEEEEECCC
Confidence            8888888765554   3566666554


No 28 
>PLN00181 protein SPA1-RELATED; Provisional
Probab=98.87  E-value=3e-08  Score=123.37  Aligned_cols=128  Identities=14%  Similarity=0.251  Sum_probs=94.5

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCc-eeEEecCCCCCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVA-PLIILKPHGGQPVN  211 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~-pl~~lephdG~sV~  211 (1165)
                      ||.+|++|..||.|||||+.+ ..-..+.+|..                      |+|||.+++. ++..+.+|. ..|+
T Consensus       587 ~~~~L~Sgs~Dg~v~iWd~~~~~~~~~~~~~~~v~~v~~~~~~g~~latgs~dg~I~iwD~~~~~~~~~~~~~h~-~~V~  665 (793)
T PLN00181        587 DPTLLASGSDDGSVKLWSINQGVSIGTIKTKANICCVQFPSESGRSLAFGSADHKVYYYDLRNPKLPLCTMIGHS-KTVS  665 (793)
T ss_pred             CCCEEEEEcCCCEEEEEECCCCcEEEEEecCCCeEEEEEeCCCCCEEEEEeCCCeEEEEECCCCCccceEecCCC-CCEE
Confidence            578999999999999999987 22223333321                      9999998764 788888884 4899


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      +|.|.      ++.+|+ +|+.|.+|||||+....      ....|.|+.+|.+        |....+.+.++|++++|+
T Consensus       666 ~v~f~------~~~~lv-s~s~D~~ikiWd~~~~~------~~~~~~~l~~~~g--------h~~~i~~v~~s~~~~~la  724 (793)
T PLN00181        666 YVRFV------DSSTLV-SSSTDNTLKLWDLSMSI------SGINETPLHSFMG--------HTNVKNFVGLSVSDGYIA  724 (793)
T ss_pred             EEEEe------CCCEEE-EEECCCEEEEEeCCCCc------cccCCcceEEEcC--------CCCCeeEEEEcCCCCEEE
Confidence            99994      223355 57899999999985431      1235789999884        667777889999999877


Q ss_pred             EeccCCCcEEEEEee
Q 001070          292 FANAKKNAIYSVHLG  306 (1165)
Q Consensus       292 Lan~~r~aIYalhl~  306 (1165)
                      .+. ..+.||..+..
T Consensus       725 sgs-~D~~v~iw~~~  738 (793)
T PLN00181        725 TGS-ETNEVFVYHKA  738 (793)
T ss_pred             EEe-CCCEEEEEECC
Confidence            666 44567776654


No 29 
>KOG0272 consensus U4/U6 small nuclear ribonucleoprotein Prp4 (contains WD40 repeats) [RNA processing and modification]
Probab=98.87  E-value=3.9e-09  Score=120.37  Aligned_cols=151  Identities=21%  Similarity=0.326  Sum_probs=116.9

Q ss_pred             Cceee-cC----CceEEecccCCCCCCCCCCcccccccccCCCcccccccEeee--cCceEEEeecCCcEEEEeCcc-hh
Q 001070          107 YGKRV-FG----DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAV--NKHYVCYGLKGGNVRVLNLNT-AT  178 (1165)
Q Consensus       107 ~Gr~l-~g----~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAV--n~~yIayG~kdg~IRVwdi~t-~i  178 (1165)
                      .|++| ++    .-..|||++...+=-|    |=-.-.+|          -||-  ||+.+|+|.-|..=||||+.| +.
T Consensus       272 sG~~L~TasfD~tWRlWD~~tk~ElL~Q----EGHs~~v~----------~iaf~~DGSL~~tGGlD~~~RvWDlRtgr~  337 (459)
T KOG0272|consen  272 SGKFLGTASFDSTWRLWDLETKSELLLQ----EGHSKGVF----------SIAFQPDGSLAATGGLDSLGRVWDLRTGRC  337 (459)
T ss_pred             CCceeeecccccchhhcccccchhhHhh----cccccccc----------eeEecCCCceeeccCccchhheeecccCcE
Confidence            48888 55    4567888886654333    11111111          1333  799999999999999999999 66


Q ss_pred             hHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCce
Q 001070          179 RSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNRE  236 (1165)
Q Consensus       179 r~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrt  236 (1165)
                      -..|.||.+                      +||||.+...++.+.-.| -+-|.-|.|  .|  ..+.||+| ++.|.+
T Consensus       338 im~L~gH~k~I~~V~fsPNGy~lATgs~Dnt~kVWDLR~r~~ly~ipAH-~nlVS~Vk~--~p--~~g~fL~T-asyD~t  411 (459)
T KOG0272|consen  338 IMFLAGHIKEILSVAFSPNGYHLATGSSDNTCKVWDLRMRSELYTIPAH-SNLVSQVKY--SP--QEGYFLVT-ASYDNT  411 (459)
T ss_pred             EEEecccccceeeEeECCCceEEeecCCCCcEEEeeecccccceecccc-cchhhheEe--cc--cCCeEEEE-cccCcc
Confidence            679999999                      999999998888888877 469999999  45  24577885 889999


Q ss_pred             EEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCC
Q 001070          237 VKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKK  297 (1165)
Q Consensus       237 IKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r  297 (1165)
                      +|||..            ++|.|+++|-|        |+.=+.+|.+.++++||+-+...|
T Consensus       412 ~kiWs~------------~~~~~~ksLaG--------He~kV~s~Dis~d~~~i~t~s~DR  452 (459)
T KOG0272|consen  412 VKIWST------------RTWSPLKSLAG--------HEGKVISLDISPDSQAIATSSFDR  452 (459)
T ss_pred             eeeecC------------CCcccchhhcC--------CccceEEEEeccCCceEEEeccCc
Confidence            999984            67899999995        666666999999999998765543


No 30 
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=98.84  E-value=1.1e-07  Score=96.04  Aligned_cols=159  Identities=23%  Similarity=0.354  Sum_probs=112.0

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      ++++|++|..||.|+|||+.+ .....+.+|..                      |+|||..++..+..+..|+ ..|.+
T Consensus        20 ~~~~l~~~~~~g~i~i~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~l~~~~~~~~i~i~~~~~~~~~~~~~~~~-~~i~~   98 (289)
T cd00200          20 DGKLLATGSGDGTIKVWDLETGELLRTLKGHTGPVRDVAASADGTYLASGSSDKTIRLWDLETGECVRTLTGHT-SYVSS   98 (289)
T ss_pred             CCCEEEEeecCcEEEEEEeeCCCcEEEEecCCcceeEEEECCCCCEEEEEcCCCeEEEEEcCcccceEEEeccC-CcEEE
Confidence            579999999999999999987 55556777766                      9999999988888998875 38999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEE
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF  292 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL  292 (1165)
                      +.|.  |+   .. ++++|..|..|++|++..            +++..++.        .|...+..+.++|++.+|+.
T Consensus        99 ~~~~--~~---~~-~~~~~~~~~~i~~~~~~~------------~~~~~~~~--------~~~~~i~~~~~~~~~~~l~~  152 (289)
T cd00200          99 VAFS--PD---GR-ILSSSSRDKTIKVWDVET------------GKCLTTLR--------GHTDWVNSVAFSPDGTFVAS  152 (289)
T ss_pred             EEEc--CC---CC-EEEEecCCCeEEEEECCC------------cEEEEEec--------cCCCcEEEEEEcCcCCEEEE
Confidence            9994  44   34 444566899999999853            37777776        25567788999999888777


Q ss_pred             eccCCCcEEEEEeecCCCccccccccccccccc-cceeeeeeccCC------CCcceEEEEEeeh
Q 001070          293 ANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVT-MPVLSFTGTIDP------PSEHIIKLYCVQT  350 (1165)
Q Consensus       293 an~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~-~PILSft~~~d~------~ge~~vq~yCvQt  350 (1165)
                      +. ....||...+..+.-        +..|... .+|.++....+.      .+.+.|.+|-+.+
T Consensus       153 ~~-~~~~i~i~d~~~~~~--------~~~~~~~~~~i~~~~~~~~~~~l~~~~~~~~i~i~d~~~  208 (289)
T cd00200         153 SS-QDGTIKLWDLRTGKC--------VATLTGHTGEVNSVAFSPDGEKLLSSSSDGTIKLWDLST  208 (289)
T ss_pred             Ec-CCCcEEEEEcccccc--------ceeEecCccccceEEECCCcCEEEEecCCCcEEEEECCC
Confidence            76 445677766653221        2222222 255555554443      2356788887765


No 31 
>KOG0293 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.83  E-value=1.3e-08  Score=115.97  Aligned_cols=150  Identities=19%  Similarity=0.336  Sum_probs=110.6

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcc----hhhHhhcCCcc----------------------EEEeecCCCceeEEecCC
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNT----ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPH  205 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t----~ir~llrGH~q----------------------VriWD~~~g~pl~~leph  205 (1165)
                      +++-||||||++++|.+.-||++-.    .+..+|.||.+                      ++.||+.+|..++.+.-.
T Consensus       231 ~FS~nGkyLAsaSkD~Taiiw~v~~d~~~kl~~tlvgh~~~V~yi~wSPDdryLlaCg~~e~~~lwDv~tgd~~~~y~~~  310 (519)
T KOG0293|consen  231 QFSHNGKYLASASKDSTAIIWIVVYDVHFKLKKTLVGHSQPVSYIMWSPDDRYLLACGFDEVLSLWDVDTGDLRHLYPSG  310 (519)
T ss_pred             EEcCCCeeEeeccCCceEEEEEEecCcceeeeeeeecccCceEEEEECCCCCeEEecCchHheeeccCCcchhhhhcccC
Confidence            4788999999999999999999886    45679999999                      899999999877766533


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                      .|.+|.|.+|+  |||   ..+|+ |+.||+|-+||+++..-       +.|+-+.+             .-+.-+++++
T Consensus       311 ~~~S~~sc~W~--pDg---~~~V~-Gs~dr~i~~wdlDgn~~-------~~W~gvr~-------------~~v~dlait~  364 (519)
T KOG0293|consen  311 LGFSVSSCAWC--PDG---FRFVT-GSPDRTIIMWDLDGNIL-------GNWEGVRD-------------PKVHDLAITY  364 (519)
T ss_pred             cCCCcceeEEc--cCC---ceeEe-cCCCCcEEEecCCcchh-------hccccccc-------------ceeEEEEEcC
Confidence            37899999996  555   44775 88999999999977642       34554333             2233678999


Q ss_pred             CCcEEEEecc-CCCcEEEEEeecCCCccccccccccccccccceeeeeeccCC
Q 001070          286 QAGLLLFANA-KKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDP  337 (1165)
Q Consensus       286 ~a~~ilLan~-~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~  337 (1165)
                      ||.|+++... ++..||-+.         +|.|. .-.+.-+||-||++-.|+
T Consensus       365 Dgk~vl~v~~d~~i~l~~~e---------~~~dr-~lise~~~its~~iS~d~  407 (519)
T KOG0293|consen  365 DGKYVLLVTVDKKIRLYNRE---------ARVDR-GLISEEQPITSFSISKDG  407 (519)
T ss_pred             CCcEEEEEecccceeeechh---------hhhhh-ccccccCceeEEEEcCCC
Confidence            9998887764 344555432         23332 123456899999997665


No 32 
>KOG0273 consensus Beta-transducin family (WD-40 repeat) protein [Chromatin structure and dynamics]
Probab=98.82  E-value=2.4e-08  Score=115.25  Aligned_cols=120  Identities=19%  Similarity=0.345  Sum_probs=93.2

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------------EEEeecCCCceeEEecC
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------------VriWD~~~g~pl~~lep  204 (1165)
                      |+.|++.+.|++.|||++.. .-.+=|++|++                               ||+||+..|.|+++|.-
T Consensus       371 g~LLaS~SdD~TlkiWs~~~~~~~~~l~~Hskei~t~~wsp~g~v~~n~~~~~~l~sas~dstV~lwdv~~gv~i~~f~k  450 (524)
T KOG0273|consen  371 GSLLASCSDDGTLKIWSMGQSNSVHDLQAHSKEIYTIKWSPTGPVTSNPNMNLMLASASFDSTVKLWDVESGVPIHTLMK  450 (524)
T ss_pred             CceEEEecCCCeeEeeecCCCcchhhhhhhccceeeEeecCCCCccCCCcCCceEEEeecCCeEEEEEccCCceeEeecc
Confidence            89999999999999999987 88889999996                               99999999999999998


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      | +++||+|+|+  |+|   ++ +++|++|+.|-||.+-++            +-++++.+         ...++.|.-+
T Consensus       451 H-~~pVysvafS--~~g---~y-lAsGs~dg~V~iws~~~~------------~l~~s~~~---------~~~Ifel~Wn  502 (524)
T KOG0273|consen  451 H-QEPVYSVAFS--PNG---RY-LASGSLDGCVHIWSTKTG------------KLVKSYQG---------TGGIFELCWN  502 (524)
T ss_pred             C-CCceEEEEec--CCC---cE-EEecCCCCeeEeccccch------------heeEeecC---------CCeEEEEEEc
Confidence            8 6899999995  554   53 558999999999998554            44444442         2334467777


Q ss_pred             cCCcEEEEeccCCCcEEEEEe
Q 001070          285 SQAGLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       285 p~a~~ilLan~~r~aIYalhl  305 (1165)
                      -++..| -+.++..-+-++-|
T Consensus       503 ~~G~kl-~~~~sd~~vcvldl  522 (524)
T KOG0273|consen  503 AAGDKL-GACASDGSVCVLDL  522 (524)
T ss_pred             CCCCEE-EEEecCCCceEEEe
Confidence            777544 34455555555544


No 33 
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=98.82  E-value=1.2e-07  Score=95.69  Aligned_cols=159  Identities=25%  Similarity=0.356  Sum_probs=114.5

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      ++++|++|..||.|+|||+.+ .....+.+|..                      |++||.+++.++..+..|. ..|++
T Consensus        62 ~~~~l~~~~~~~~i~i~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~-~~i~~  140 (289)
T cd00200          62 DGTYLASGSSDKTIRLWDLETGECVRTLTGHTSYVSSVAFSPDGRILSSSSRDKTIKVWDVETGKCLTTLRGHT-DWVNS  140 (289)
T ss_pred             CCCEEEEEcCCCeEEEEEcCcccceEEEeccCCcEEEEEEcCCCCEEEEecCCCeEEEEECCCcEEEEEeccCC-CcEEE
Confidence            578999999999999999998 55556677774                      9999999988899998774 48999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEE
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF  292 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL  292 (1165)
                      ++|.  |+   .. ++++|..|+.|++||+..            +++.+++..        +...+..+.++|++.+|++
T Consensus       141 ~~~~--~~---~~-~l~~~~~~~~i~i~d~~~------------~~~~~~~~~--------~~~~i~~~~~~~~~~~l~~  194 (289)
T cd00200         141 VAFS--PD---GT-FVASSSQDGTIKLWDLRT------------GKCVATLTG--------HTGEVNSVAFSPDGEKLLS  194 (289)
T ss_pred             EEEc--Cc---CC-EEEEEcCCCcEEEEEccc------------cccceeEec--------CccccceEEECCCcCEEEE
Confidence            9994  44   34 344677899999999843            377777773        5567778999999988888


Q ss_pred             eccCCCcEEEEEeecCCCcccccccccccc-ccccceeeeeeccCC------CCcceEEEEEeeh
Q 001070          293 ANAKKNAIYSVHLGYGNNSAATRIDYIAEF-TVTMPVLSFTGTIDP------PSEHIIKLYCVQT  350 (1165)
Q Consensus       293 an~~r~aIYalhl~~g~~~~~~r~dyiaeF-~v~~PILSft~~~d~------~ge~~vq~yCvQt  350 (1165)
                      +.. ...|+...+..+.        .+..| .-..+|.++....+.      +..+.+++|-+.+
T Consensus       195 ~~~-~~~i~i~d~~~~~--------~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~i~i~~~~~  250 (289)
T cd00200         195 SSS-DGTIKLWDLSTGK--------CLGTLRGHENGVNSVAFSPDGYLLASGSEDGTIRVWDLRT  250 (289)
T ss_pred             ecC-CCcEEEEECCCCc--------eecchhhcCCceEEEEEcCCCcEEEEEcCCCcEEEEEcCC
Confidence            776 6677777665421        22333 223356665554443      1256677777654


No 34 
>KOG0276 consensus Vesicle coat complex COPI, beta' subunit [Intracellular trafficking, secretion, and vesicular transport]
Probab=98.80  E-value=1.2e-08  Score=120.33  Aligned_cols=121  Identities=24%  Similarity=0.337  Sum_probs=98.9

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCC-ceeEEecCCCCCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKV-APLIILKPHGGQPVN  211 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g-~pl~~lephdG~sV~  211 (1165)
                      -+.+|++|+.|.+|||+|-+| .--+.|..|..                      ||.||..++ .+.++||+| -|=|.
T Consensus        66 RknWiv~GsDD~~IrVfnynt~ekV~~FeAH~DyIR~iavHPt~P~vLtsSDDm~iKlW~we~~wa~~qtfeGH-~HyVM  144 (794)
T KOG0276|consen   66 RKNWIVTGSDDMQIRVFNYNTGEKVKTFEAHSDYIRSIAVHPTLPYVLTSSDDMTIKLWDWENEWACEQTFEGH-EHYVM  144 (794)
T ss_pred             ccceEEEecCCceEEEEecccceeeEEeeccccceeeeeecCCCCeEEecCCccEEEEeeccCceeeeeEEcCc-ceEEE
Confidence            368999999999999999999 66679999998                      999999987 569999999 48999


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc-EE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG-LL  290 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~-~i  290 (1165)
                      .|+|  .|..+.   -.+|+++|||||+|.+...            .|.-||++        |+.=+|.|.+-+.+. =.
T Consensus       145 qv~f--nPkD~n---tFaS~sLDrTVKVWslgs~------------~~nfTl~g--------HekGVN~Vdyy~~gdkpy  199 (794)
T KOG0276|consen  145 QVAF--NPKDPN---TFASASLDRTVKVWSLGSP------------HPNFTLEG--------HEKGVNCVDYYTGGDKPY  199 (794)
T ss_pred             EEEe--cCCCcc---ceeeeeccccEEEEEcCCC------------CCceeeec--------cccCcceEEeccCCCcce
Confidence            9999  687666   5779999999999999444            88999994        788888998877763 23


Q ss_pred             EEeccCCCcEEE
Q 001070          291 LFANAKKNAIYS  302 (1165)
Q Consensus       291 lLan~~r~aIYa  302 (1165)
                      |++-+.-+.|-+
T Consensus       200 lIsgaDD~tiKv  211 (794)
T KOG0276|consen  200 LISGADDLTIKV  211 (794)
T ss_pred             EEecCCCceEEE
Confidence            445555555443


No 35 
>PLN00181 protein SPA1-RELATED; Provisional
Probab=98.80  E-value=4.9e-08  Score=121.54  Aligned_cols=125  Identities=18%  Similarity=0.305  Sum_probs=88.9

Q ss_pred             ecCceEEEeecCCcEEEEeCcchhh---------HhhcCCcc----------------------EEEeecCCCceeEEec
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNTATR---------SLLRGHTK----------------------IKIWEDSKVAPLIILK  203 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t~ir---------~llrGH~q----------------------VriWD~~~g~pl~~le  203 (1165)
                      -||+|||+|..||.|||||..+...         ..+.+|..                      |||||..++..+..++
T Consensus       493 ~dg~~latgg~D~~I~iwd~~~~~~~~~~~~~~~~~~~~~~~v~~l~~~~~~~~~las~~~Dg~v~lWd~~~~~~~~~~~  572 (793)
T PLN00181        493 RDGEFFATAGVNKKIKIFECESIIKDGRDIHYPVVELASRSKLSGICWNSYIKSQVASSNFEGVVQVWDVARSQLVTEMK  572 (793)
T ss_pred             CCCCEEEEEeCCCEEEEEECCcccccccccccceEEecccCceeeEEeccCCCCEEEEEeCCCeEEEEECCCCeEEEEec
Confidence            3799999999999999999864211         01223321                      9999999999999999


Q ss_pred             CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEe
Q 001070          204 PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVV  283 (1165)
Q Consensus       204 phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~  283 (1165)
                      +|. ..|++|+|  .|..+.   ++.+|+.|++|+|||+..            +.|+.++..        + .-+..+.+
T Consensus       573 ~H~-~~V~~l~~--~p~~~~---~L~Sgs~Dg~v~iWd~~~------------~~~~~~~~~--------~-~~v~~v~~  625 (793)
T PLN00181        573 EHE-KRVWSIDY--SSADPT---LLASGSDDGSVKLWSINQ------------GVSIGTIKT--------K-ANICCVQF  625 (793)
T ss_pred             CCC-CCEEEEEE--cCCCCC---EEEEEcCCCEEEEEECCC------------CcEEEEEec--------C-CCeEEEEE
Confidence            995 48999999  443333   455688999999999843            389999874        2 23446666


Q ss_pred             ecC-CcEEEEeccCCCcEEEEEeec
Q 001070          284 LSQ-AGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       284 ~p~-a~~ilLan~~r~aIYalhl~~  307 (1165)
                      .+. +.+|+.+ ...+.||...+..
T Consensus       626 ~~~~g~~latg-s~dg~I~iwD~~~  649 (793)
T PLN00181        626 PSESGRSLAFG-SADHKVYYYDLRN  649 (793)
T ss_pred             eCCCCCEEEEE-eCCCeEEEEECCC
Confidence            554 5555554 4556788777654


No 36 
>KOG0286 consensus G-protein beta subunit [General function prediction only]
Probab=98.76  E-value=7.3e-08  Score=106.50  Aligned_cols=164  Identities=15%  Similarity=0.202  Sum_probs=120.4

Q ss_pred             ceee--cC---CceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHh
Q 001070          108 GKRV--FG---DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSL  181 (1165)
Q Consensus       108 Gr~l--~g---~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~l  181 (1165)
                      |..+  .|   -=.||++-++..-..++=.=++.-=|-|-|.-.|       +|+.-|.||+-|.++-+|||.+ ....-
T Consensus       109 g~~VAcGGLdN~Csiy~ls~~d~~g~~~v~r~l~gHtgylScC~f-------~dD~~ilT~SGD~TCalWDie~g~~~~~  181 (343)
T KOG0286|consen  109 GNFVACGGLDNKCSIYPLSTRDAEGNVRVSRELAGHTGYLSCCRF-------LDDNHILTGSGDMTCALWDIETGQQTQV  181 (343)
T ss_pred             CCeEEecCcCceeEEEecccccccccceeeeeecCccceeEEEEE-------cCCCceEecCCCceEEEEEcccceEEEE
Confidence            7777  44   3457999987654444113346666677776644       4567778999999999999999 55559


Q ss_pred             hcCCcc-----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEE
Q 001070          182 LRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVK  238 (1165)
Q Consensus       182 lrGH~q-----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIK  238 (1165)
                      |.||+.                       .|+||+|.|.+++.|++|++ -|++|.|.  |+|..    +++||-|.+.+
T Consensus       182 f~GH~gDV~slsl~p~~~ntFvSg~cD~~aklWD~R~~~c~qtF~ghes-DINsv~ff--P~G~a----fatGSDD~tcR  254 (343)
T KOG0286|consen  182 FHGHTGDVMSLSLSPSDGNTFVSGGCDKSAKLWDVRSGQCVQTFEGHES-DINSVRFF--PSGDA----FATGSDDATCR  254 (343)
T ss_pred             ecCCcccEEEEecCCCCCCeEEecccccceeeeeccCcceeEeeccccc-ccceEEEc--cCCCe----eeecCCCceeE
Confidence            999999                       89999999999999999976 79999995  77755    66799999999


Q ss_pred             EeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEE
Q 001070          239 LWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVH  304 (1165)
Q Consensus       239 LW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalh  304 (1165)
                      |+|+-..            .=+..++  ++.    ..-=+++|+++-+|++|+.. +.-..+|+--
T Consensus       255 lyDlRaD------------~~~a~ys--~~~----~~~gitSv~FS~SGRlLfag-y~d~~c~vWD  301 (343)
T KOG0286|consen  255 LYDLRAD------------QELAVYS--HDS----IICGITSVAFSKSGRLLFAG-YDDFTCNVWD  301 (343)
T ss_pred             EEeecCC------------cEEeeec--cCc----ccCCceeEEEcccccEEEee-ecCCceeEee
Confidence            9999443            2233333  211    12347799999999887765 6655565543


No 37 
>KOG0284 consensus Polyadenylation factor I complex, subunit PFS2 [RNA processing and modification]
Probab=98.75  E-value=1.6e-08  Score=115.10  Aligned_cols=117  Identities=26%  Similarity=0.424  Sum_probs=97.0

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      .+-||.|+.+|-++|.|++|+-+.+.-..+.+|..                       |||||.+-..+-.++.+| |--
T Consensus       146 ws~~g~wmiSgD~gG~iKyWqpnmnnVk~~~ahh~eaIRdlafSpnDskF~t~SdDg~ikiWdf~~~kee~vL~GH-gwd  224 (464)
T KOG0284|consen  146 WSHNGTWMISGDKGGMIKYWQPNMNNVKIIQAHHAEAIRDLAFSPNDSKFLTCSDDGTIKIWDFRMPKEERVLRGH-GWD  224 (464)
T ss_pred             EccCCCEEEEcCCCceEEecccchhhhHHhhHhhhhhhheeccCCCCceeEEecCCCeEEEEeccCCchhheeccC-CCC
Confidence            34489999999999999999999844444555542                       999999999888899998 889


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |-||.|  .|.. +   ||++|+-|..|||||.            +++.|+-||-        +|+.-++.|...|.+.|
T Consensus       225 VksvdW--HP~k-g---LiasgskDnlVKlWDp------------rSg~cl~tlh--------~HKntVl~~~f~~n~N~  278 (464)
T KOG0284|consen  225 VKSVDW--HPTK-G---LIASGSKDNLVKLWDP------------RSGSCLATLH--------GHKNTVLAVKFNPNGNW  278 (464)
T ss_pred             cceecc--CCcc-c---eeEEccCCceeEeecC------------CCcchhhhhh--------hccceEEEEEEcCCCCe
Confidence            999999  4442 3   7889999999999996            5569999999        48899999999999988


Q ss_pred             EEEeccC
Q 001070          290 LLFANAK  296 (1165)
Q Consensus       290 ilLan~~  296 (1165)
                      |+-+...
T Consensus       279 Llt~skD  285 (464)
T KOG0284|consen  279 LLTGSKD  285 (464)
T ss_pred             eEEccCC
Confidence            8765444


No 38 
>KOG0313 consensus Microtubule binding protein YTM1 (contains WD40 repeats) [Cytoskeleton]
Probab=98.73  E-value=3.1e-08  Score=112.05  Aligned_cols=113  Identities=22%  Similarity=0.401  Sum_probs=92.7

Q ss_pred             CceEEEeecCCcEEEEeCcchhhHhhcCCcc-------------------------------------------------
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRSLLRGHTK-------------------------------------------------  187 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~llrGH~q-------------------------------------------------  187 (1165)
                      +++|.+|..||.+||||.......++.||+.                                                 
T Consensus       115 ~~~IltgsYDg~~riWd~~Gk~~~~~~Ght~~ik~v~~v~~n~~~~~fvsas~Dqtl~Lw~~~~~~~~~~~~~~~~GHk~  194 (423)
T KOG0313|consen  115 SKWILTGSYDGTSRIWDLKGKSIKTIVGHTGPIKSVAWVIKNSSSCLFVSASMDQTLRLWKWNVGENKVKALKVCRGHKR  194 (423)
T ss_pred             CceEEEeecCCeeEEEecCCceEEEEecCCcceeeeEEEecCCccceEEEecCCceEEEEEecCchhhhhHHhHhccccc
Confidence            8999999999999999999999999999998                                                 


Q ss_pred             ----------------------EEEeecCC-------------------------CceeEEecCCCCCCcceeEeecCCC
Q 001070          188 ----------------------IKIWEDSK-------------------------VAPLIILKPHGGQPVNSAQYLTAPN  220 (1165)
Q Consensus       188 ----------------------VriWD~~~-------------------------g~pl~~lephdG~sV~SVaFl~aP~  220 (1165)
                                            ++||++..                         +.|+..+++|. ++|.+|.|.+   
T Consensus       195 ~V~sVsv~~sgtr~~SgS~D~~lkiWs~~~~~~~~~E~~s~~rrk~~~~~~~~~~r~P~vtl~GHt-~~Vs~V~w~d---  270 (423)
T KOG0313|consen  195 SVDSVSVDSSGTRFCSGSWDTMLKIWSVETDEEDELESSSNRRRKKQKREKEGGTRTPLVTLEGHT-EPVSSVVWSD---  270 (423)
T ss_pred             ceeEEEecCCCCeEEeecccceeeecccCCCccccccccchhhhhhhhhhhcccccCceEEecccc-cceeeEEEcC---
Confidence                                  89998321                         14899999995 5999999942   


Q ss_pred             CCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          221 QAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       221 ~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                       .+   .+-|++.|+|||.||+.++            .|..|+..         .+-||.|.++|...+|.-+...|+
T Consensus       271 -~~---v~yS~SwDHTIk~WDletg------------~~~~~~~~---------~ksl~~i~~~~~~~Ll~~gssdr~  323 (423)
T KOG0313|consen  271 -AT---VIYSVSWDHTIKVWDLETG------------GLKSTLTT---------NKSLNCISYSPLSKLLASGSSDRH  323 (423)
T ss_pred             -CC---ceEeecccceEEEEEeecc------------cceeeeec---------CcceeEeecccccceeeecCCCCc
Confidence             22   3447999999999999666            89999984         455679999998877776666653


No 39 
>KOG0265 consensus U5 snRNP-specific protein-like factor and related proteins [RNA processing and modification]
Probab=98.73  E-value=4.5e-08  Score=108.38  Aligned_cols=155  Identities=18%  Similarity=0.246  Sum_probs=106.3

Q ss_pred             ccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhh--HhhcCCcc----------------------EE
Q 001070          134 EVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATR--SLLRGHTK----------------------IK  189 (1165)
Q Consensus       134 ev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir--~llrGH~q----------------------Vr  189 (1165)
                      +..||-.-.--.+...-=++..||.|+++|.-|.+|-+||......  ..++||+.                      ||
T Consensus        36 l~ap~m~l~gh~geI~~~~F~P~gs~~aSgG~Dr~I~LWnv~gdceN~~~lkgHsgAVM~l~~~~d~s~i~S~gtDk~v~  115 (338)
T KOG0265|consen   36 LQAPIMLLPGHKGEIYTIKFHPDGSCFASGGSDRAIVLWNVYGDCENFWVLKGHSGAVMELHGMRDGSHILSCGTDKTVR  115 (338)
T ss_pred             ccchhhhcCCCcceEEEEEECCCCCeEeecCCcceEEEEeccccccceeeeccccceeEeeeeccCCCEEEEecCCceEE
Confidence            3445554444444444445777999999999999999999887333  48889999                      99


Q ss_pred             EeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCC--------------CC--
Q 001070          190 IWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLP--------------TH--  253 (1165)
Q Consensus       190 iWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~--------------~~--  253 (1165)
                      +||+++|....+++.|. .-|+++.    |...+ .+||.||+.|+|+||||.-..+..-+.              ++  
T Consensus       116 ~wD~~tG~~~rk~k~h~-~~vNs~~----p~rrg-~~lv~SgsdD~t~kl~D~R~k~~~~t~~~kyqltAv~f~d~s~qv  189 (338)
T KOG0265|consen  116 GWDAETGKRIRKHKGHT-SFVNSLD----PSRRG-PQLVCSGSDDGTLKLWDIRKKEAIKTFENKYQLTAVGFKDTSDQV  189 (338)
T ss_pred             EEecccceeeehhcccc-ceeeecC----ccccC-CeEEEecCCCceEEEEeecccchhhccccceeEEEEEecccccce
Confidence            99999999999999984 5777776    44444 449999999999999998533111000              00  


Q ss_pred             --------CCCc-----ceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEE
Q 001070          254 --------AESW-----KCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       254 --------~~~w-----~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYal  303 (1165)
                              -+.|     .|+-||+        ||.|-+-++.+.|++.++ |+|+-.|.|-.+
T Consensus       190 ~sggIdn~ikvWd~r~~d~~~~ls--------Gh~DtIt~lsls~~gs~l-lsnsMd~tvrvw  243 (338)
T KOG0265|consen  190 ISGGIDNDIKVWDLRKNDGLYTLS--------GHADTITGLSLSRYGSFL-LSNSMDNTVRVW  243 (338)
T ss_pred             eeccccCceeeeccccCcceEEee--------cccCceeeEEeccCCCcc-ccccccceEEEE
Confidence                    0112     3455555        467777777777777765 455555544443


No 40 
>KOG0286 consensus G-protein beta subunit [General function prediction only]
Probab=98.71  E-value=5.2e-08  Score=107.61  Aligned_cols=110  Identities=23%  Similarity=0.377  Sum_probs=93.2

Q ss_pred             eeecCceEEEeecCCcEEEEeCcch-------hhHhhcCCcc---------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTA-------TRSLLRGHTK---------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~-------ir~llrGH~q---------------------VriWD~~~g~pl~~lep  204 (1165)
                      +|.+|+|||.|.=|..--|+++.++       +...|.||+.                     .-+||+++|..+..|.+
T Consensus       105 ~sPSg~~VAcGGLdN~Csiy~ls~~d~~g~~~v~r~l~gHtgylScC~f~dD~~ilT~SGD~TCalWDie~g~~~~~f~G  184 (343)
T KOG0286|consen  105 YSPSGNFVACGGLDNKCSIYPLSTRDAEGNVRVSRELAGHTGYLSCCRFLDDNHILTGSGDMTCALWDIETGQQTQVFHG  184 (343)
T ss_pred             ECCCCCeEEecCcCceeEEEecccccccccceeeeeecCccceeEEEEEcCCCceEecCCCceEEEEEcccceEEEEecC
Confidence            5668999999999999999999852       4457999999                     67999999999999999


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      |.| -|.++.+  +|..+.   ..+||+-|++-||||+-.            +.|+|||++        |+.=+|.|.+.
T Consensus       185 H~g-DV~slsl--~p~~~n---tFvSg~cD~~aklWD~R~------------~~c~qtF~g--------hesDINsv~ff  238 (343)
T KOG0286|consen  185 HTG-DVMSLSL--SPSDGN---TFVSGGCDKSAKLWDVRS------------GQCVQTFEG--------HESDINSVRFF  238 (343)
T ss_pred             Ccc-cEEEEec--CCCCCC---eEEecccccceeeeeccC------------cceeEeecc--------cccccceEEEc
Confidence            987 7999999  565333   456899999999999843            499999996        66678899999


Q ss_pred             cCCc
Q 001070          285 SQAG  288 (1165)
Q Consensus       285 p~a~  288 (1165)
                      |++-
T Consensus       239 P~G~  242 (343)
T KOG0286|consen  239 PSGD  242 (343)
T ss_pred             cCCC
Confidence            9986


No 41 
>KOG0315 consensus G-protein beta subunit-like protein (contains WD40 repeats) [General function prediction only]
Probab=98.70  E-value=1.2e-07  Score=103.05  Aligned_cols=168  Identities=14%  Similarity=0.262  Sum_probs=114.5

Q ss_pred             Cceee-c-C-C-ceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHh
Q 001070          107 YGKRV-F-G-D-YVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSL  181 (1165)
Q Consensus       107 ~Gr~l-~-g-~-~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~l  181 (1165)
                      +|+.| . | . -..|||.+..|   .       |+.-|..--+-+.-=.+--||++..+|.+||.+||||+.+ ....+
T Consensus        51 dk~~LAaa~~qhvRlyD~~S~np---~-------Pv~t~e~h~kNVtaVgF~~dgrWMyTgseDgt~kIWdlR~~~~qR~  120 (311)
T KOG0315|consen   51 DKKDLAAAGNQHVRLYDLNSNNP---N-------PVATFEGHTKNVTAVGFQCDGRWMYTGSEDGTVKIWDLRSLSCQRN  120 (311)
T ss_pred             CcchhhhccCCeeEEEEccCCCC---C-------ceeEEeccCCceEEEEEeecCeEEEecCCCceEEEEeccCcccchh
Confidence            35566 3 3 2 34699999877   3       4555554432222222334899999999999999999987 22223


Q ss_pred             hcCCcc---------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEe
Q 001070          182 LRGHTK---------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLW  240 (1165)
Q Consensus       182 lrGH~q---------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW  240 (1165)
                      |+--+.                     |||||.....+-+.+-|.++.+|.|++-  .|+|.-   |+ ++-.-.+.-.|
T Consensus       121 ~~~~spVn~vvlhpnQteLis~dqsg~irvWDl~~~~c~~~liPe~~~~i~sl~v--~~dgsm---l~-a~nnkG~cyvW  194 (311)
T KOG0315|consen  121 YQHNSPVNTVVLHPNQTELISGDQSGNIRVWDLGENSCTHELIPEDDTSIQSLTV--MPDGSM---LA-AANNKGNCYVW  194 (311)
T ss_pred             ccCCCCcceEEecCCcceEEeecCCCcEEEEEccCCccccccCCCCCcceeeEEE--cCCCcE---EE-EecCCccEEEE
Confidence            332222                     9999999887899999999999999999  565543   44 56666778889


Q ss_pred             EccCcCCCCCCCCCCCcceEEEE-eccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          241 ASASEEGWSLPTHAESWKCTQTL-DLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       241 ~~a~~~~~~~~~~~~~w~C~QTL-e~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      ++-..               |+. +|.+-..-..|..+.+++.++|+..+|.-+.+. ..+|+.-.+
T Consensus       195 ~l~~~---------------~~~s~l~P~~k~~ah~~~il~C~lSPd~k~lat~ssd-ktv~iwn~~  245 (311)
T KOG0315|consen  195 RLLNH---------------QTASELEPVHKFQAHNGHILRCLLSPDVKYLATCSSD-KTVKIWNTD  245 (311)
T ss_pred             EccCC---------------CccccceEhhheecccceEEEEEECCCCcEEEeecCC-ceEEEEecC
Confidence            98442               111 122222234688999999999999998877665 456666555


No 42 
>KOG0973 consensus Histone transcription regulator HIRA, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning; Transcription]
Probab=98.64  E-value=7.2e-08  Score=119.47  Aligned_cols=135  Identities=18%  Similarity=0.311  Sum_probs=112.8

Q ss_pred             cEeeecCceEEEeecCCcEEEEeCcc-------------------hhhHhhcCCcc----------------------EE
Q 001070          151 RQIAVNKHYVCYGLKGGNVRVLNLNT-------------------ATRSLLRGHTK----------------------IK  189 (1165)
Q Consensus       151 R~IAVn~~yIayG~kdg~IRVwdi~t-------------------~ir~llrGH~q----------------------Vr  189 (1165)
                      ..++-||+|||.|+.|+.|-||..+.                   +.+.+|+||+.                      |-
T Consensus        75 VR~S~dG~~lAsGSDD~~v~iW~~~~~~~~~~fgs~g~~~~vE~wk~~~~l~~H~~DV~Dv~Wsp~~~~lvS~s~DnsVi  154 (942)
T KOG0973|consen   75 VRFSPDGSYLASGSDDRLVMIWERAEIGSGTVFGSTGGAKNVESWKVVSILRGHDSDVLDVNWSPDDSLLVSVSLDNSVI  154 (942)
T ss_pred             EEECCCCCeEeeccCcceEEEeeecccCCcccccccccccccceeeEEEEEecCCCccceeccCCCccEEEEecccceEE
Confidence            34788999999999999999999981                   25679999998                      88


Q ss_pred             EeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCC
Q 001070          190 IWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSA  269 (1165)
Q Consensus       190 iWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~  269 (1165)
                      ||+.++...+.++++|.| .|--|.|  .|-|   +|+ ++-+-||+||+|..            ..|-|..+++.+=..
T Consensus       155 iwn~~tF~~~~vl~~H~s-~VKGvs~--DP~G---ky~-ASqsdDrtikvwrt------------~dw~i~k~It~pf~~  215 (942)
T KOG0973|consen  155 IWNAKTFELLKVLRGHQS-LVKGVSW--DPIG---KYF-ASQSDDRTLKVWRT------------SDWGIEKSITKPFEE  215 (942)
T ss_pred             EEccccceeeeeeecccc-cccceEE--CCcc---Cee-eeecCCceEEEEEc------------ccceeeEeeccchhh
Confidence            999999988999999976 8999999  4544   545 47999999999995            347899988853221


Q ss_pred             CCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          270 KPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       270 ~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                        ....-||+-..-+|||.+|..+|+-++..|++.|-
T Consensus       216 --~~~~T~f~RlSWSPDG~~las~nA~n~~~~~~~Ii  250 (942)
T KOG0973|consen  216 --SPLTTFFLRLSWSPDGHHLASPNAVNGGKSTIAII  250 (942)
T ss_pred             --CCCcceeeecccCCCcCeecchhhccCCcceeEEE
Confidence              13468999999999999999999999999998874


No 43 
>KOG0288 consensus WD40 repeat protein TipD [General function prediction only]
Probab=98.63  E-value=1.8e-07  Score=106.83  Aligned_cols=118  Identities=21%  Similarity=0.322  Sum_probs=87.6

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------------------------------
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------------------------------  187 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------------------------------  187 (1165)
                      ++++......|+..||||++. +.+++|+||+.                                               
T Consensus       230 ~~~~~iAas~d~~~r~Wnvd~~r~~~TLsGHtdkVt~ak~~~~~~~vVsgs~DRtiK~WDl~k~~C~kt~l~~S~cnDI~  309 (459)
T KOG0288|consen  230 DNKHVIAASNDKNLRLWNVDSLRLRHTLSGHTDKVTAAKFKLSHSRVVSGSADRTIKLWDLQKAYCSKTVLPGSQCNDIV  309 (459)
T ss_pred             CCceEEeecCCCceeeeeccchhhhhhhcccccceeeehhhccccceeeccccchhhhhhhhhhheeccccccccccceE
Confidence            478888888999999999999 99999999998                                               


Q ss_pred             --------------EEEeecCCCceeEEecCC--------------------------------------------CCCC
Q 001070          188 --------------IKIWEDSKVAPLIILKPH--------------------------------------------GGQP  209 (1165)
Q Consensus       188 --------------VriWD~~~g~pl~~leph--------------------------------------------dG~s  209 (1165)
                                    ||+||.+++.++.....+                                            +|+-
T Consensus       310 ~~~~~~~SgH~DkkvRfwD~Rs~~~~~sv~~gg~vtSl~ls~~g~~lLsssRDdtl~viDlRt~eI~~~~sA~g~k~asD  389 (459)
T KOG0288|consen  310 CSISDVISGHFDKKVRFWDIRSADKTRSVPLGGRVTSLDLSMDGLELLSSSRDDTLKVIDLRTKEIRQTFSAEGFKCASD  389 (459)
T ss_pred             ecceeeeecccccceEEEeccCCceeeEeecCcceeeEeeccCCeEEeeecCCCceeeeecccccEEEEeeccccccccc
Confidence                          899998776322221111                                            2345


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      +..|.|  +|++   . +|++||-|+.|+||+..++            +|..-|....+.      +-+++++.+|.|..
T Consensus       390 wtrvvf--Spd~---~-YvaAGS~dgsv~iW~v~tg------------KlE~~l~~s~s~------~aI~s~~W~~sG~~  445 (459)
T KOG0288|consen  390 WTRVVF--SPDG---S-YVAAGSADGSVYIWSVFTG------------KLEKVLSLSTSN------AAITSLSWNPSGSG  445 (459)
T ss_pred             cceeEE--CCCC---c-eeeeccCCCcEEEEEccCc------------eEEEEeccCCCC------cceEEEEEcCCCch
Confidence            667777  3444   4 3557999999999999666            888777763322      34669999999999


Q ss_pred             EEEeccCC
Q 001070          290 LLFANAKK  297 (1165)
Q Consensus       290 ilLan~~r  297 (1165)
                      +|-|+-.+
T Consensus       446 Llsadk~~  453 (459)
T KOG0288|consen  446 LLSADKQK  453 (459)
T ss_pred             hhcccCCc
Confidence            88877643


No 44 
>KOG0283 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.62  E-value=1.2e-07  Score=114.99  Aligned_cols=138  Identities=16%  Similarity=0.311  Sum_probs=98.4

Q ss_pred             cccccccccCCCcccccccE----eeecCceEEEeecCCcEEEEeCcc--------------------------------
Q 001070          133 LEVNPITKYGSDPELLIGRQ----IAVNKHYVCYGLKGGNVRVLNLNT--------------------------------  176 (1165)
Q Consensus       133 lev~pIt~Y~sd~~~~~GR~----IAVn~~yIayG~kdg~IRVwdi~t--------------------------------  176 (1165)
                      -+.+.+++-.+......|--    |+-||||||+|.+||.||||-+-.                                
T Consensus       251 kelsal~~~Qe~~~ah~gaIw~mKFS~DGKyLAsaGeD~virVWkVie~e~~~~~~~~~~~~~~~~~~~s~~~p~~s~~~  330 (712)
T KOG0283|consen  251 KELSALTVVQEISNAHKGAIWAMKFSHDGKYLASAGEDGVIRVWKVIESERMRVAEGDSSCMYFEYNANSQIEPSTSSEE  330 (712)
T ss_pred             ccceeeEEeeccccccCCcEEEEEeCCCCceeeecCCCceEEEEEEeccchhcccccccchhhhhhhhccccCccccccc
Confidence            45555555444443444443    666999999999999999998754                                


Q ss_pred             h-----------------------------hhHhhcCCcc---------------------EEEeecCCCceeEEecCCC
Q 001070          177 A-----------------------------TRSLLRGHTK---------------------IKIWEDSKVAPLIILKPHG  206 (1165)
Q Consensus       177 ~-----------------------------ir~llrGH~q---------------------VriWD~~~g~pl~~lephd  206 (1165)
                      .                             --..|+||++                     ||+|+...-.+|.+|. | 
T Consensus       331 ~~~~~~s~~~~~~~s~~~~~p~~~f~f~ekP~~ef~GHt~DILDlSWSKn~fLLSSSMDKTVRLWh~~~~~CL~~F~-H-  408 (712)
T KOG0283|consen  331 KISSRTSSSRKGSQSPCVLLPLKAFVFSEKPFCEFKGHTADILDLSWSKNNFLLSSSMDKTVRLWHPGRKECLKVFS-H-  408 (712)
T ss_pred             cccccccccccccCCccccCCCccccccccchhhhhccchhheecccccCCeeEeccccccEEeecCCCcceeeEEe-c-
Confidence            0                             0124667766                     9999998888899996 3 


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      -+=|.||+|  .|-.  -+|.| ||++|..|+||.+...+               -..|.      +=++++-.|++.|+
T Consensus       409 ndfVTcVaF--nPvD--DryFi-SGSLD~KvRiWsI~d~~---------------Vv~W~------Dl~~lITAvcy~Pd  462 (712)
T KOG0283|consen  409 NDFVTCVAF--NPVD--DRYFI-SGSLDGKVRLWSISDKK---------------VVDWN------DLRDLITAVCYSPD  462 (712)
T ss_pred             CCeeEEEEe--cccC--CCcEe-ecccccceEEeecCcCe---------------eEeeh------hhhhhheeEEeccC
Confidence            358999999  4533  34556 79999999999983331               11110      12478889999999


Q ss_pred             CcEEEEeccCCC
Q 001070          287 AGLLLFANAKKN  298 (1165)
Q Consensus       287 a~~ilLan~~r~  298 (1165)
                      |++.|+.-.+..
T Consensus       463 Gk~avIGt~~G~  474 (712)
T KOG0283|consen  463 GKGAVIGTFNGY  474 (712)
T ss_pred             CceEEEEEeccE
Confidence            999999987765


No 45 
>KOG0639 consensus Transducin-like enhancer of split protein (contains WD40 repeats) [Chromatin structure and dynamics]
Probab=98.61  E-value=4.6e-06  Score=97.29  Aligned_cols=235  Identities=16%  Similarity=0.223  Sum_probs=141.1

Q ss_pred             hHHHHHhhcCCCCC-CCCCCCCCCceee-cC-C--ceEEecccCCCCCCCCC--CcccccccccCCCcccccccE--eee
Q 001070           85 GPQILALLNNNKSK-HVGSTAPIYGKRV-FG-D--YVAYDVDAVEEGREPTQ--QLEVNPITKYGSDPELLIGRQ--IAV  155 (1165)
Q Consensus        85 ~~~~~~~l~~~~~~-~~~~~~p~~Gr~l-~g-~--~~~~dVd~~~~ge~~~p--qlev~pIt~Y~sd~~~~~GR~--IAV  155 (1165)
                      ++|=|..|+-+.-- .+.-+.|  -||+ +| -  --|+|  +..||.-- |  ||.+--=..|        -|.  +.-
T Consensus       409 harq~~tL~HGEvVcAvtIS~~--trhVyTgGkgcVKVWd--is~pg~k~-PvsqLdcl~rdny--------iRSckL~p  475 (705)
T KOG0639|consen  409 HARQINTLAHGEVVCAVTISNP--TRHVYTGGKGCVKVWD--ISQPGNKS-PVSQLDCLNRDNY--------IRSCKLLP  475 (705)
T ss_pred             hHHhhhhhccCcEEEEEEecCC--cceeEecCCCeEEEee--ccCCCCCC-ccccccccCcccc--------eeeeEecC
Confidence            66666666543111 0011334  5666 44 2  23444  45566554 4  5555432222        233  556


Q ss_pred             cCceEEEeecCCcEEEEeCcc---hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT---ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPV  210 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t---~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV  210 (1165)
                      ||+-|..|.+--++-|||+++   +|+.-|..-..                      |+|||.++...|+.|.+|. +-+
T Consensus       476 dgrtLivGGeastlsiWDLAapTprikaeltssapaCyALa~spDakvcFsccsdGnI~vwDLhnq~~VrqfqGht-DGa  554 (705)
T KOG0639|consen  476 DGRTLIVGGEASTLSIWDLAAPTPRIKAELTSSAPACYALAISPDAKVCFSCCSDGNIAVWDLHNQTLVRQFQGHT-DGA  554 (705)
T ss_pred             CCceEEeccccceeeeeeccCCCcchhhhcCCcchhhhhhhcCCccceeeeeccCCcEEEEEcccceeeecccCCC-CCc
Confidence            888888999999999999997   66666655333                      9999999999999999992 236


Q ss_pred             ceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCC--------------------CCCCCCCCCcceEEEEeccCCCC
Q 001070          211 NSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEG--------------------WSLPTHAESWKCTQTLDLKSSAK  270 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~--------------------~~~~~~~~~w~C~QTLe~~~s~~  270 (1165)
                      .|+-.  .+||..   |-| |.+|.+++-||+..++-                    |+.-+...+-.=++.-.....-.
T Consensus       555 scIdi--s~dGtk---lWT-GGlDntvRcWDlregrqlqqhdF~SQIfSLg~cP~~dWlavGMens~vevlh~skp~kyq  628 (705)
T KOG0639|consen  555 SCIDI--SKDGTK---LWT-GGLDNTVRCWDLREGRQLQQHDFSSQIFSLGYCPTGDWLAVGMENSNVEVLHTSKPEKYQ  628 (705)
T ss_pred             eeEEe--cCCCce---eec-CCCccceeehhhhhhhhhhhhhhhhhheecccCCCccceeeecccCcEEEEecCCcccee
Confidence            67766  455544   555 67999999999965432                    22211111101111111110112


Q ss_pred             CccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeeccCC------CCcceEE
Q 001070          271 PRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDP------PSEHIIK  344 (1165)
Q Consensus       271 ~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~------~ge~~vq  344 (1165)
                      ..-|+..++++-+.+-|.|.+ +--+-|.+-|-.--||..        |-+-.=+.++||-.|-.|.      .|+-..-
T Consensus       629 lhlheScVLSlKFa~cGkwfv-StGkDnlLnawrtPyGas--------iFqskE~SsVlsCDIS~ddkyIVTGSGdkkAT  699 (705)
T KOG0639|consen  629 LHLHESCVLSLKFAYCGKWFV-STGKDNLLNAWRTPYGAS--------IFQSKESSSVLSCDISFDDKYIVTGSGDKKAT  699 (705)
T ss_pred             ecccccEEEEEEecccCceee-ecCchhhhhhccCccccc--------eeeccccCcceeeeeccCceEEEecCCCcceE
Confidence            235778889999999999865 444556665555555433        3344557899999887655      4665667


Q ss_pred             EEEe
Q 001070          345 LYCV  348 (1165)
Q Consensus       345 ~yCv  348 (1165)
                      ||-|
T Consensus       700 VYeV  703 (705)
T KOG0639|consen  700 VYEV  703 (705)
T ss_pred             EEEE
Confidence            7755


No 46 
>KOG0273 consensus Beta-transducin family (WD-40 repeat) protein [Chromatin structure and dynamics]
Probab=98.59  E-value=2.3e-07  Score=107.28  Aligned_cols=122  Identities=18%  Similarity=0.295  Sum_probs=93.4

Q ss_pred             eeec--CceEEEeecCCcEEEEeCcchhhHhhcCCcc----------------------EEEeecCCCc-----------
Q 001070          153 IAVN--KHYVCYGLKGGNVRVLNLNTATRSLLRGHTK----------------------IKIWEDSKVA-----------  197 (1165)
Q Consensus       153 IAVn--~~yIayG~kdg~IRVwdi~t~ir~llrGH~q----------------------VriWD~~~g~-----------  197 (1165)
                      ++=|  |.+||||.+||.+||||+..++-+.|.-|..                      +-+||..+|.           
T Consensus       241 L~Wn~~G~~LatG~~~G~~riw~~~G~l~~tl~~HkgPI~slKWnk~G~yilS~~vD~ttilwd~~~g~~~q~f~~~s~~  320 (524)
T KOG0273|consen  241 LDWNNDGTLLATGSEDGEARIWNKDGNLISTLGQHKGPIFSLKWNKKGTYILSGGVDGTTILWDAHTGTVKQQFEFHSAP  320 (524)
T ss_pred             EEecCCCCeEEEeecCcEEEEEecCchhhhhhhccCCceEEEEEcCCCCEEEeccCCccEEEEeccCceEEEeeeeccCC
Confidence            4445  9999999999999999999999999999998                      5567765541           


Q ss_pred             ------------------------------eeEEecCCCC----------------------------------------
Q 001070          198 ------------------------------PLIILKPHGG----------------------------------------  207 (1165)
Q Consensus       198 ------------------------------pl~~lephdG----------------------------------------  207 (1165)
                                                    |+.+|.+|+|                                        
T Consensus       321 ~lDVdW~~~~~F~ts~td~~i~V~kv~~~~P~~t~~GH~g~V~alk~n~tg~LLaS~SdD~TlkiWs~~~~~~~~~l~~H  400 (524)
T KOG0273|consen  321 ALDVDWQSNDEFATSSTDGCIHVCKVGEDRPVKTFIGHHGEVNALKWNPTGSLLASCSDDGTLKIWSMGQSNSVHDLQAH  400 (524)
T ss_pred             ccceEEecCceEeecCCCceEEEEEecCCCcceeeecccCceEEEEECCCCceEEEecCCCeeEeeecCCCcchhhhhhh
Confidence                                          4566666644                                        


Q ss_pred             -CCcceeEeecCCCCCC------ceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEE
Q 001070          208 -QPVNSAQYLTAPNQAG------HIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQ  280 (1165)
Q Consensus       208 -~sV~SVaFl~aP~~~d------~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~s  280 (1165)
                       +.+|++.|  .|.++.      .. .+.+.+.|.++||||...            +.|+-||.        .|.+-+.+
T Consensus       401 skei~t~~w--sp~g~v~~n~~~~~-~l~sas~dstV~lwdv~~------------gv~i~~f~--------kH~~pVys  457 (524)
T KOG0273|consen  401 SKEIYTIKW--SPTGPVTSNPNMNL-MLASASFDSTVKLWDVES------------GVPIHTLM--------KHQEPVYS  457 (524)
T ss_pred             ccceeeEee--cCCCCccCCCcCCc-eEEEeecCCeEEEEEccC------------CceeEeec--------cCCCceEE
Confidence             25666666  354432      23 455788999999999844            49999997        47888889


Q ss_pred             EEeecCCcEEEEeccCC
Q 001070          281 VVVLSQAGLLLFANAKK  297 (1165)
Q Consensus       281 V~~~p~a~~ilLan~~r  297 (1165)
                      |+.+|++.++.-.+..+
T Consensus       458 vafS~~g~ylAsGs~dg  474 (524)
T KOG0273|consen  458 VAFSPNGRYLASGSLDG  474 (524)
T ss_pred             EEecCCCcEEEecCCCC
Confidence            99999999998777765


No 47 
>KOG0291 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=98.57  E-value=4.2e-07  Score=109.53  Aligned_cols=131  Identities=19%  Similarity=0.347  Sum_probs=108.2

Q ss_pred             eeec--CceEEEee-cCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCC
Q 001070          153 IAVN--KHYVCYGL-KGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHG  206 (1165)
Q Consensus       153 IAVn--~~yIayG~-kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephd  206 (1165)
                      .++|  |-+||-|. |-|++=||+-.+ ..-.=..||..                      |||||+++|.|+.+|.-|.
T Consensus       313 ~~~N~tGDWiA~g~~klgQLlVweWqsEsYVlKQQgH~~~i~~l~YSpDgq~iaTG~eDgKVKvWn~~SgfC~vTFteHt  392 (893)
T KOG0291|consen  313 VSFNSTGDWIAFGCSKLGQLLVWEWQSESYVLKQQGHSDRITSLAYSPDGQLIATGAEDGKVKVWNTQSGFCFVTFTEHT  392 (893)
T ss_pred             EEecccCCEEEEcCCccceEEEEEeeccceeeeccccccceeeEEECCCCcEEEeccCCCcEEEEeccCceEEEEeccCC
Confidence            5677  99999964 579999999998 44445678877                      9999999999999999885


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                       -.|..|.|.     ..+++|+ |.|+|.|++.||+            ...+|..||..       .+..-|..|++||+
T Consensus       393 -s~Vt~v~f~-----~~g~~ll-ssSLDGtVRAwDl------------kRYrNfRTft~-------P~p~QfscvavD~s  446 (893)
T KOG0291|consen  393 -SGVTAVQFT-----ARGNVLL-SSSLDGTVRAWDL------------KRYRNFRTFTS-------PEPIQFSCVAVDPS  446 (893)
T ss_pred             -CceEEEEEE-----ecCCEEE-EeecCCeEEeeee------------cccceeeeecC-------CCceeeeEEEEcCC
Confidence             479999994     4456566 7999999999998            44599999996       24567889999999


Q ss_pred             CcEEEEeccCCCcEEEEEeecCC
Q 001070          287 AGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      |.+|..+.-..=.||+.-+.-|.
T Consensus       447 GelV~AG~~d~F~IfvWS~qTGq  469 (893)
T KOG0291|consen  447 GELVCAGAQDSFEIFVWSVQTGQ  469 (893)
T ss_pred             CCEEEeeccceEEEEEEEeecCe
Confidence            99999998888888888777654


No 48 
>KOG0289 consensus mRNA splicing factor [General function prediction only]
Probab=98.57  E-value=3.3e-07  Score=105.33  Aligned_cols=94  Identities=21%  Similarity=0.256  Sum_probs=73.4

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      |||||..++.-+.+|-||.| +|.+++|.     -+|-+|+| +..|.+||||||-.-            +-.+||.+  
T Consensus       371 vkiwdlks~~~~a~Fpght~-~vk~i~Fs-----ENGY~Lat-~add~~V~lwDLRKl------------~n~kt~~l--  429 (506)
T KOG0289|consen  371 VKIWDLKSQTNVAKFPGHTG-PVKAISFS-----ENGYWLAT-AADDGSVKLWDLRKL------------KNFKTIQL--  429 (506)
T ss_pred             EEEEEcCCccccccCCCCCC-ceeEEEec-----cCceEEEE-EecCCeEEEEEehhh------------cccceeec--
Confidence            99999999888999999877 99999993     22344676 667888999999433            56678875  


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCC
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~  310 (1165)
                           .++.=++++.+|..|.|+.++   .+-||+.|..+...
T Consensus       430 -----~~~~~v~s~~fD~SGt~L~~~---g~~l~Vy~~~k~~k  464 (506)
T KOG0289|consen  430 -----DEKKEVNSLSFDQSGTYLGIA---GSDLQVYICKKKTK  464 (506)
T ss_pred             -----cccccceeEEEcCCCCeEEee---cceeEEEEEecccc
Confidence                 122237899999999999998   78899988886443


No 49 
>KOG0294 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.57  E-value=7.3e-07  Score=99.57  Aligned_cols=162  Identities=20%  Similarity=0.269  Sum_probs=116.9

Q ss_pred             CceEEecccCCCC----CCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhh----------
Q 001070          114 DYVAYDVDAVEEG----REPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATR----------  179 (1165)
Q Consensus       114 ~~~~~dVd~~~~g----e~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir----------  179 (1165)
                      ++++|.++...+-    +.+  ++.++|+=-|.+--+  --.-+||+|.|+|+|..|-+|+|+|..++..          
T Consensus        10 E~~i~Gf~l~~~~~~~~~s~--~~~l~~lF~~~aH~~--sitavAVs~~~~aSGssDetI~IYDm~k~~qlg~ll~Hags   85 (362)
T KOG0294|consen   10 EHVILGFKLDPEPKGCTDSV--KPTLKPLFAFSAHAG--SITALAVSGPYVASGSSDETIHIYDMRKRKQLGILLSHAGS   85 (362)
T ss_pred             eeEEEEEEeccCcccccccc--ceeeecccccccccc--ceeEEEecceeEeccCCCCcEEEEeccchhhhcceeccccc
Confidence            7888777765554    444  677788877766552  2334999999999999999999999987433          


Q ss_pred             -------------HhhcCCcc--EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          180 -------------SLLRGHTK--IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       180 -------------~llrGH~q--VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                                   +||.||..  |-|||+.+=..|..+++|.|+ |+-++-  .|.   ++..+ +=.-|+.|++|+|-.
T Consensus        86 itaL~F~~~~S~shLlS~sdDG~i~iw~~~~W~~~~slK~H~~~-Vt~lsi--HPS---~KLAL-sVg~D~~lr~WNLV~  158 (362)
T KOG0294|consen   86 ITALKFYPPLSKSHLLSGSDDGHIIIWRVGSWELLKSLKAHKGQ-VTDLSI--HPS---GKLAL-SVGGDQVLRTWNLVR  158 (362)
T ss_pred             eEEEEecCCcchhheeeecCCCcEEEEEcCCeEEeeeecccccc-cceeEe--cCC---CceEE-EEcCCceeeeehhhc
Confidence                         45555554  999999887889999999997 888887  444   45345 456899999999977


Q ss_pred             cCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          245 EEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       245 ~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      +++.         .|   +++.       +.+-  .|-.+|+|...++.-..+=-||-+..+.
T Consensus       159 Gr~a---------~v---~~L~-------~~at--~v~w~~~Gd~F~v~~~~~i~i~q~d~A~  200 (362)
T KOG0294|consen  159 GRVA---------FV---LNLK-------NKAT--LVSWSPQGDHFVVSGRNKIDIYQLDNAS  200 (362)
T ss_pred             Cccc---------ee---eccC-------Ccce--eeEEcCCCCEEEEEeccEEEEEecccHh
Confidence            6542         23   2331       1221  2677899998888877777777766554


No 50 
>KOG0318 consensus WD40 repeat stress protein/actin interacting protein [Cytoskeleton]
Probab=98.51  E-value=7.7e-07  Score=104.16  Aligned_cols=62  Identities=18%  Similarity=0.381  Sum_probs=47.7

Q ss_pred             EEEeecCCCceeEEec---CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          188 IKIWEDSKVAPLIILK---PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       188 VriWD~~~g~pl~~le---phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                      |.|||=.+|.-|-.|+   +|.| +||.++|+  ||+.-   ++| .|.|+++||||.+..            +|++|+.
T Consensus       214 i~iyDGktge~vg~l~~~~aHkG-sIfalsWs--PDs~~---~~T-~SaDkt~KIWdVs~~------------slv~t~~  274 (603)
T KOG0318|consen  214 IYIYDGKTGEKVGELEDSDAHKG-SIFALSWS--PDSTQ---FLT-VSADKTIKIWDVSTN------------SLVSTWP  274 (603)
T ss_pred             EEEEcCCCccEEEEecCCCCccc-cEEEEEEC--CCCce---EEE-ecCCceEEEEEeecc------------ceEEEee
Confidence            6788877777788888   6665 99999994  55543   664 889999999999766            7888877


Q ss_pred             ccCC
Q 001070          265 LKSS  268 (1165)
Q Consensus       265 ~~~s  268 (1165)
                      +...
T Consensus       275 ~~~~  278 (603)
T KOG0318|consen  275 MGST  278 (603)
T ss_pred             cCCc
Confidence            6443


No 51 
>KOG0292 consensus Vesicle coat complex COPI, alpha subunit [Intracellular trafficking, secretion, and vesicular transport]
Probab=98.50  E-value=5.7e-07  Score=109.67  Aligned_cols=132  Identities=19%  Similarity=0.278  Sum_probs=96.6

Q ss_pred             cEeee--cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCC
Q 001070          151 RQIAV--NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPH  205 (1165)
Q Consensus       151 R~IAV--n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~leph  205 (1165)
                      |.|+-  .+-+.++|..|+.|||||-++ +.--.|.||-.                      ||||..+++.++.++.+|
T Consensus        55 Rgv~FH~~qplFVSGGDDykIkVWnYk~rrclftL~GHlDYVRt~~FHheyPWIlSASDDQTIrIWNwqsr~~iavltGH  134 (1202)
T KOG0292|consen   55 RGVDFHPTQPLFVSGGDDYKIKVWNYKTRRCLFTLLGHLDYVRTVFFHHEYPWILSASDDQTIRIWNWQSRKCIAVLTGH  134 (1202)
T ss_pred             ceeeecCCCCeEEecCCccEEEEEecccceehhhhccccceeEEeeccCCCceEEEccCCCeEEEEeccCCceEEEEecC
Confidence            44444  356778999999999999999 55559999988                      999999999999999999


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcC-CCCCCCC-----------CCCc---ceEEEEeccCCCC
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE-GWSLPTH-----------AESW---KCTQTLDLKSSAK  270 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~-~~~~~~~-----------~~~w---~C~QTLe~~~s~~  270 (1165)
                       .|=|.+..|.  | .-|   ||+|||+|.||++||+.+=+ +-..|+.           +..+   -|+-.+-+     
T Consensus       135 -nHYVMcAqFh--p-tED---lIVSaSLDQTVRVWDisGLRkk~~~pg~~e~~~~~~~~~~dLfg~~DaVVK~VL-----  202 (1202)
T KOG0292|consen  135 -NHYVMCAQFH--P-TED---LIVSASLDQTVRVWDISGLRKKNKAPGSLEDQMRGQQGNSDLFGQTDAVVKHVL-----  202 (1202)
T ss_pred             -ceEEEeeccC--C-ccc---eEEEecccceEEEEeecchhccCCCCCCchhhhhccccchhhcCCcCeeeeeee-----
Confidence             4899999993  3 124   89999999999999996532 2222321           0111   33333222     


Q ss_pred             CccccccEEEEEeecCCcEEEEecc
Q 001070          271 PRVEEAFFNQVVVLSQAGLLLFANA  295 (1165)
Q Consensus       271 ~~~~~aff~sV~~~p~a~~ilLan~  295 (1165)
                       .||+.=+|=++++|.--+||=+.-
T Consensus       203 -EGHDRGVNwaAfhpTlpliVSG~D  226 (1202)
T KOG0292|consen  203 -EGHDRGVNWAAFHPTLPLIVSGAD  226 (1202)
T ss_pred             -cccccccceEEecCCcceEEecCC
Confidence             268888888999998776665433


No 52 
>KOG0264 consensus Nucleosome remodeling factor, subunit CAF1/NURF55/MSI1 [Chromatin structure and dynamics]
Probab=98.50  E-value=5.2e-07  Score=103.99  Aligned_cols=165  Identities=19%  Similarity=0.283  Sum_probs=118.7

Q ss_pred             cCCceEEecccCC-----CCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc--------hh
Q 001070          112 FGDYVAYDVDAVE-----EGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT--------AT  178 (1165)
Q Consensus       112 ~g~~~~~dVd~~~-----~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t--------~i  178 (1165)
                      .|+-.|||+....     .||+. |+|.+.==++-  .|++.--++   ..-+|++|..|+.|++|||+.        .-
T Consensus       146 ~~dv~Vfd~tk~~s~~~~~~~~~-Pdl~L~gH~~e--g~glsWn~~---~~g~Lls~~~d~~i~lwdi~~~~~~~~~~~p  219 (422)
T KOG0264|consen  146 SGDVYVFDYTKHPSKPKASGECR-PDLRLKGHEKE--GYGLSWNRQ---QEGTLLSGSDDHTICLWDINAESKEDKVVDP  219 (422)
T ss_pred             CCCEEEEEeccCCCcccccccCC-CceEEEeeccc--ccccccccc---cceeEeeccCCCcEEEEeccccccCCccccc
Confidence            5677888886532     34555 56655544441  222111111   245788899999999999996        23


Q ss_pred             hHhhcCCcc-----------------------EEEeecC--CCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCC
Q 001070          179 RSLLRGHTK-----------------------IKIWEDS--KVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPL  233 (1165)
Q Consensus       179 r~llrGH~q-----------------------VriWD~~--~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsl  233 (1165)
                      +..|+||+.                       +.|||.|  +..|-+.-+.|+| .|+||+|  .|.+..   +|++||.
T Consensus       220 ~~~~~~h~~~VeDV~~h~~h~~lF~sv~dd~~L~iwD~R~~~~~~~~~~~ah~~-~vn~~~f--np~~~~---ilAT~S~  293 (422)
T KOG0264|consen  220 KTIFSGHEDVVEDVAWHPLHEDLFGSVGDDGKLMIWDTRSNTSKPSHSVKAHSA-EVNCVAF--NPFNEF---ILATGSA  293 (422)
T ss_pred             eEEeecCCcceehhhccccchhhheeecCCCeEEEEEcCCCCCCCcccccccCC-ceeEEEe--CCCCCc---eEEeccC
Confidence            458999998                       8899999  4566777777855 9999999  676644   7888999


Q ss_pred             CceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          234 NREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       234 nrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      |+||+|||+-.           .-.|+-||++        |++=+++|--+|.-.=||.+...-+.+-+--+..
T Consensus       294 D~tV~LwDlRn-----------L~~~lh~~e~--------H~dev~~V~WSPh~etvLASSg~D~rl~vWDls~  348 (422)
T KOG0264|consen  294 DKTVALWDLRN-----------LNKPLHTFEG--------HEDEVFQVEWSPHNETVLASSGTDRRLNVWDLSR  348 (422)
T ss_pred             CCcEEEeechh-----------cccCceeccC--------CCcceEEEEeCCCCCceeEecccCCcEEEEeccc
Confidence            99999999832           2358889984        7777779999999888888877766666555554


No 53 
>TIGR03866 PQQ_ABC_repeats PQQ-dependent catabolism-associated beta-propeller protein. Members of this protein family consist of seven repeats each of the YVTN family beta-propeller repeat (see TIGR02276). Members occur invariably as part of a transport operon that is associated with PQQ-dependent catabolism of alcohols such as phenylethanol.
Probab=98.47  E-value=2.1e-06  Score=90.71  Aligned_cols=120  Identities=12%  Similarity=0.064  Sum_probs=88.3

Q ss_pred             ceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeE
Q 001070          158 HYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQ  214 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVa  214 (1165)
                      +.++++..||.|++||+.+ .....+.+|..                      |++||..++..+..+..+  ..+..++
T Consensus         2 ~~~~s~~~d~~v~~~d~~t~~~~~~~~~~~~~~~l~~~~dg~~l~~~~~~~~~v~~~d~~~~~~~~~~~~~--~~~~~~~   79 (300)
T TIGR03866         2 KAYVSNEKDNTISVIDTATLEVTRTFPVGQRPRGITLSKDGKLLYVCASDSDTIQVIDLATGEVIGTLPSG--PDPELFA   79 (300)
T ss_pred             cEEEEecCCCEEEEEECCCCceEEEEECCCCCCceEECCCCCEEEEEECCCCeEEEEECCCCcEEEeccCC--CCccEEE
Confidence            4566888999999999987 55566676654                      999999988877777543  3467788


Q ss_pred             eecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEec
Q 001070          215 YLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       215 Fl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan  294 (1165)
                      |  .|++   +++++++..+++|++||+...            +|+.+++..         .....++++|++.+++.+.
T Consensus        80 ~--~~~g---~~l~~~~~~~~~l~~~d~~~~------------~~~~~~~~~---------~~~~~~~~~~dg~~l~~~~  133 (300)
T TIGR03866        80 L--HPNG---KILYIANEDDNLVTVIDIETR------------KVLAEIPVG---------VEPEGMAVSPDGKIVVNTS  133 (300)
T ss_pred             E--CCCC---CEEEEEcCCCCeEEEEECCCC------------eEEeEeeCC---------CCcceEEECCCCCEEEEEe
Confidence            8  4554   446667778899999998543            677777631         2234688899999999988


Q ss_pred             cCCCcEEEEEe
Q 001070          295 AKKNAIYSVHL  305 (1165)
Q Consensus       295 ~~r~aIYalhl  305 (1165)
                      ...+.+|.+..
T Consensus       134 ~~~~~~~~~d~  144 (300)
T TIGR03866       134 ETTNMAHFIDT  144 (300)
T ss_pred             cCCCeEEEEeC
Confidence            77777766543


No 54 
>KOG0319 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=98.46  E-value=7.9e-07  Score=107.08  Aligned_cols=135  Identities=16%  Similarity=0.242  Sum_probs=98.4

Q ss_pred             cccccccCCCcccccccEeeec-CceEEEeecCCcEEEEeCcc----------hhhHhhcCCcc----------------
Q 001070          135 VNPITKYGSDPELLIGRQIAVN-KHYVCYGLKGGNVRVLNLNT----------ATRSLLRGHTK----------------  187 (1165)
Q Consensus       135 v~pIt~Y~sd~~~~~GR~IAVn-~~yIayG~kdg~IRVwdi~t----------~ir~llrGH~q----------------  187 (1165)
                      ..++..|+.--..+.+=-++.. -.|+++|+-|++|+||++-.          ..|..-+-|.+                
T Consensus       401 ~~~~a~~~gH~~svgava~~~~~asffvsvS~D~tlK~W~l~~s~~~~~~~~~~~~~t~~aHdKdIN~Vaia~ndkLiAT  480 (775)
T KOG0319|consen  401 SLCVAQANGHTNSVGAVAGSKLGASFFVSVSQDCTLKLWDLPKSKETAFPIVLTCRYTERAHDKDINCVAIAPNDKLIAT  480 (775)
T ss_pred             hhhhhhhcccccccceeeecccCccEEEEecCCceEEEecCCCcccccccceehhhHHHHhhcccccceEecCCCceEEe
Confidence            4455555544433333223333 47999999999999999865          55667788888                


Q ss_pred             ------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE
Q 001070          188 ------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ  261 (1165)
Q Consensus       188 ------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q  261 (1165)
                            .|||+...+..+.+|.+|. .-|.+|-|.  |+   -+ ++++.|.|+|||||.++.            +.|++
T Consensus       481 ~SqDktaKiW~le~~~l~~vLsGH~-RGvw~V~Fs--~~---dq-~laT~SgD~TvKIW~is~------------fSClk  541 (775)
T KOG0319|consen  481 GSQDKTAKIWDLEQLRLLGVLSGHT-RGVWCVSFS--KN---DQ-LLATCSGDKTVKIWSIST------------FSCLK  541 (775)
T ss_pred             cccccceeeecccCceEEEEeeCCc-cceEEEEec--cc---cc-eeEeccCCceEEEEEecc------------ceeee
Confidence                  9999999888999999984 579999994  43   24 566799999999999944            59999


Q ss_pred             EEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          262 TLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       262 TLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      ||+|+        ..=++.+.+-..+..|+=+.+.
T Consensus       542 T~eGH--------~~aVlra~F~~~~~qliS~~ad  568 (775)
T KOG0319|consen  542 TFEGH--------TSAVLRASFIRNGKQLISAGAD  568 (775)
T ss_pred             eecCc--------cceeEeeeeeeCCcEEEeccCC
Confidence            99974        4445566655666666555544


No 55 
>KOG0305 consensus Anaphase promoting complex, Cdc20, Cdh1, and Ama1 subunits [Cell cycle control, cell division, chromosome partitioning; Posttranslational modification, protein turnover, chaperones]
Probab=98.43  E-value=2.1e-06  Score=101.86  Aligned_cols=171  Identities=18%  Similarity=0.313  Sum_probs=117.3

Q ss_pred             Cceee-cC----CceEEecccCCCCCCCCCCcccccccccCCCcccccccE--eeecCceEEEeecCCcEEEEeCcc---
Q 001070          107 YGKRV-FG----DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQ--IAVNKHYVCYGLKGGNVRVLNLNT---  176 (1165)
Q Consensus       107 ~Gr~l-~g----~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~--IAVn~~yIayG~kdg~IRVwdi~t---  176 (1165)
                      +|++| .|    .-.+||+...+.   . +.+...           ..+|=  +|=|+.-+.+|.+||.|-++|+..   
T Consensus       228 ~G~~LavG~~~g~v~iwD~~~~k~---~-~~~~~~-----------h~~rvg~laW~~~~lssGsr~~~I~~~dvR~~~~  292 (484)
T KOG0305|consen  228 DGSHLAVGTSDGTVQIWDVKEQKK---T-RTLRGS-----------HASRVGSLAWNSSVLSSGSRDGKILNHDVRISQH  292 (484)
T ss_pred             CCCEEEEeecCCeEEEEehhhccc---c-ccccCC-----------cCceeEEEeccCceEEEecCCCcEEEEEEecchh
Confidence            79988 55    445688776554   1 222221           22342  555889999999999999999997   


Q ss_pred             hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCC
Q 001070          177 ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLN  234 (1165)
Q Consensus       177 ~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsln  234 (1165)
                      ..+ .++||+|                      |.|||...-.|+.++..|.+ .|..++|  .|..++ ...+-||+.|
T Consensus       293 ~~~-~~~~H~qeVCgLkws~d~~~lASGgnDN~~~Iwd~~~~~p~~~~~~H~a-AVKA~aw--cP~q~~-lLAsGGGs~D  367 (484)
T KOG0305|consen  293 VVS-TLQGHRQEVCGLKWSPDGNQLASGGNDNVVFIWDGLSPEPKFTFTEHTA-AVKALAW--CPWQSG-LLATGGGSAD  367 (484)
T ss_pred             hhh-hhhcccceeeeeEECCCCCeeccCCCccceEeccCCCccccEEEeccce-eeeEeee--CCCccC-ceEEcCCCcc
Confidence            333 7999999                      99999988889999999976 9999999  588877 3244567899


Q ss_pred             ceEEEeEccCcCCCCCCCCCCCcceEEEEe------------------------ccCCCCCccccccEEEEEeecCCcEE
Q 001070          235 REVKLWASASEEGWSLPTHAESWKCTQTLD------------------------LKSSAKPRVEEAFFNQVVVLSQAGLL  290 (1165)
Q Consensus       235 rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe------------------------~~~s~~~~~~~aff~sV~~~p~a~~i  290 (1165)
                      |+||+|+..++... .--+..+-.|--+.-                        +..-....+|..-+++.+.+||+..|
T Consensus       368 ~~i~fwn~~~g~~i-~~vdtgsQVcsL~Wsk~~kEi~sthG~s~n~i~lw~~ps~~~~~~l~gH~~RVl~la~SPdg~~i  446 (484)
T KOG0305|consen  368 RCIKFWNTNTGARI-DSVDTGSQVCSLIWSKKYKELLSTHGYSENQITLWKYPSMKLVAELLGHTSRVLYLALSPDGETI  446 (484)
T ss_pred             cEEEEEEcCCCcEe-cccccCCceeeEEEcCCCCEEEEecCCCCCcEEEEeccccceeeeecCCcceeEEEEECCCCCEE
Confidence            99999999655321 011222222211111                        11112334788888888899998888


Q ss_pred             EEeccCCC
Q 001070          291 LFANAKKN  298 (1165)
Q Consensus       291 lLan~~r~  298 (1165)
                      +.+.+.-+
T Consensus       447 ~t~a~DET  454 (484)
T KOG0305|consen  447 VTGAADET  454 (484)
T ss_pred             EEecccCc
Confidence            88877654


No 56 
>KOG0645 consensus WD40 repeat protein [General function prediction only]
Probab=98.41  E-value=3.7e-06  Score=92.64  Aligned_cols=168  Identities=18%  Similarity=0.267  Sum_probs=116.2

Q ss_pred             CCCCceee---cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeee--cCceEEEeecCCcEEEEeCcc--
Q 001070          104 APIYGKRV---FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAV--NKHYVCYGLKGGNVRVLNLNT--  176 (1165)
Q Consensus       104 ~p~~Gr~l---~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAV--n~~yIayG~kdg~IRVwdi~t--  176 (1165)
                      -|.+|+.|   .+++.+--.++.. |..    +.+.-+...   -.----|.||=  .|+|||.|+-|.+.-||--..  
T Consensus        23 hp~~g~ilAscg~Dk~vriw~~~~-~~s----~~ck~vld~---~hkrsVRsvAwsp~g~~La~aSFD~t~~Iw~k~~~e   94 (312)
T KOG0645|consen   23 HPGKGVILASCGTDKAVRIWSTSS-GDS----WTCKTVLDD---GHKRSVRSVAWSPHGRYLASASFDATVVIWKKEDGE   94 (312)
T ss_pred             ccCCceEEEeecCCceEEEEecCC-CCc----EEEEEeccc---cchheeeeeeecCCCcEEEEeeccceEEEeecCCCc
Confidence            35568877   3366655555433 222    333333222   22223577777  799999999999999997764  


Q ss_pred             -hhhHhhcCCcc----------------------EEEeecCCC---ceeEEecCCCCCCcceeEeecCCCCCCceEEEee
Q 001070          177 -ATRSLLRGHTK----------------------IKIWEDSKV---APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTA  230 (1165)
Q Consensus       177 -~ir~llrGH~q----------------------VriWD~~~g---~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvts  230 (1165)
                       ..-..|.||+.                      |-||++..+   .++.+|++| -+-|--|.|  .| ..+   |+.|
T Consensus        95 fecv~~lEGHEnEVK~Vaws~sG~~LATCSRDKSVWiWe~deddEfec~aVL~~H-tqDVK~V~W--HP-t~d---lL~S  167 (312)
T KOG0645|consen   95 FECVATLEGHENEVKCVAWSASGNYLATCSRDKSVWIWEIDEDDEFECIAVLQEH-TQDVKHVIW--HP-TED---LLFS  167 (312)
T ss_pred             eeEEeeeeccccceeEEEEcCCCCEEEEeeCCCeEEEEEecCCCcEEEEeeeccc-cccccEEEE--cC-Ccc---eeEE
Confidence             66779999999                      889998754   369999999 479999999  22 225   7889


Q ss_pred             cCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc-EEEEeccCCCcEEEE
Q 001070          231 GPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG-LLLFANAKKNAIYSV  303 (1165)
Q Consensus       231 GslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~-~ilLan~~r~aIYal  303 (1165)
                      +|.|.|||+|.-..+         ..|.|+|||.++        ..-+-++++++.|. ++--+|-.--.||..
T Consensus       168 ~SYDnTIk~~~~~~d---------ddW~c~~tl~g~--------~~TVW~~~F~~~G~rl~s~sdD~tv~Iw~~  224 (312)
T KOG0645|consen  168 CSYDNTIKVYRDEDD---------DDWECVQTLDGH--------ENTVWSLAFDNIGSRLVSCSDDGTVSIWRL  224 (312)
T ss_pred             eccCCeEEEEeecCC---------CCeeEEEEecCc--------cceEEEEEecCCCceEEEecCCcceEeeee
Confidence            999999999997543         578999999974        33344777888774 344444444445553


No 57 
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=98.41  E-value=9e-07  Score=102.85  Aligned_cols=113  Identities=19%  Similarity=0.348  Sum_probs=84.2

Q ss_pred             eeecCceEEEeecCCcEEEEeCcch-hhHhhcCCcc---------------------EEEeecCCCce-eEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTA-TRSLLRGHTK---------------------IKIWEDSKVAP-LIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~-ir~llrGH~q---------------------VriWD~~~g~p-l~~lephdG~s  209 (1165)
                      +.+|++.+++|.-||.||+||+.+. -+..=-.|.+                     |||||..+|+- +-.+.-| -+.
T Consensus       162 ~~~~~hivvtGsYDg~vrl~DtR~~~~~v~elnhg~pVe~vl~lpsgs~iasAgGn~vkVWDl~~G~qll~~~~~H-~Kt  240 (487)
T KOG0310|consen  162 SPANDHIVVTGSYDGKVRLWDTRSLTSRVVELNHGCPVESVLALPSGSLIASAGGNSVKVWDLTTGGQLLTSMFNH-NKT  240 (487)
T ss_pred             ccCCCeEEEecCCCceEEEEEeccCCceeEEecCCCceeeEEEcCCCCEEEEcCCCeEEEEEecCCceehhhhhcc-cce
Confidence            4457889999999999999999972 3333334544                     99999997754 4444446 369


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |.|+.|.  -++   .-|+ ||++|+.+|+++.            ..|+-+-++.+         ..-++++++.|+.+-
T Consensus       241 VTcL~l~--s~~---~rLl-S~sLD~~VKVfd~------------t~~Kvv~s~~~---------~~pvLsiavs~dd~t  293 (487)
T KOG0310|consen  241 VTCLRLA--SDS---TRLL-SGSLDRHVKVFDT------------TNYKVVHSWKY---------PGPVLSIAVSPDDQT  293 (487)
T ss_pred             EEEEEee--cCC---ceEe-ecccccceEEEEc------------cceEEEEeeec---------ccceeeEEecCCCce
Confidence            9999995  233   3366 6999999999995            35688888877         245779999998887


Q ss_pred             EEEe
Q 001070          290 LLFA  293 (1165)
Q Consensus       290 ilLa  293 (1165)
                      +++.
T Consensus       294 ~viG  297 (487)
T KOG0310|consen  294 VVIG  297 (487)
T ss_pred             EEEe
Confidence            7664


No 58 
>KOG0308 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=98.40  E-value=5.2e-07  Score=107.48  Aligned_cols=130  Identities=16%  Similarity=0.314  Sum_probs=90.8

Q ss_pred             eecCceEEEeecCCcEEEEeCcc--h-----hhHhhcCCcc----------------------EEEeecCCC--ceeEEe
Q 001070          154 AVNKHYVCYGLKGGNVRVLNLNT--A-----TRSLLRGHTK----------------------IKIWEDSKV--APLIIL  202 (1165)
Q Consensus       154 AVn~~yIayG~kdg~IRVwdi~t--~-----ir~llrGH~q----------------------VriWD~~~g--~pl~~l  202 (1165)
                      |-||+||.+|.+||.||+|++..  .     .-.-+.-|+.                      |++|+...+  .++.++
T Consensus        34 a~~~ryLfTgGRDg~i~~W~~~~d~~~~s~~~~asme~HsDWVNDiiL~~~~~tlIS~SsDtTVK~W~~~~~~~~c~sti  113 (735)
T KOG0308|consen   34 APNGRYLFTGGRDGIIRLWSVTQDSNEPSTPYIASMEHHSDWVNDIILCGNGKTLISASSDTTVKVWNAHKDNTFCMSTI  113 (735)
T ss_pred             CCCCceEEecCCCceEEEeccccccCCcccchhhhhhhhHhHHhhHHhhcCCCceEEecCCceEEEeecccCcchhHhhh
Confidence            34788999999999999999985  2     1234455554                      999999987  789999


Q ss_pred             cCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC-CCCCccccccEEEE
Q 001070          203 KPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS-SAKPRVEEAFFNQV  281 (1165)
Q Consensus       203 ephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~-s~~~~~~~aff~sV  281 (1165)
                      +-|+ +=|-++|+. ++   + .+||+||.+||.|+|||+.++-.          .-+-+++... ..-..|+++=+.+.
T Consensus       114 r~H~-DYVkcla~~-ak---~-~~lvaSgGLD~~IflWDin~~~~----------~l~~s~n~~t~~sl~sG~k~siYSL  177 (735)
T KOG0308|consen  114 RTHK-DYVKCLAYI-AK---N-NELVASGGLDRKIFLWDINTGTA----------TLVASFNNVTVNSLGSGPKDSIYSL  177 (735)
T ss_pred             hccc-chheeeeec-cc---C-ceeEEecCCCccEEEEEccCcch----------hhhhhccccccccCCCCCccceeee
Confidence            9885 689999994 22   2 45899999999999999976511          2233344322 12222667767788


Q ss_pred             EeecCCcEEEEeccCCCcE
Q 001070          282 VVLSQAGLLLFANAKKNAI  300 (1165)
Q Consensus       282 ~~~p~a~~ilLan~~r~aI  300 (1165)
                      +.++.+ .++++--..+-|
T Consensus       178 A~N~t~-t~ivsGgtek~l  195 (735)
T KOG0308|consen  178 AMNQTG-TIIVSGGTEKDL  195 (735)
T ss_pred             ecCCcc-eEEEecCcccce
Confidence            888877 555554444443


No 59 
>KOG0299 consensus U3 snoRNP-associated protein (contains WD40 repeats) [RNA processing and modification]
Probab=98.38  E-value=2e-06  Score=99.66  Aligned_cols=33  Identities=18%  Similarity=0.429  Sum_probs=31.2

Q ss_pred             ecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK  187 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q  187 (1165)
                      -||+||++|-.|.+|-|||..| ..+..|+||..
T Consensus       212 ~Dgkylatgg~d~~v~Iw~~~t~ehv~~~~ghr~  245 (479)
T KOG0299|consen  212 SDGKYLATGGRDRHVQIWDCDTLEHVKVFKGHRG  245 (479)
T ss_pred             CCCcEEEecCCCceEEEecCcccchhhccccccc
Confidence            3899999999999999999999 88889999999


No 60 
>KOG0640 consensus mRNA cleavage stimulating factor complex; subunit 1 [RNA processing and modification]
Probab=98.38  E-value=6.5e-07  Score=99.67  Aligned_cols=101  Identities=22%  Similarity=0.376  Sum_probs=83.8

Q ss_pred             ccEeee--cCceEEEeecCCcEEEEeCcchhhHhh----cCCcc----------------------EEEeecCCCceeEE
Q 001070          150 GRQIAV--NKHYVCYGLKGGNVRVLNLNTATRSLL----RGHTK----------------------IKIWEDSKVAPLII  201 (1165)
Q Consensus       150 GR~IAV--n~~yIayG~kdg~IRVwdi~t~ir~ll----rGH~q----------------------VriWD~~~g~pl~~  201 (1165)
                      -|.|+-  .|-||.-|..-...|++||+|.++-+-    .+|+.                      |||||=-++.|+.+
T Consensus       219 vrsiSfHPsGefllvgTdHp~~rlYdv~T~QcfvsanPd~qht~ai~~V~Ys~t~~lYvTaSkDG~IklwDGVS~rCv~t  298 (430)
T KOG0640|consen  219 VRSISFHPSGEFLLVGTDHPTLRLYDVNTYQCFVSANPDDQHTGAITQVRYSSTGSLYVTASKDGAIKLWDGVSNRCVRT  298 (430)
T ss_pred             eeeEeecCCCceEEEecCCCceeEEeccceeEeeecCcccccccceeEEEecCCccEEEEeccCCcEEeeccccHHHHHH
Confidence            455555  489999999999999999999666543    45655                      99999888888887


Q ss_pred             ec-CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCC
Q 001070          202 LK-PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSS  268 (1165)
Q Consensus       202 le-phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s  268 (1165)
                      ++ .|+|-.|.|.-|.     ++++|+++|| -|.++|||++.++            +|+++..+...
T Consensus       299 ~~~AH~gsevcSa~Ft-----kn~kyiLsSG-~DS~vkLWEi~t~------------R~l~~YtGAg~  348 (430)
T KOG0640|consen  299 IGNAHGGSEVCSAVFT-----KNGKYILSSG-KDSTVKLWEISTG------------RMLKEYTGAGT  348 (430)
T ss_pred             HHhhcCCceeeeEEEc-----cCCeEEeecC-CcceeeeeeecCC------------ceEEEEecCCc
Confidence            75 7888899999995     7889999877 8999999999665            99999998643


No 61 
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=98.38  E-value=1.9e-06  Score=100.22  Aligned_cols=125  Identities=22%  Similarity=0.361  Sum_probs=92.5

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      ||+.+|.|-+.|+|+|+|+++ .+-.+|++|+-                       +|+||..++.=.-.+.+|. +-|-
T Consensus        79 DG~LlaaGD~sG~V~vfD~k~r~iLR~~~ah~apv~~~~f~~~d~t~l~s~sDd~v~k~~d~s~a~v~~~l~~ht-DYVR  157 (487)
T KOG0310|consen   79 DGRLLAAGDESGHVKVFDMKSRVILRQLYAHQAPVHVTKFSPQDNTMLVSGSDDKVVKYWDLSTAYVQAELSGHT-DYVR  157 (487)
T ss_pred             CCeEEEccCCcCcEEEeccccHHHHHHHhhccCceeEEEecccCCeEEEecCCCceEEEEEcCCcEEEEEecCCc-ceeE
Confidence            577778999999999999888 66668899987                       9999999988322566663 5899


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      +.+|.  |-. +|  +|.+|+-|++|||||.-....           -+.+|+         |..-+-+|...|.+++|.
T Consensus       158 ~g~~~--~~~-~h--ivvtGsYDg~vrl~DtR~~~~-----------~v~eln---------hg~pVe~vl~lpsgs~ia  212 (487)
T KOG0310|consen  158 CGDIS--PAN-DH--IVVTGSYDGKVRLWDTRSLTS-----------RVVELN---------HGCPVESVLALPSGSLIA  212 (487)
T ss_pred             eeccc--cCC-Ce--EEEecCCCceEEEEEeccCCc-----------eeEEec---------CCCceeeEEEcCCCCEEE
Confidence            99995  322 22  567899999999999744311           122333         667777999999999887


Q ss_pred             EeccCCCcEEEEEeecC
Q 001070          292 FANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~g  308 (1165)
                      .|  ..|.|-+.-+-.|
T Consensus       213 sA--gGn~vkVWDl~~G  227 (487)
T KOG0310|consen  213 SA--GGNSVKVWDLTTG  227 (487)
T ss_pred             Ec--CCCeEEEEEecCC
Confidence            65  4566666666643


No 62 
>KOG0293 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.36  E-value=6.9e-07  Score=102.25  Aligned_cols=87  Identities=16%  Similarity=0.374  Sum_probs=77.8

Q ss_pred             cEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------EEEeecCCCceeEEecC
Q 001070          151 RQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       151 R~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------VriWD~~~g~pl~~lep  204 (1165)
                      -+|+=||||+..-+.+..|+.||++- .+-.-..||.|                         |+||+-.+|-|+.+|-+
T Consensus       401 ~~iS~d~k~~LvnL~~qei~LWDl~e~~lv~kY~Ghkq~~fiIrSCFgg~~~~fiaSGSED~kvyIWhr~sgkll~~LsG  480 (519)
T KOG0293|consen  401 FSISKDGKLALVNLQDQEIHLWDLEENKLVRKYFGHKQGHFIIRSCFGGGNDKFIASGSEDSKVYIWHRISGKLLAVLSG  480 (519)
T ss_pred             EEEcCCCcEEEEEcccCeeEEeecchhhHHHHhhcccccceEEEeccCCCCcceEEecCCCceEEEEEccCCceeEeecC
Confidence            45888999999999999999999997 66667889988                         99999999999999998


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                      |. ..|++|+|  .|-.|.   +++||+-|.|||||-.+
T Consensus       481 Hs-~~vNcVsw--NP~~p~---m~ASasDDgtIRIWg~~  513 (519)
T KOG0293|consen  481 HS-KTVNCVSW--NPADPE---MFASASDDGTIRIWGPS  513 (519)
T ss_pred             Cc-ceeeEEec--CCCCHH---HhhccCCCCeEEEecCC
Confidence            85 59999999  677776   89999999999999864


No 63 
>KOG0284 consensus Polyadenylation factor I complex, subunit PFS2 [RNA processing and modification]
Probab=98.34  E-value=8.5e-07  Score=101.45  Aligned_cols=127  Identities=17%  Similarity=0.258  Sum_probs=100.1

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      ++-|++-.|+.+.||.|||||-.. .--..|+||.=                      ||+||.++|.+|.++-.| -+.
T Consensus       188 fSpnDskF~t~SdDg~ikiWdf~~~kee~vL~GHgwdVksvdWHP~kgLiasgskDnlVKlWDprSg~cl~tlh~H-Knt  266 (464)
T KOG0284|consen  188 FSPNDSKFLTCSDDGTIKIWDFRMPKEERVLRGHGWDVKSVDWHPTKGLIASGSKDNLVKLWDPRSGSCLATLHGH-KNT  266 (464)
T ss_pred             cCCCCceeEEecCCCeEEEEeccCCchhheeccCCCCcceeccCCccceeEEccCCceeEeecCCCcchhhhhhhc-cce
Confidence            444677778999999999999997 66667899986                      999999999999999888 369


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |..|-|  .|++   -+|+ +||-|..+|++|+.+-            +=+++++        +|++++..+.-+|--.=
T Consensus       267 Vl~~~f--~~n~---N~Ll-t~skD~~~kv~DiR~m------------kEl~~~r--------~Hkkdv~~~~WhP~~~~  320 (464)
T KOG0284|consen  267 VLAVKF--NPNG---NWLL-TGSKDQSCKVFDIRTM------------KELFTYR--------GHKKDVTSLTWHPLNES  320 (464)
T ss_pred             EEEEEE--cCCC---CeeE-EccCCceEEEEehhHh------------HHHHHhh--------cchhhheeecccccccc
Confidence            999999  5777   3366 5999999999998422            3344454        68999999988888776


Q ss_pred             EEEeccCCCcEEEEEee
Q 001070          290 LLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       290 ilLan~~r~aIYalhl~  306 (1165)
                      ||.+-..-..||.-++.
T Consensus       321 lftsgg~Dgsvvh~~v~  337 (464)
T KOG0284|consen  321 LFTSGGSDGSVVHWVVG  337 (464)
T ss_pred             ceeeccCCCceEEEecc
Confidence            66666666666665555


No 64 
>KOG0315 consensus G-protein beta subunit-like protein (contains WD40 repeats) [General function prediction only]
Probab=98.32  E-value=2e-06  Score=93.89  Aligned_cols=144  Identities=17%  Similarity=0.216  Sum_probs=107.4

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhhcCCcc----------------------EEEeecCCCc--eeEEecCCCCCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK----------------------IKIWEDSKVA--PLIILKPHGGQPVN  211 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~llrGH~q----------------------VriWD~~~g~--pl~~lephdG~sV~  211 (1165)
                      +.-+|++...|-+||.|-..|.++.----|..                      ||++|++++.  |+..|++|. +-|.
T Consensus         9 ~~viLvsA~YDhTIRfWqa~tG~C~rTiqh~dsqVNrLeiTpdk~~LAaa~~qhvRlyD~~S~np~Pv~t~e~h~-kNVt   87 (311)
T KOG0315|consen    9 DPVILVSAGYDHTIRFWQALTGICSRTIQHPDSQVNRLEITPDKKDLAAAGNQHVRLYDLNSNNPNPVATFEGHT-KNVT   87 (311)
T ss_pred             CceEEEeccCcceeeeeehhcCeEEEEEecCccceeeEEEcCCcchhhhccCCeeEEEEccCCCCCceeEEeccC-CceE
Confidence            45688999999999999998866653333333                      9999999874  799999995 4899


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      +|.|     .-|++.+.| |+-|.++||||+-.            -.|-.-|.+         .+-+|.|+++|...-|+
T Consensus        88 aVgF-----~~dgrWMyT-gseDgt~kIWdlR~------------~~~qR~~~~---------~spVn~vvlhpnQteLi  140 (311)
T KOG0315|consen   88 AVGF-----QCDGRWMYT-GSEDGTVKIWDLRS------------LSCQRNYQH---------NSPVNTVVLHPNQTELI  140 (311)
T ss_pred             EEEE-----eecCeEEEe-cCCCceEEEEeccC------------cccchhccC---------CCCcceEEecCCcceEE
Confidence            9999     356676775 88999999999844            388888885         46788999999998888


Q ss_pred             EeccCCCcEEEEEeecCCCcccccccccccccc---ccceeeeeeccCC
Q 001070          292 FANAKKNAIYSVHLGYGNNSAATRIDYIAEFTV---TMPVLSFTGTIDP  337 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v---~~PILSft~~~d~  337 (1165)
                      ..|-.. +|.+--|...         .+.+-.+   -.||=|+++.+|+
T Consensus       141 s~dqsg-~irvWDl~~~---------~c~~~liPe~~~~i~sl~v~~dg  179 (311)
T KOG0315|consen  141 SGDQSG-NIRVWDLGEN---------SCTHELIPEDDTSIQSLTVMPDG  179 (311)
T ss_pred             eecCCC-cEEEEEccCC---------ccccccCCCCCcceeeEEEcCCC
Confidence            887654 4555555432         1122222   2678888888777


No 65 
>KOG0300 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.31  E-value=2.1e-06  Score=95.78  Aligned_cols=91  Identities=16%  Similarity=0.328  Sum_probs=76.0

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCce-eEEecCCCCCCcce
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAP-LIILKPHGGQPVNS  212 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~p-l~~lephdG~sV~S  212 (1165)
                      |+-++||+-|++--+||..+ -+-+.|.||.+                      .|+||.+...+ |.+|.+|. +.|.|
T Consensus       284 g~Q~vTaSWDRTAnlwDVEtge~v~~LtGHd~ELtHcstHptQrLVvTsSrDtTFRLWDFReaI~sV~VFQGHt-dtVTS  362 (481)
T KOG0300|consen  284 GQQMVTASWDRTANLWDVETGEVVNILTGHDSELTHCSTHPTQRLVVTSSRDTTFRLWDFREAIQSVAVFQGHT-DTVTS  362 (481)
T ss_pred             cceeeeeeccccceeeeeccCceeccccCcchhccccccCCcceEEEEeccCceeEeccchhhcceeeeecccc-cceeE
Confidence            88888999999999999999 88889999998                      99999998754 99999994 69999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      +.|-     .|-  -|+|||-|||||+|||-.-+           .-+-|++..
T Consensus       363 ~vF~-----~dd--~vVSgSDDrTvKvWdLrNMR-----------splATIRtd  398 (481)
T KOG0300|consen  363 VVFN-----TDD--RVVSGSDDRTVKVWDLRNMR-----------SPLATIRTD  398 (481)
T ss_pred             EEEe-----cCC--ceeecCCCceEEEeeecccc-----------CcceeeecC
Confidence            9993     332  36689999999999995543           345677753


No 66 
>KOG1539 consensus WD repeat protein [General function prediction only]
Probab=98.30  E-value=2.3e-06  Score=104.21  Aligned_cols=125  Identities=12%  Similarity=0.221  Sum_probs=104.2

Q ss_pred             cEeeecC--ceEEEeecCCcEEEEeCcc-hhhH-hhcCCcc--------------------EEEeecCCCceeEEecCCC
Q 001070          151 RQIAVNK--HYVCYGLKGGNVRVLNLNT-ATRS-LLRGHTK--------------------IKIWEDSKVAPLIILKPHG  206 (1165)
Q Consensus       151 R~IAVn~--~yIayG~kdg~IRVwdi~t-~ir~-llrGH~q--------------------VriWD~~~g~pl~~lephd  206 (1165)
                      +.+|+|+  +-++++.-+|.+..||.++ .... +--||+.                    |+|.|+.+..=++.|.+| 
T Consensus       497 ~gla~D~~n~~~vsa~~~Gilkfw~f~~k~l~~~l~l~~~~~~iv~hr~s~l~a~~~ddf~I~vvD~~t~kvvR~f~gh-  575 (910)
T KOG1539|consen  497 TGLAVDGTNRLLVSAGADGILKFWDFKKKVLKKSLRLGSSITGIVYHRVSDLLAIALDDFSIRVVDVVTRKVVREFWGH-  575 (910)
T ss_pred             eEEEecCCCceEEEccCcceEEEEecCCcceeeeeccCCCcceeeeeehhhhhhhhcCceeEEEEEchhhhhhHHhhcc-
Confidence            4588985  5599999999999999998 4333 4457776                    999999988779999999 


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      |+.++..+|.     +|++.|| +++.|.+|++||+.++            .|+.-|-+         ++-+.++.++|-
T Consensus       576 ~nritd~~FS-----~DgrWli-sasmD~tIr~wDlpt~------------~lID~~~v---------d~~~~sls~SPn  628 (910)
T KOG1539|consen  576 GNRITDMTFS-----PDGRWLI-SASMDSTIRTWDLPTG------------TLIDGLLV---------DSPCTSLSFSPN  628 (910)
T ss_pred             ccceeeeEeC-----CCCcEEE-EeecCCcEEEEeccCc------------ceeeeEec---------CCcceeeEECCC
Confidence            7899999994     4556455 6999999999999665            99999997         566778999999


Q ss_pred             CcEEEEeccCCCcEEEE
Q 001070          287 AGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       287 a~~ilLan~~r~aIYal  303 (1165)
                      +.||..++..-|.||--
T Consensus       629 gD~LAT~Hvd~~gIylW  645 (910)
T KOG1539|consen  629 GDFLATVHVDQNGIYLW  645 (910)
T ss_pred             CCEEEEEEecCceEEEE
Confidence            99999999999999964


No 67 
>KOG0265 consensus U5 snRNP-specific protein-like factor and related proteins [RNA processing and modification]
Probab=98.27  E-value=4.4e-06  Score=93.05  Aligned_cols=119  Identities=22%  Similarity=0.355  Sum_probs=95.4

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCC---Cc-eeEEecCCC---
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSK---VA-PLIILKPHG---  206 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~---g~-pl~~lephd---  206 (1165)
                      +.-+.+|.=|+.|+|||+.. ...++|+||..                      |||||++.   ++ +|.+|++|.   
T Consensus       186 s~qv~sggIdn~ikvWd~r~~d~~~~lsGh~DtIt~lsls~~gs~llsnsMd~tvrvwd~rp~~p~~R~v~if~g~~hnf  265 (338)
T KOG0265|consen  186 SDQVISGGIDNDIKVWDLRKNDGLYTLSGHADTITGLSLSRYGSFLLSNSMDNTVRVWDVRPFAPSQRCVKIFQGHIHNF  265 (338)
T ss_pred             ccceeeccccCceeeeccccCcceEEeecccCceeeEEeccCCCccccccccceEEEEEecccCCCCceEEEeecchhhh
Confidence            55566788899999999987 88999999999                      99999986   33 499999885   


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      ++-.-..+|  +|++..    |++|+.||-+-+||..+.            .|+.-|.        ||.--+|.|.++|.
T Consensus       266 eknlL~csw--sp~~~~----i~ags~dr~vyvwd~~~r------------~~lyklp--------Gh~gsvn~~~Fhp~  319 (338)
T KOG0265|consen  266 EKNLLKCSW--SPNGTK----ITAGSADRFVYVWDTTSR------------RILYKLP--------GHYGSVNEVDFHPT  319 (338)
T ss_pred             hhhcceeec--cCCCCc----cccccccceEEEeecccc------------cEEEEcC--------CcceeEEEeeecCC
Confidence            234555666  687766    889999999999997444            6777777        47788999999999


Q ss_pred             CcEEEEeccCCCcEEE
Q 001070          287 AGLLLFANAKKNAIYS  302 (1165)
Q Consensus       287 a~~ilLan~~r~aIYa  302 (1165)
                      -.+|+.+-..| .||-
T Consensus       320 e~iils~~sdk-~i~l  334 (338)
T KOG0265|consen  320 EPIILSCSSDK-TIYL  334 (338)
T ss_pred             CcEEEEeccCc-eeEe
Confidence            99988877665 4553


No 68 
>KOG0296 consensus Angio-associated migratory cell protein (contains WD40 repeats) [Function unknown]
Probab=98.26  E-value=5.6e-06  Score=93.98  Aligned_cols=196  Identities=20%  Similarity=0.311  Sum_probs=129.0

Q ss_pred             Cceee-cC----CceEEecccCCCCCCCCCCc--ccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hh
Q 001070          107 YGKRV-FG----DYVAYDVDAVEEGREPTQQL--EVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-AT  178 (1165)
Q Consensus       107 ~Gr~l-~g----~~~~~dVd~~~~ge~~~pql--ev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~i  178 (1165)
                      +|-+| +|    .-.||++.+...   + -.+  ++.=|.---|-|       +|   .+|+.|.+||.|..|.|.+ ..
T Consensus       117 dgtlLATGdmsG~v~v~~~stg~~---~-~~~~~e~~dieWl~WHp-------~a---~illAG~~DGsvWmw~ip~~~~  182 (399)
T KOG0296|consen  117 DGTLLATGDMSGKVLVFKVSTGGE---Q-WKLDQEVEDIEWLKWHP-------RA---HILLAGSTDGSVWMWQIPSQAL  182 (399)
T ss_pred             CceEEEecCCCccEEEEEcccCce---E-EEeecccCceEEEEecc-------cc---cEEEeecCCCcEEEEECCCcce
Confidence            68888 55    456788877443   3 122  344444334433       33   6788999999999999999 99


Q ss_pred             hHhhcCCcc----------------------EEEeecCCCceeEEecCCCC-----------------------------
Q 001070          179 RSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGG-----------------------------  207 (1165)
Q Consensus       179 r~llrGH~q----------------------VriWD~~~g~pl~~lephdG-----------------------------  207 (1165)
                      ..++.||.+                      ||+|+-.+|+|+++...-+|                             
T Consensus       183 ~kv~~Gh~~~ct~G~f~pdGKr~~tgy~dgti~~Wn~ktg~p~~~~~~~e~~~~~~~~~~~~~~~~~~g~~e~~~~~~~~  262 (399)
T KOG0296|consen  183 CKVMSGHNSPCTCGEFIPDGKRILTGYDDGTIIVWNPKTGQPLHKITQAEGLELPCISLNLAGSTLTKGNSEGVACGVNN  262 (399)
T ss_pred             eeEecCCCCCcccccccCCCceEEEEecCceEEEEecCCCceeEEecccccCcCCccccccccceeEeccCCccEEEEcc
Confidence            999999999                      99999999999888873322                             


Q ss_pred             ---------------------CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          208 ---------------------QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       208 ---------------------~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                                           +.+.||.|+  |-...-. |.+.|++|++|-|||++.-            +-.--++  
T Consensus       263 ~sgKVv~~~n~~~~~l~~~~e~~~esve~~--~~ss~lp-L~A~G~vdG~i~iyD~a~~------------~~R~~c~--  325 (399)
T KOG0296|consen  263 GSGKVVNCNNGTVPELKPSQEELDESVESI--PSSSKLP-LAACGSVDGTIAIYDLAAS------------TLRHICE--  325 (399)
T ss_pred             ccceEEEecCCCCccccccchhhhhhhhhc--ccccccc-hhhcccccceEEEEecccc------------hhheecc--
Confidence                                 122222231  2112222 5667999999999998654            2111112  


Q ss_pred             CCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeeccCC------CCc
Q 001070          267 SSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDP------PSE  340 (1165)
Q Consensus       267 ~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~------~ge  340 (1165)
                             |+.=+-++...+ ..+|+-|.+. -.||..-..-|    ...|+|-..   .++||=|....+.      .++
T Consensus       326 -------he~~V~~l~w~~-t~~l~t~c~~-g~v~~wDaRtG----~l~~~y~GH---~~~Il~f~ls~~~~~vvT~s~D  389 (399)
T KOG0296|consen  326 -------HEDGVTKLKWLN-TDYLLTACAN-GKVRQWDARTG----QLKFTYTGH---QMGILDFALSPQKRLVVTVSDD  389 (399)
T ss_pred             -------CCCceEEEEEcC-cchheeeccC-ceEEeeecccc----ceEEEEecC---chheeEEEEcCCCcEEEEecCC
Confidence                   333344666667 5666655554 45665544432    346777665   4799999888877      577


Q ss_pred             ceEEEEEee
Q 001070          341 HIIKLYCVQ  349 (1165)
Q Consensus       341 ~~vq~yCvQ  349 (1165)
                      ...+||||+
T Consensus       390 ~~a~VF~v~  398 (399)
T KOG0296|consen  390 NTALVFEVP  398 (399)
T ss_pred             CeEEEEecC
Confidence            889999997


No 69 
>KOG0313 consensus Microtubule binding protein YTM1 (contains WD40 repeats) [Cytoskeleton]
Probab=98.26  E-value=2.9e-06  Score=96.61  Aligned_cols=129  Identities=20%  Similarity=0.340  Sum_probs=101.5

Q ss_pred             eee--cCceEEEeecCCcEEEEeCcc-----------------------hhh---HhhcCCcc-----------------
Q 001070          153 IAV--NKHYVCYGLKGGNVRVLNLNT-----------------------ATR---SLLRGHTK-----------------  187 (1165)
Q Consensus       153 IAV--n~~yIayG~kdg~IRVwdi~t-----------------------~ir---~llrGH~q-----------------  187 (1165)
                      |+|  +|..+|+|+-|.+|.|||-.+                       ..|   .+|.||++                 
T Consensus       199 Vsv~~sgtr~~SgS~D~~lkiWs~~~~~~~~~E~~s~~rrk~~~~~~~~~~r~P~vtl~GHt~~Vs~V~w~d~~v~yS~S  278 (423)
T KOG0313|consen  199 VSVDSSGTRFCSGSWDTMLKIWSVETDEEDELESSSNRRRKKQKREKEGGTRTPLVTLEGHTEPVSSVVWSDATVIYSVS  278 (423)
T ss_pred             EEecCCCCeEEeecccceeeecccCCCccccccccchhhhhhhhhhhcccccCceEEecccccceeeEEEcCCCceEeec
Confidence            666  489999999999999999110                       122   27899998                 


Q ss_pred             ----EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEE
Q 001070          188 ----IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTL  263 (1165)
Q Consensus       188 ----VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTL  263 (1165)
                          ||+||+.+|....++..  +.+.++|.++     +.-. ||++|+.||.|+|||--.+.         +-.-.|+|
T Consensus       279 wDHTIk~WDletg~~~~~~~~--~ksl~~i~~~-----~~~~-Ll~~gssdr~irl~DPR~~~---------gs~v~~s~  341 (423)
T KOG0313|consen  279 WDHTIKVWDLETGGLKSTLTT--NKSLNCISYS-----PLSK-LLASGSSDRHIRLWDPRTGD---------GSVVSQSL  341 (423)
T ss_pred             ccceEEEEEeecccceeeeec--CcceeEeecc-----cccc-eeeecCCCCceeecCCCCCC---------CceeEEee
Confidence                99999999988777763  5799999995     3333 78899999999999975553         33667888


Q ss_pred             eccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          264 DLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       264 e~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      .        +|+.++..|.-+|...|.|++-..-|.+-.--+.
T Consensus       342 ~--------gH~nwVssvkwsp~~~~~~~S~S~D~t~klWDvR  376 (423)
T KOG0313|consen  342 I--------GHKNWVSSVKWSPTNEFQLVSGSYDNTVKLWDVR  376 (423)
T ss_pred             e--------cchhhhhheecCCCCceEEEEEecCCeEEEEEec
Confidence            8        4889999999999999999998777665544443


No 70 
>KOG0301 consensus Phospholipase A2-activating protein (contains WD40 repeats) [Lipid transport and metabolism]
Probab=98.24  E-value=1.8e-06  Score=103.68  Aligned_cols=107  Identities=22%  Similarity=0.348  Sum_probs=85.4

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc---------------------EEEeecCCCceeEEecCCCCCCccee
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK---------------------IKIWEDSKVAPLIILKPHGGQPVNSA  213 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q---------------------VriWD~~~g~pl~~lephdG~sV~SV  213 (1165)
                      ++-.||.|..|+.|-||...+ .=-.+|+||++                     +|||-.  |.++..|++|. -+|.+|
T Consensus        70 ~~~~l~~g~~D~~i~v~~~~~~~P~~~LkgH~snVC~ls~~~~~~~iSgSWD~TakvW~~--~~l~~~l~gH~-asVWAv  146 (745)
T KOG0301|consen   70 DKGRLVVGGMDTTIIVFKLSQAEPLYTLKGHKSNVCSLSIGEDGTLISGSWDSTAKVWRI--GELVYSLQGHT-ASVWAV  146 (745)
T ss_pred             cCcceEeecccceEEEEecCCCCchhhhhccccceeeeecCCcCceEecccccceEEecc--hhhhcccCCcc-hheeee
Confidence            334478899999999999999 44559999999                     788854  66778898884 499999


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEe
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFA  293 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLa  293 (1165)
                      ++|  |++   . +| +|+.||+||||.-              .+|++||.+        |.+.+-.+++.++++||=.+
T Consensus       147 ~~l--~e~---~-~v-TgsaDKtIklWk~--------------~~~l~tf~g--------HtD~VRgL~vl~~~~flScs  197 (745)
T KOG0301|consen  147 ASL--PEN---T-YV-TGSADKTIKLWKG--------------GTLLKTFSG--------HTDCVRGLAVLDDSHFLSCS  197 (745)
T ss_pred             eec--CCC---c-EE-eccCcceeeeccC--------------Cchhhhhcc--------chhheeeeEEecCCCeEeec
Confidence            998  444   3 45 5999999999983              489999994        88889899988887665544


Q ss_pred             c
Q 001070          294 N  294 (1165)
Q Consensus       294 n  294 (1165)
                      |
T Consensus       198 N  198 (745)
T KOG0301|consen  198 N  198 (745)
T ss_pred             C
Confidence            4


No 71 
>KOG0641 consensus WD40 repeat protein [General function prediction only]
Probab=98.24  E-value=7.9e-06  Score=88.17  Aligned_cols=128  Identities=20%  Similarity=0.327  Sum_probs=90.5

Q ss_pred             ecCceEEEeecCCcEEEEeCcchhhHhhcCCcc----------------------------------EEEeecCCCceeE
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK----------------------------------IKIWEDSKVAPLI  200 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q----------------------------------VriWD~~~g~pl~  200 (1165)
                      .+|..||+|+.|+.|+|+-.+..-+. +.||+-                                  |+|=|-..|++++
T Consensus        99 ~~geliatgsndk~ik~l~fn~dt~~-~~g~dle~nmhdgtirdl~fld~~~s~~~il~s~gagdc~iy~tdc~~g~~~~  177 (350)
T KOG0641|consen   99 PCGELIATGSNDKTIKVLPFNADTCN-ATGHDLEFNMHDGTIRDLAFLDDPESGGAILASAGAGDCKIYITDCGRGQGFH  177 (350)
T ss_pred             CccCeEEecCCCceEEEEeccccccc-ccCcceeeeecCCceeeeEEecCCCcCceEEEecCCCcceEEEeecCCCCcce
Confidence            36788889999999999766643222 345554                                  7777888899999


Q ss_pred             EecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEE
Q 001070          201 ILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQ  280 (1165)
Q Consensus       201 ~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~s  280 (1165)
                      -+.+|.||-.--..|      .+ + +++|||+|+||+.||+-.            ..|+.||.-.--.. .-+..-+-.
T Consensus       178 a~sghtghilalysw------n~-~-m~~sgsqdktirfwdlrv------------~~~v~~l~~~~~~~-glessavaa  236 (350)
T KOG0641|consen  178 ALSGHTGHILALYSW------NG-A-MFASGSQDKTIRFWDLRV------------NSCVNTLDNDFHDG-GLESSAVAA  236 (350)
T ss_pred             eecCCcccEEEEEEe------cC-c-EEEccCCCceEEEEeeec------------cceeeeccCcccCC-CcccceeEE
Confidence            999999984433445      22 2 678999999999999944            38999987311111 113345679


Q ss_pred             EEeecCCcEEEEeccCCC-cEEEEE
Q 001070          281 VVVLSQAGLLLFANAKKN-AIYSVH  304 (1165)
Q Consensus       281 V~~~p~a~~ilLan~~r~-aIYalh  304 (1165)
                      |+++|.+++|+-..+... .+|-+.
T Consensus       237 v~vdpsgrll~sg~~dssc~lydir  261 (350)
T KOG0641|consen  237 VAVDPSGRLLASGHADSSCMLYDIR  261 (350)
T ss_pred             EEECCCcceeeeccCCCceEEEEee
Confidence            999999999988777643 355543


No 72 
>TIGR03866 PQQ_ABC_repeats PQQ-dependent catabolism-associated beta-propeller protein. Members of this protein family consist of seven repeats each of the YVTN family beta-propeller repeat (see TIGR02276). Members occur invariably as part of a transport operon that is associated with PQQ-dependent catabolism of alcohols such as phenylethanol.
Probab=98.21  E-value=5.1e-05  Score=80.31  Aligned_cols=128  Identities=8%  Similarity=0.119  Sum_probs=87.0

Q ss_pred             eeecCceE-EEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCC
Q 001070          153 IAVNKHYV-CYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       153 IAVn~~yI-ayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      +.-||+++ +++..++.|++||..+ .+...+..|..                      |++||.+++..+..++.  |.
T Consensus        38 ~~~dg~~l~~~~~~~~~v~~~d~~~~~~~~~~~~~~~~~~~~~~~~g~~l~~~~~~~~~l~~~d~~~~~~~~~~~~--~~  115 (300)
T TIGR03866        38 LSKDGKLLYVCASDSDTIQVIDLATGEVIGTLPSGPDPELFALHPNGKILYIANEDDNLVTVIDIETRKVLAEIPV--GV  115 (300)
T ss_pred             ECCCCCEEEEEECCCCeEEEEECCCCcEEEeccCCCCccEEEECCCCCEEEEEcCCCCeEEEEECCCCeEEeEeeC--CC
Confidence            33367776 5677899999999987 44333433332                      99999998877777753  35


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      .+.+++|  .|++   .+++++...+..+..|+..+            ++|+.++...       +  -...++++|+++
T Consensus       116 ~~~~~~~--~~dg---~~l~~~~~~~~~~~~~d~~~------------~~~~~~~~~~-------~--~~~~~~~s~dg~  169 (300)
T TIGR03866       116 EPEGMAV--SPDG---KIVVNTSETTNMAHFIDTKT------------YEIVDNVLVD-------Q--RPRFAEFTADGK  169 (300)
T ss_pred             CcceEEE--CCCC---CEEEEEecCCCeEEEEeCCC------------CeEEEEEEcC-------C--CccEEEECCCCC
Confidence            6788999  4544   44666555556777888633            3666655421       1  123578899999


Q ss_pred             EEEEeccCCCcEEEEEeecC
Q 001070          289 LLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       289 ~ilLan~~r~aIYalhl~~g  308 (1165)
                      +|+++......||.+-+..+
T Consensus       170 ~l~~~~~~~~~v~i~d~~~~  189 (300)
T TIGR03866       170 ELWVSSEIGGTVSVIDVATR  189 (300)
T ss_pred             EEEEEcCCCCEEEEEEcCcc
Confidence            99888777788888877654


No 73 
>KOG0640 consensus mRNA cleavage stimulating factor complex; subunit 1 [RNA processing and modification]
Probab=98.20  E-value=9.5e-06  Score=90.69  Aligned_cols=166  Identities=16%  Similarity=0.326  Sum_probs=100.9

Q ss_pred             ecCCceEEecccCCCCCCCCCCcccccccccCCCccccccc-EeeecCceEEEeecCCcEEEEeCcc-----hhhHhhcC
Q 001070          111 VFGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGR-QIAVNKHYVCYGLKGGNVRVLNLNT-----ATRSLLRG  184 (1165)
Q Consensus       111 l~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR-~IAVn~~yIayG~kdg~IRVwdi~t-----~ir~llrG  184 (1165)
                      ..|-...||.|+.---... +..|    |+|-+..+.+..- -++-||.++|||+-|--|+|+|...     ..+....|
T Consensus        82 ~~giDle~dadaq~~s~e~-~~yE----t~ylt~HK~~cR~aafs~DG~lvATGsaD~SIKildvermlaks~~~em~~~  156 (430)
T KOG0640|consen   82 TAGIDLEFDADAQGSSPEP-SEYE----TKYLTSHKSPCRAAAFSPDGSLVATGSADASIKILDVERMLAKSKPKEMISG  156 (430)
T ss_pred             cCceeeeeccccccCCCCC-cccc----eEEEeecccceeeeeeCCCCcEEEccCCcceEEEeehhhhhhhcchhhhccC
Confidence            3566677777763221111 1111    3444444333211 1667899999999999999999872     33444444


Q ss_pred             Ccc-----------------------------------------------------------------------------
Q 001070          185 HTK-----------------------------------------------------------------------------  187 (1165)
Q Consensus       185 H~q-----------------------------------------------------------------------------  187 (1165)
                      -+|                                                                             
T Consensus       157 ~~qa~hPvIRTlYDH~devn~l~FHPre~ILiS~srD~tvKlFDfsK~saKrA~K~~qd~~~vrsiSfHPsGefllvgTd  236 (430)
T KOG0640|consen  157 DTQARHPVIRTLYDHVDEVNDLDFHPRETILISGSRDNTVKLFDFSKTSAKRAFKVFQDTEPVRSISFHPSGEFLLVGTD  236 (430)
T ss_pred             CcccCCceEeehhhccCcccceeecchhheEEeccCCCeEEEEecccHHHHHHHHHhhccceeeeEeecCCCceEEEecC
Confidence            444                                                                             


Q ss_pred             ---EEEeecCCCceeEEecCCCCC--CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEE
Q 001070          188 ---IKIWEDSKVAPLIILKPHGGQ--PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQT  262 (1165)
Q Consensus       188 ---VriWD~~~g~pl~~lephdG~--sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QT  262 (1165)
                         +|+||+.+-++...-.|-|+|  .|.+|-|.  +   .+...| .||-|..|||||-            .+.+|+.|
T Consensus       237 Hp~~rlYdv~T~QcfvsanPd~qht~ai~~V~Ys--~---t~~lYv-TaSkDG~IklwDG------------VS~rCv~t  298 (430)
T KOG0640|consen  237 HPTLRLYDVNTYQCFVSANPDDQHTGAITQVRYS--S---TGSLYV-TASKDGAIKLWDG------------VSNRCVRT  298 (430)
T ss_pred             CCceeEEeccceeEeeecCcccccccceeEEEec--C---CccEEE-EeccCCcEEeecc------------ccHHHHHH
Confidence               566666665555555566665  78888883  3   345355 5999999999994            46699999


Q ss_pred             EeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          263 LDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       263 Le~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      |.-.+     +...++ +..++-.+.|||-+ -+-..+|--+|.
T Consensus       299 ~~~AH-----~gsevc-Sa~Ftkn~kyiLsS-G~DS~vkLWEi~  335 (430)
T KOG0640|consen  299 IGNAH-----GGSEVC-SAVFTKNGKYILSS-GKDSTVKLWEIS  335 (430)
T ss_pred             HHhhc-----CCceee-eEEEccCCeEEeec-CCcceeeeeeec
Confidence            98422     112333 66677788777644 333444444444


No 74 
>KOG0647 consensus mRNA export protein (contains WD40 repeats) [RNA processing and modification]
Probab=98.20  E-value=7.4e-06  Score=91.33  Aligned_cols=123  Identities=19%  Similarity=0.332  Sum_probs=85.3

Q ss_pred             CceEEEeecCCcEEEEeCcch---hhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          157 KHYVCYGLKGGNVRVLNLNTA---TRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~---ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      +.+||.|+=||+||||+++..   +-.....|.+                      +|+||..+|+ +...--||| +|-
T Consensus        40 ~~~~~A~SWD~tVR~wevq~~g~~~~ka~~~~~~PvL~v~WsddgskVf~g~~Dk~~k~wDL~S~Q-~~~v~~Hd~-pvk  117 (347)
T KOG0647|consen   40 DNLLAAGSWDGTVRIWEVQNSGQLVPKAQQSHDGPVLDVCWSDDGSKVFSGGCDKQAKLWDLASGQ-VSQVAAHDA-PVK  117 (347)
T ss_pred             CceEEecccCCceEEEEEecCCcccchhhhccCCCeEEEEEccCCceEEeeccCCceEEEEccCCC-eeeeeeccc-cee
Confidence            446678999999999999973   2234455555                      9999999996 788888987 999


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      .+.|+..++-   . +|..||-|||||.||.-.            -+-+-|+.++       ++-+.    .|=--.+++
T Consensus       118 t~~wv~~~~~---~-cl~TGSWDKTlKfWD~R~------------~~pv~t~~LP-------eRvYa----~Dv~~pm~v  170 (347)
T KOG0647|consen  118 TCHWVPGMNY---Q-CLVTGSWDKTLKFWDTRS------------SNPVATLQLP-------ERVYA----ADVLYPMAV  170 (347)
T ss_pred             EEEEecCCCc---c-eeEecccccceeecccCC------------CCeeeeeecc-------ceeee----hhccCceeE
Confidence            9999855542   3 444699999999999733            3667777762       33332    222334677


Q ss_pred             EeccCCCcEEEEEeecCC
Q 001070          292 FANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~g~  309 (1165)
                      +|-+.|+ |-+.-|+.++
T Consensus       171 Vata~r~-i~vynL~n~~  187 (347)
T KOG0647|consen  171 VATAERH-IAVYNLENPP  187 (347)
T ss_pred             EEecCCc-EEEEEcCCCc
Confidence            7777765 3344444433


No 75 
>KOG0646 consensus WD40 repeat protein [General function prediction only]
Probab=98.19  E-value=9.3e-06  Score=94.34  Aligned_cols=150  Identities=21%  Similarity=0.271  Sum_probs=109.8

Q ss_pred             CCcccccccccCCCcc--cccccEeee----cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------
Q 001070          131 QQLEVNPITKYGSDPE--LLIGRQIAV----NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------  187 (1165)
Q Consensus       131 pqlev~pIt~Y~sd~~--~~~GR~IAV----n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------  187 (1165)
                      |.|.+-+|.|-.-+..  -..|--.|+    +|.||+-|...|.|-+|-.+| .+-..|++|-|                
T Consensus        61 p~l~vw~i~k~~~~~q~~v~Pg~v~al~s~n~G~~l~ag~i~g~lYlWelssG~LL~v~~aHYQ~ITcL~fs~dgs~iiT  140 (476)
T KOG0646|consen   61 PLLHVWEILKKDQVVQYIVLPGPVHALASSNLGYFLLAGTISGNLYLWELSSGILLNVLSAHYQSITCLKFSDDGSHIIT  140 (476)
T ss_pred             ccccccccCchhhhhhhcccccceeeeecCCCceEEEeecccCcEEEEEeccccHHHHHHhhccceeEEEEeCCCcEEEe
Confidence            4666666665333321  122555555    599999999999999999999 88889999999                


Q ss_pred             ------EEEeecCC---------CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCC
Q 001070          188 ------IKIWEDSK---------VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPT  252 (1165)
Q Consensus       188 ------VriWD~~~---------g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~  252 (1165)
                            |.||++..         -.|++.|-.| +-+|.++--  .+-|.+.+ |+ +.|+|+|+|+||+..+       
T Consensus       141 gskDg~V~vW~l~~lv~a~~~~~~~p~~~f~~H-tlsITDl~i--g~Gg~~~r-l~-TaS~D~t~k~wdlS~g-------  208 (476)
T KOG0646|consen  141 GSKDGAVLVWLLTDLVSADNDHSVKPLHIFSDH-TLSITDLQI--GSGGTNAR-LY-TASEDRTIKLWDLSLG-------  208 (476)
T ss_pred             cCCCccEEEEEEEeecccccCCCccceeeeccC-cceeEEEEe--cCCCccce-EE-EecCCceEEEEEeccc-------
Confidence                  99998643         2489999877 568888766  33345545 55 5889999999999776       


Q ss_pred             CCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          253 HAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       253 ~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                           .-+-|+.|+++         ...|++||...-+.+.+... .||..-+..
T Consensus       209 -----~LLlti~fp~s---------i~av~lDpae~~~yiGt~~G-~I~~~~~~~  248 (476)
T KOG0646|consen  209 -----VLLLTITFPSS---------IKAVALDPAERVVYIGTEEG-KIFQNLLFK  248 (476)
T ss_pred             -----eeeEEEecCCc---------ceeEEEcccccEEEecCCcc-eEEeeehhc
Confidence                 78889998543         34789999888887776653 456555544


No 76 
>KOG0285 consensus Pleiotropic regulator 1 [RNA processing and modification]
Probab=98.16  E-value=2.6e-06  Score=96.38  Aligned_cols=135  Identities=21%  Similarity=0.331  Sum_probs=97.1

Q ss_pred             cccccccEeee-----c--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecC
Q 001070          145 PELLIGRQIAV-----N--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDS  194 (1165)
Q Consensus       145 ~~~~~GR~IAV-----n--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~  194 (1165)
                      ...|.|.+=+|     .  -..|++|.+|-.||||||.| ..-+.|.||..                      ||+||.+
T Consensus       228 IR~YhGHlS~V~~L~lhPTldvl~t~grDst~RvWDiRtr~~V~~l~GH~~~V~~V~~~~~dpqvit~S~D~tvrlWDl~  307 (460)
T KOG0285|consen  228 IRHYHGHLSGVYCLDLHPTLDVLVTGGRDSTIRVWDIRTRASVHVLSGHTNPVASVMCQPTDPQVITGSHDSTVRLWDLR  307 (460)
T ss_pred             HHHhccccceeEEEeccccceeEEecCCcceEEEeeecccceEEEecCCCCcceeEEeecCCCceEEecCCceEEEeeec
Confidence            34456766444     2  46799999999999999999 67779999998                      9999999


Q ss_pred             CCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          195 KVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       195 ~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      .|.-+-++.-| -.+|.+++.  .|.    -++++|++-| .||-|++.-+            ..++-|.        +|
T Consensus       308 agkt~~tlt~h-kksvral~l--hP~----e~~fASas~d-nik~w~~p~g------------~f~~nls--------gh  359 (460)
T KOG0285|consen  308 AGKTMITLTHH-KKSVRALCL--HPK----ENLFASASPD-NIKQWKLPEG------------EFLQNLS--------GH  359 (460)
T ss_pred             cCceeEeeecc-cceeeEEec--CCc----hhhhhccCCc-cceeccCCcc------------chhhccc--------cc
Confidence            99878888766 358888887  333    2467777776 5888998444            3333355        58


Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEEEEeecCC
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      .+.+|.+.+..|+-  +++-..+-.|..-...-|.
T Consensus       360 ~~iintl~~nsD~v--~~~G~dng~~~fwdwksg~  392 (460)
T KOG0285|consen  360 NAIINTLSVNSDGV--LVSGGDNGSIMFWDWKSGH  392 (460)
T ss_pred             cceeeeeeeccCce--EEEcCCceEEEEEecCcCc
Confidence            89999998888874  4455555555554444433


No 77 
>KOG0308 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=98.15  E-value=1.1e-05  Score=96.56  Aligned_cols=93  Identities=19%  Similarity=0.368  Sum_probs=72.4

Q ss_pred             eecCceEEEeecCCcEEEEeCcch------------hhHhhcCCcc----------------------EEEeecCCCcee
Q 001070          154 AVNKHYVCYGLKGGNVRVLNLNTA------------TRSLLRGHTK----------------------IKIWEDSKVAPL  199 (1165)
Q Consensus       154 AVn~~yIayG~kdg~IRVwdi~t~------------ir~llrGH~q----------------------VriWD~~~g~pl  199 (1165)
                      |-|.-..|+|.=|+.|.||||++.            ..+|-.||..                      +||||-+++.-+
T Consensus       127 ak~~~lvaSgGLD~~IflWDin~~~~~l~~s~n~~t~~sl~sG~k~siYSLA~N~t~t~ivsGgtek~lr~wDprt~~ki  206 (735)
T KOG0308|consen  127 AKNNELVASGGLDRKIFLWDINTGTATLVASFNNVTVNSLGSGPKDSIYSLAMNQTGTIIVSGGTEKDLRLWDPRTCKKI  206 (735)
T ss_pred             ccCceeEEecCCCccEEEEEccCcchhhhhhccccccccCCCCCccceeeeecCCcceEEEecCcccceEEeccccccce
Confidence            336666788999999999999952            3345557766                      999999999889


Q ss_pred             EEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          200 IILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       200 ~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      .++++|. +-|-.+.-.  .||   .-+| |||.|.||||||+...            +|+.|+..
T Consensus       207 mkLrGHT-dNVr~ll~~--dDG---t~~l-s~sSDgtIrlWdLgqQ------------rCl~T~~v  253 (735)
T KOG0308|consen  207 MKLRGHT-DNVRVLLVN--DDG---TRLL-SASSDGTIRLWDLGQQ------------RCLATYIV  253 (735)
T ss_pred             eeeeccc-cceEEEEEc--CCC---CeEe-ecCCCceEEeeecccc------------ceeeeEEe
Confidence            9999884 467777773  444   4366 7999999999999554            99999885


No 78 
>KOG0267 consensus Microtubule severing protein katanin p80 subunit B (contains WD40 repeats) [Cell cycle control, cell division, chromosome partitioning]
Probab=98.14  E-value=2.1e-06  Score=103.42  Aligned_cols=83  Identities=22%  Similarity=0.376  Sum_probs=66.1

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      +...|+.|.-+|.|||||+.. .+-..|.||.-                      .+|||.++-.|.+++.+|. .-|.+
T Consensus        81 ~E~LlaagsasgtiK~wDleeAk~vrtLtgh~~~~~sv~f~P~~~~~a~gStdtd~~iwD~Rk~Gc~~~~~s~~-~vv~~  159 (825)
T KOG0267|consen   81 SERLLAAGSASGTIKVWDLEEAKIVRTLTGHLLNITSVDFHPYGEFFASGSTDTDLKIWDIRKKGCSHTYKSHT-RVVDV  159 (825)
T ss_pred             chhhhcccccCCceeeeehhhhhhhhhhhccccCcceeeeccceEEeccccccccceehhhhccCceeeecCCc-ceeEE
Confidence            467788999999999999998 55558889987                      8999999655599999874 37999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      +.|.     ||+++++.+| -|.++||||+..+
T Consensus       160 l~ls-----P~Gr~v~~g~-ed~tvki~d~~ag  186 (825)
T KOG0267|consen  160 LRLS-----PDGRWVASGG-EDNTVKIWDLTAG  186 (825)
T ss_pred             Eeec-----CCCceeeccC-Ccceeeeeccccc
Confidence            9994     5556456544 5999999998444


No 79 
>KOG1034 consensus Transcriptional repressor EED/ESC/FIE, required for transcriptional silencing, WD repeat superfamily [Transcription]
Probab=98.12  E-value=4.7e-06  Score=93.65  Aligned_cols=82  Identities=17%  Similarity=0.325  Sum_probs=68.8

Q ss_pred             ceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCC--Ccc
Q 001070          158 HYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQ--PVN  211 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~--sV~  211 (1165)
                      -|+|-|..-|.|||+|..+ ..-.-++||.+                       ||+|++++..+|.+|-+..||  -|-
T Consensus       106 p~la~~G~~GvIrVid~~~~~~~~~~~ghG~sINeik~~p~~~qlvls~SkD~svRlwnI~~~~Cv~VfGG~egHrdeVL  185 (385)
T KOG1034|consen  106 PFLAAGGYLGVIRVIDVVSGQCSKNYRGHGGSINEIKFHPDRPQLVLSASKDHSVRLWNIQTDVCVAVFGGVEGHRDEVL  185 (385)
T ss_pred             eeEEeecceeEEEEEecchhhhccceeccCccchhhhcCCCCCcEEEEecCCceEEEEeccCCeEEEEecccccccCcEE
Confidence            3566666899999999999 55558999998                       999999999999999998888  999


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      ||-|.     +++.+++ |+.-|..||+|++...
T Consensus       186 SvD~~-----~~gd~i~-ScGmDhslk~W~l~~~  213 (385)
T KOG1034|consen  186 SVDFS-----LDGDRIA-SCGMDHSLKLWRLNVK  213 (385)
T ss_pred             EEEEc-----CCCCeee-ccCCcceEEEEecChh
Confidence            99993     4445445 6779999999999744


No 80 
>KOG1273 consensus WD40 repeat protein [General function prediction only]
Probab=98.11  E-value=1.4e-05  Score=89.57  Aligned_cols=111  Identities=14%  Similarity=0.180  Sum_probs=87.7

Q ss_pred             cccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEE
Q 001070          149 IGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIIL  227 (1165)
Q Consensus       149 ~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~l  227 (1165)
                      .-=++.-+|.|||.|.-||.|-|||..| ++-.+|.+|.                     ++|.|++|.     +|+++|
T Consensus        27 ~~~~Fs~~G~~lAvGc~nG~vvI~D~~T~~iar~lsaH~---------------------~pi~sl~WS-----~dgr~L   80 (405)
T KOG1273|consen   27 ECCQFSRWGDYLAVGCANGRVVIYDFDTFRIARMLSAHV---------------------RPITSLCWS-----RDGRKL   80 (405)
T ss_pred             ceEEeccCcceeeeeccCCcEEEEEccccchhhhhhccc---------------------cceeEEEec-----CCCCEe
Confidence            3445777899999999999999999999 8777887763                     489999995     666779


Q ss_pred             EeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          228 VTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       228 vtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      +| .|-|-.|+|||+-.+            .|++.++|         +.-+..+.++|+..=.+++..-+-+=|.+.++.
T Consensus        81 lt-sS~D~si~lwDl~~g------------s~l~rirf---------~spv~~~q~hp~k~n~~va~~~~~sp~vi~~s~  138 (405)
T KOG1273|consen   81 LT-SSRDWSIKLWDLLKG------------SPLKRIRF---------DSPVWGAQWHPRKRNKCVATIMEESPVVIDFSD  138 (405)
T ss_pred             ee-ecCCceeEEEeccCC------------CceeEEEc---------cCccceeeeccccCCeEEEEEecCCcEEEEecC
Confidence            96 889999999998544            79999999         345556777787776666666666666666663


No 81 
>KOG0302 consensus Ribosome Assembly protein [General function prediction only]
Probab=98.09  E-value=5.8e-06  Score=94.19  Aligned_cols=83  Identities=17%  Similarity=0.445  Sum_probs=66.4

Q ss_pred             CceEEEeecCCcEEEEeCcch---hhHhhcCCcc----------------------EEEeecCC---CceeEEecCCCCC
Q 001070          157 KHYVCYGLKGGNVRVLNLNTA---TRSLLRGHTK----------------------IKIWEDSK---VAPLIILKPHGGQ  208 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~---ir~llrGH~q----------------------VriWD~~~---g~pl~~lephdG~  208 (1165)
                      ...+|+++-||.||||||.+.   -+-+.+.|..                      ++|||.|.   |.||..|+=|. .
T Consensus       270 ~~vfaScS~DgsIrIWDiRs~~~~~~~~~kAh~sDVNVISWnr~~~lLasG~DdGt~~iwDLR~~~~~~pVA~fk~Hk-~  348 (440)
T KOG0302|consen  270 DGVFASCSCDGSIRIWDIRSGPKKAAVSTKAHNSDVNVISWNRREPLLASGGDDGTLSIWDLRQFKSGQPVATFKYHK-A  348 (440)
T ss_pred             CceEEeeecCceEEEEEecCCCccceeEeeccCCceeeEEccCCcceeeecCCCceEEEEEhhhccCCCcceeEEecc-C
Confidence            567889999999999999984   2335566665                      99999985   68999999985 4


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      +|+||.|  +|+--.   .|.+++.|..|-|||++.+
T Consensus       349 pItsieW--~p~e~s---~iaasg~D~QitiWDlsvE  380 (440)
T KOG0302|consen  349 PITSIEW--HPHEDS---VIAASGEDNQITIWDLSVE  380 (440)
T ss_pred             CeeEEEe--ccccCc---eEEeccCCCcEEEEEeecc
Confidence            9999999  566533   3445668999999999876


No 82 
>KOG0296 consensus Angio-associated migratory cell protein (contains WD40 repeats) [Function unknown]
Probab=98.08  E-value=1.9e-05  Score=89.88  Aligned_cols=127  Identities=17%  Similarity=0.181  Sum_probs=95.4

Q ss_pred             ccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------------
Q 001070          140 KYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------------  187 (1165)
Q Consensus       140 ~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------------  187 (1165)
                      .||---.--.|+ +--|||.||+|-.||.|||||.+| ..-+.+.+-++                               
T Consensus       186 ~~Gh~~~ct~G~-f~pdGKr~~tgy~dgti~~Wn~ktg~p~~~~~~~e~~~~~~~~~~~~~~~~~~g~~e~~~~~~~~~s  264 (399)
T KOG0296|consen  186 MSGHNSPCTCGE-FIPDGKRILTGYDDGTIIVWNPKTGQPLHKITQAEGLELPCISLNLAGSTLTKGNSEGVACGVNNGS  264 (399)
T ss_pred             ecCCCCCccccc-ccCCCceEEEEecCceEEEEecCCCceeEEecccccCcCCccccccccceeEeccCCccEEEEcccc
Confidence            344333334466 445799999999999999999998 54445554444                               


Q ss_pred             ---------------------------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCC
Q 001070          188 ---------------------------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQA  222 (1165)
Q Consensus       188 ---------------------------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~  222 (1165)
                                                                   |-|||.++..+.++++ |. .+|.++.|+.   . 
T Consensus       265 gKVv~~~n~~~~~l~~~~e~~~esve~~~~ss~lpL~A~G~vdG~i~iyD~a~~~~R~~c~-he-~~V~~l~w~~---t-  338 (399)
T KOG0296|consen  265 GKVVNCNNGTVPELKPSQEELDESVESIPSSSKLPLAACGSVDGTIAIYDLAASTLRHICE-HE-DGVTKLKWLN---T-  338 (399)
T ss_pred             ceEEEecCCCCccccccchhhhhhhhhcccccccchhhcccccceEEEEecccchhheecc-CC-CceEEEEEcC---c-
Confidence                                                         8899999888666554 42 3699999972   2 


Q ss_pred             CceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          223 GHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       223 d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                        .+|+| +..|..|++||.-            ++.|+-|+.+        |..-++-.+++|++++||-+.-.
T Consensus       339 --~~l~t-~c~~g~v~~wDaR------------tG~l~~~y~G--------H~~~Il~f~ls~~~~~vvT~s~D  389 (399)
T KOG0296|consen  339 --DYLLT-ACANGKVRQWDAR------------TGQLKFTYTG--------HQMGILDFALSPQKRLVVTVSDD  389 (399)
T ss_pred             --chhee-eccCceEEeeecc------------ccceEEEEec--------CchheeEEEEcCCCcEEEEecCC
Confidence              23675 8899999999974            4599999995        88888999999999998865443


No 83 
>KOG0269 consensus WD40 repeat-containing protein [Function unknown]
Probab=98.07  E-value=5e-06  Score=100.84  Aligned_cols=95  Identities=22%  Similarity=0.443  Sum_probs=74.8

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------EEEeecCC-CceeEEecCCCCCCc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------IKIWEDSK-VAPLIILKPHGGQPV  210 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------VriWD~~~-g~pl~~lephdG~sV  210 (1165)
                      -..||.+|+.||.|++||+.. .-..+++|-+-                       ++.||+|. ..+...|..|.| +|
T Consensus       145 ep~iliSGSQDg~vK~~DlR~~~S~~t~~~nSESiRDV~fsp~~~~~F~s~~dsG~lqlWDlRqp~r~~~k~~AH~G-pV  223 (839)
T KOG0269|consen  145 EPNILISGSQDGTVKCWDLRSKKSKSTFRSNSESIRDVKFSPGYGNKFASIHDSGYLQLWDLRQPDRCEKKLTAHNG-PV  223 (839)
T ss_pred             CccEEEecCCCceEEEEeeecccccccccccchhhhceeeccCCCceEEEecCCceEEEeeccCchhHHHHhhcccC-ce
Confidence            478999999999999999998 66668888655                       89999985 467888999998 99


Q ss_pred             ceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          211 NSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                      +++-|  .|++   -+|.| |.-|+.||||+..+.+-       ..-.|++|.-
T Consensus       224 ~c~nw--hPnr---~~lAT-GGRDK~vkiWd~t~~~~-------~~~~tInTia  264 (839)
T KOG0269|consen  224 LCLNW--HPNR---EWLAT-GGRDKMVKIWDMTDSRA-------KPKHTINTIA  264 (839)
T ss_pred             EEEee--cCCC---ceeee-cCCCccEEEEeccCCCc-------cceeEEeecc
Confidence            99999  6754   33565 55999999999876532       2346666653


No 84 
>KOG0292 consensus Vesicle coat complex COPI, alpha subunit [Intracellular trafficking, secretion, and vesicular transport]
Probab=98.06  E-value=1.7e-05  Score=97.25  Aligned_cols=130  Identities=16%  Similarity=0.277  Sum_probs=101.7

Q ss_pred             ccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecC
Q 001070          138 ITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDS  194 (1165)
Q Consensus       138 It~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~  194 (1165)
                      +||++++-.-+-|=.+-.-+-+|.+++.+|.|+.||-.. .+-+-|.+|.+                      ||||.-.
T Consensus         2 ltkfEskSsRvKglsFHP~rPwILtslHsG~IQlWDYRM~tli~rFdeHdGpVRgv~FH~~qplFVSGGDDykIkVWnYk   81 (1202)
T KOG0292|consen    2 LTKFESKSSRVKGLSFHPKRPWILTSLHSGVIQLWDYRMGTLIDRFDEHDGPVRGVDFHPTQPLFVSGGDDYKIKVWNYK   81 (1202)
T ss_pred             cchhhcccccccceecCCCCCEEEEeecCceeeeehhhhhhHHhhhhccCCccceeeecCCCCeEEecCCccEEEEEecc
Confidence            477888776666655555678999999999999999988 77788999998                      9999998


Q ss_pred             CCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          195 KVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       195 ~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      ...++-+|.+|. +=|..+.|  .+  ...|  |.|+|-|.||+||+-.++            +|+-+|+|        |
T Consensus        82 ~rrclftL~GHl-DYVRt~~F--Hh--eyPW--IlSASDDQTIrIWNwqsr------------~~iavltG--------H  134 (1202)
T KOG0292|consen   82 TRRCLFTLLGHL-DYVRTVFF--HH--EYPW--ILSASDDQTIRIWNWQSR------------KCIAVLTG--------H  134 (1202)
T ss_pred             cceehhhhcccc-ceeEEeec--cC--CCce--EEEccCCCeEEEEeccCC------------ceEEEEec--------C
Confidence            888899999885 58999999  22  2333  448999999999996554            99999996        5


Q ss_pred             cccEEEEEeecCCcEEEEec
Q 001070          275 EAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan  294 (1165)
                      .-|+--..++|.-.+||=|.
T Consensus       135 nHYVMcAqFhptEDlIVSaS  154 (1202)
T KOG0292|consen  135 NHYVMCAQFHPTEDLIVSAS  154 (1202)
T ss_pred             ceEEEeeccCCccceEEEec
Confidence            55554445677666666554


No 85 
>PRK11028 6-phosphogluconolactonase; Provisional
Probab=98.04  E-value=0.00017  Score=80.31  Aligned_cols=141  Identities=14%  Similarity=0.219  Sum_probs=94.5

Q ss_pred             Eeee--cCceEEEeec-CCcEEEEeCcc--hh---hHhhcCCcc----------------------EEEeecCC-Ccee-
Q 001070          152 QIAV--NKHYVCYGLK-GGNVRVLNLNT--AT---RSLLRGHTK----------------------IKIWEDSK-VAPL-  199 (1165)
Q Consensus       152 ~IAV--n~~yIayG~k-dg~IRVwdi~t--~i---r~llrGH~q----------------------VriWD~~~-g~pl-  199 (1165)
                      .|++  ||+||+.+.. ++.|+|||+++  .+   ...+.|+..                      |+|||..+ |... 
T Consensus        84 ~i~~~~~g~~l~v~~~~~~~v~v~~~~~~g~~~~~~~~~~~~~~~~~~~~~p~g~~l~v~~~~~~~v~v~d~~~~g~l~~  163 (330)
T PRK11028         84 HISTDHQGRFLFSASYNANCVSVSPLDKDGIPVAPIQIIEGLEGCHSANIDPDNRTLWVPCLKEDRIRLFTLSDDGHLVA  163 (330)
T ss_pred             EEEECCCCCEEEEEEcCCCeEEEEEECCCCCCCCceeeccCCCcccEeEeCCCCCEEEEeeCCCCEEEEEEECCCCcccc
Confidence            4655  4888776554 89999999974  11   123344322                      99999876 4321 


Q ss_pred             ---EEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccc
Q 001070          200 ---IILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEA  276 (1165)
Q Consensus       200 ---~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~a  276 (1165)
                         .......|..++.++|.  |   ++++|.++...+.+|.+|++....        ..+++++++...+....  +..
T Consensus       164 ~~~~~~~~~~g~~p~~~~~~--p---dg~~lyv~~~~~~~v~v~~~~~~~--------~~~~~~~~~~~~p~~~~--~~~  228 (330)
T PRK11028        164 QEPAEVTTVEGAGPRHMVFH--P---NQQYAYCVNELNSSVDVWQLKDPH--------GEIECVQTLDMMPADFS--DTR  228 (330)
T ss_pred             cCCCceecCCCCCCceEEEC--C---CCCEEEEEecCCCEEEEEEEeCCC--------CCEEEEEEEecCCCcCC--CCc
Confidence               11222336678899993  4   446677777789999999986431        24577888864332211  123


Q ss_pred             cEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          277 FFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       277 ff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      +-..+.++|+++|++++|...+.|.+++++.
T Consensus       229 ~~~~i~~~pdg~~lyv~~~~~~~I~v~~i~~  259 (330)
T PRK11028        229 WAADIHITPDGRHLYACDRTASLISVFSVSE  259 (330)
T ss_pred             cceeEEECCCCCEEEEecCCCCeEEEEEEeC
Confidence            4446889999999999999999999999864


No 86 
>KOG1408 consensus WD40 repeat protein [Function unknown]
Probab=98.04  E-value=2.8e-05  Score=93.79  Aligned_cols=144  Identities=16%  Similarity=0.315  Sum_probs=103.7

Q ss_pred             Eeee--cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-------------------------EEEeecCCCc-eeEEe
Q 001070          152 QIAV--NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-------------------------IKIWEDSKVA-PLIIL  202 (1165)
Q Consensus       152 ~IAV--n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-------------------------VriWD~~~g~-pl~~l  202 (1165)
                      -|+|  ||+|||.|-+-|+|||+|+.. ..--....|+-                         |-|+|+.-.+ +++++
T Consensus       464 ~~~vSp~gqhLAsGDr~GnlrVy~Lq~l~~~~~~eAHesEilcLeyS~p~~~~kLLASasrdRlIHV~Dv~rny~l~qtl  543 (1080)
T KOG1408|consen  464 ALAVSPDGQHLASGDRGGNLRVYDLQELEYTCFMEAHESEILCLEYSFPVLTNKLLASASRDRLIHVYDVKRNYDLVQTL  543 (1080)
T ss_pred             EEEECCCcceecccCccCceEEEEehhhhhhhheecccceeEEEeecCchhhhHhhhhccCCceEEEEecccccchhhhh
Confidence            3666  899999999999999999998 66667888887                         9999987554 68888


Q ss_pred             cCCCCCCcceeEeecC-----------------------------C---------------CCCCceEEEeecCCCceEE
Q 001070          203 KPHGGQPVNSAQYLTA-----------------------------P---------------NQAGHIILVTAGPLNREVK  238 (1165)
Q Consensus       203 ephdG~sV~SVaFl~a-----------------------------P---------------~~~d~~~lvtsGslnrtIK  238 (1165)
                      ..|. -+|.||-|.-+                             |               =.|.|++.+| |.+||.|+
T Consensus       544 d~HS-ssITsvKFa~~gln~~MiscGADksimFr~~qk~~~g~~f~r~t~t~~ktTlYDm~Vdp~~k~v~t-~cQDrnir  621 (1080)
T KOG1408|consen  544 DGHS-SSITSVKFACNGLNRKMISCGADKSIMFRVNQKASSGRLFPRHTQTLSKTTLYDMAVDPTSKLVVT-VCQDRNIR  621 (1080)
T ss_pred             cccc-cceeEEEEeecCCceEEEeccCchhhheehhccccCceeccccccccccceEEEeeeCCCcceEEE-EecccceE
Confidence            7663 38999998210                             1               1244775565 77999999


Q ss_pred             EeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccc
Q 001070          239 LWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRID  317 (1165)
Q Consensus       239 LW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~d  317 (1165)
                      |++..++            +-+.+|.+..+.+    .+++ +|.+||++-||.-+...|+.-+   ++|.++.-.++|-
T Consensus       622 if~i~sg------------Kq~k~FKgs~~~e----G~lI-Kv~lDPSgiY~atScsdktl~~---~Df~sgEcvA~m~  680 (1080)
T KOG1408|consen  622 IFDIESG------------KQVKSFKGSRDHE----GDLI-KVILDPSGIYLATSCSDKTLCF---VDFVSGECVAQMT  680 (1080)
T ss_pred             EEecccc------------ceeeeecccccCC----CceE-EEEECCCccEEEEeecCCceEE---EEeccchhhhhhc
Confidence            9998555            7777777633332    3555 9999999999999988876432   2344444344443


No 87 
>KOG0289 consensus mRNA splicing factor [General function prediction only]
Probab=98.04  E-value=1.5e-05  Score=92.06  Aligned_cols=117  Identities=19%  Similarity=0.297  Sum_probs=87.1

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      +-.||-.+.+|+.||.+||||..+ +--.-|-||+.                      |++||.|+...+.++.-.++..
T Consensus       355 fHpDgLifgtgt~d~~vkiwdlks~~~~a~Fpght~~vk~i~FsENGY~Lat~add~~V~lwDLRKl~n~kt~~l~~~~~  434 (506)
T KOG0289|consen  355 FHPDGLIFGTGTPDGVVKIWDLKSQTNVAKFPGHTGPVKAISFSENGYWLATAADDGSVKLWDLRKLKNFKTIQLDEKKE  434 (506)
T ss_pred             EcCCceEEeccCCCceEEEEEcCCccccccCCCCCCceeEEEeccCceEEEEEecCCeEEEEEehhhcccceeecccccc
Confidence            444778888999999999999998 76778999999                      9999999988777777777789


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |.+|.|     ...+.||+.+   ...|+++-+...        .+.|.|+.++..++        ..-+-|.+.-.+++
T Consensus       435 v~s~~f-----D~SGt~L~~~---g~~l~Vy~~~k~--------~k~W~~~~~~~~~s--------g~st~v~Fg~~aq~  490 (506)
T KOG0289|consen  435 VNSLSF-----DQSGTYLGIA---GSDLQVYICKKK--------TKSWTEIKELADHS--------GLSTGVRFGEHAQY  490 (506)
T ss_pred             ceeEEE-----cCCCCeEEee---cceeEEEEEecc--------cccceeeehhhhcc--------cccceeeecccceE
Confidence            999999     2445668875   456777776432        35799999998644        22333444455555


Q ss_pred             EEEe
Q 001070          290 LLFA  293 (1165)
Q Consensus       290 ilLa  293 (1165)
                      +.-.
T Consensus       491 l~s~  494 (506)
T KOG0289|consen  491 LAST  494 (506)
T ss_pred             Eeec
Confidence            4443


No 88 
>KOG0306 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=98.03  E-value=3.6e-05  Score=93.43  Aligned_cols=213  Identities=21%  Similarity=0.315  Sum_probs=139.6

Q ss_pred             cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeec-CCcEEEEeCcc--hhhHhhcCCcc-
Q 001070          112 FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLK-GGNVRVLNLNT--ATRSLLRGHTK-  187 (1165)
Q Consensus       112 ~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~k-dg~IRVwdi~t--~ir~llrGH~q-  187 (1165)
                      .-.-..|.++...  ...|.-..+..|+.-|-   -..-|.+.|...-|+.++. ++-|.|||++|  -+|.+=.|--- 
T Consensus       343 nNtv~~ysl~~s~--~~~p~~~~~~~i~~~GH---R~dVRsl~vS~d~~~~~Sga~~SikiWn~~t~kciRTi~~~y~l~  417 (888)
T KOG0306|consen  343 NNTVEWYSLENSG--KTSPEADRTSNIEIGGH---RSDVRSLCVSSDSILLASGAGESIKIWNRDTLKCIRTITCGYILA  417 (888)
T ss_pred             cCceEEEEeccCC--CCCccccccceeeeccc---hhheeEEEeecCceeeeecCCCcEEEEEccCcceeEEeccccEEE
Confidence            3355668888822  22212455556665442   2245778875444444333 67899999997  45443322111 


Q ss_pred             ------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCC
Q 001070          188 ------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWS  249 (1165)
Q Consensus       188 ------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~  249 (1165)
                                        +.|+|..++..+++.+.||| .+.|++-  .||+.+   .|| |+.|+|||+|+....-.  
T Consensus       418 ~~Fvpgd~~Iv~G~k~Gel~vfdlaS~~l~Eti~AHdg-aIWsi~~--~pD~~g---~vT-~saDktVkfWdf~l~~~--  488 (888)
T KOG0306|consen  418 SKFVPGDRYIVLGTKNGELQVFDLASASLVETIRAHDG-AIWSISL--SPDNKG---FVT-GSADKTVKFWDFKLVVS--  488 (888)
T ss_pred             EEecCCCceEEEeccCCceEEEEeehhhhhhhhhcccc-ceeeeee--cCCCCc---eEE-ecCCcEEEEEeEEEEec--
Confidence                              78999999999999999998 8888888  577777   776 88999999999855422  


Q ss_pred             CCCCCC---CcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCcccccccccccccccc
Q 001070          250 LPTHAE---SWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTM  326 (1165)
Q Consensus       250 ~~~~~~---~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~  326 (1165)
                      .|+...   +-+=+.||++         ++=++.|.++||+.||.++=.. |.   +|+.|    ..+--=|++=|.=.-
T Consensus       489 ~~gt~~k~lsl~~~rtLel---------~ddvL~v~~Spdgk~LaVsLLd-nT---VkVyf----lDtlKFflsLYGHkL  551 (888)
T KOG0306|consen  489 VPGTQKKVLSLKHTRTLEL---------EDDVLCVSVSPDGKLLAVSLLD-NT---VKVYF----LDTLKFFLSLYGHKL  551 (888)
T ss_pred             cCcccceeeeeccceEEec---------cccEEEEEEcCCCcEEEEEecc-Ce---EEEEE----ecceeeeeeeccccc
Confidence            222221   2344567887         3445688999999999887543 22   23332    111223677788889


Q ss_pred             ceeeeeeccCC----CCcc--eEEEEEeehhhhhhhccccccccC
Q 001070          327 PVLSFTGTIDP----PSEH--IIKLYCVQTQAIQQYSLNLFQCLP  365 (1165)
Q Consensus       327 PILSft~~~d~----~ge~--~vq~yCvQtqAIQqy~l~~~~c~p  365 (1165)
                      |++|+.+..|+    -|..  .|+|          .+|+|-.|--
T Consensus       552 PV~smDIS~DSklivTgSADKnVKi----------WGLdFGDCHK  586 (888)
T KOG0306|consen  552 PVLSMDISPDSKLIVTGSADKNVKI----------WGLDFGDCHK  586 (888)
T ss_pred             ceeEEeccCCcCeEEeccCCCceEE----------eccccchhhh
Confidence            99999999988    2332  4776          5899999954


No 89 
>KOG0302 consensus Ribosome Assembly protein [General function prediction only]
Probab=98.03  E-value=7e-05  Score=85.66  Aligned_cols=150  Identities=20%  Similarity=0.297  Sum_probs=107.8

Q ss_pred             CCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhH-----------------hhcCCcc------
Q 001070          131 QQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRS-----------------LLRGHTK------  187 (1165)
Q Consensus       131 pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~-----------------llrGH~q------  187 (1165)
                      |++++..|..|+---....-|+=  |..|.|+=++.|++.|||+...++.                 .+.||.+      
T Consensus       141 P~~~~~~i~h~g~~NRvr~~~~~--~~~~~aswse~G~V~Vw~l~~~l~~l~~~~~~~~~s~~~Pl~t~~ghk~EGy~Ld  218 (440)
T KOG0302|consen  141 PQIEMKSIPHYGGINRVRVSRLG--NEVLCASWSENGRVQVWDLAPHLNALSEPGLEVKDSEFRPLFTFNGHKGEGYGLD  218 (440)
T ss_pred             ccccccccccccccceeeecccC--CcceeeeecccCcEEEEEchhhhhhhcCccccccccccCceEEecccCccceeee
Confidence            79999999999865433222211  5677788899999999999854333                 3567766      


Q ss_pred             ---------------------------------------------------------------EEEeecCCC---ceeEE
Q 001070          188 ---------------------------------------------------------------IKIWEDSKV---APLII  201 (1165)
Q Consensus       188 ---------------------------------------------------------------VriWD~~~g---~pl~~  201 (1165)
                                                                                     |||||+|.+   .++-+
T Consensus       219 WSp~~~g~LlsGDc~~~I~lw~~~~g~W~vd~~Pf~gH~~SVEDLqWSptE~~vfaScS~DgsIrIWDiRs~~~~~~~~~  298 (440)
T KOG0302|consen  219 WSPIKTGRLLSGDCVKGIHLWEPSTGSWKVDQRPFTGHTKSVEDLQWSPTEDGVFASCSCDGSIRIWDIRSGPKKAAVST  298 (440)
T ss_pred             cccccccccccCccccceEeeeeccCceeecCccccccccchhhhccCCccCceEEeeecCceEEEEEecCCCccceeEe
Confidence                                                                           999999988   44555


Q ss_pred             ecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEE
Q 001070          202 LKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQV  281 (1165)
Q Consensus       202 lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV  281 (1165)
                       +-|+| -|+-+.|-    +...  ||++|.-|.+++||||-.-         ....-+-+|.+        |++-+-+|
T Consensus       299 -kAh~s-DVNVISWn----r~~~--lLasG~DdGt~~iwDLR~~---------~~~~pVA~fk~--------Hk~pItsi  353 (440)
T KOG0302|consen  299 -KAHNS-DVNVISWN----RREP--LLASGGDDGTLSIWDLRQF---------KSGQPVATFKY--------HKAPITSI  353 (440)
T ss_pred             -eccCC-ceeeEEcc----CCcc--eeeecCCCceEEEEEhhhc---------cCCCcceeEEe--------ccCCeeEE
Confidence             78876 89999992    2222  6778999999999999432         23366778886        78888899


Q ss_pred             EeecCCcEEEEeccCCCcEE--EEEeec
Q 001070          282 VVLSQAGLLLFANAKKNAIY--SVHLGY  307 (1165)
Q Consensus       282 ~~~p~a~~ilLan~~r~aIY--alhl~~  307 (1165)
                      .-+|.-.=++++--.-|.|-  -|-++.
T Consensus       354 eW~p~e~s~iaasg~D~QitiWDlsvE~  381 (440)
T KOG0302|consen  354 EWHPHEDSVIAASGEDNQITIWDLSVEA  381 (440)
T ss_pred             EeccccCceEEeccCCCcEEEEEeeccC
Confidence            99988776666666666554  444444


No 90 
>KOG0282 consensus mRNA splicing factor [Function unknown]
Probab=98.02  E-value=8.9e-06  Score=94.79  Aligned_cols=100  Identities=17%  Similarity=0.350  Sum_probs=77.5

Q ss_pred             CceEEEeecCCcEEEEeCcc--hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcce
Q 001070          157 KHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNS  212 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~S  212 (1165)
                      ++.|.+|.-|+.|.|||.-.  .+-.+|.||..                      ||+||+++|.++.+|+  .|+.+|+
T Consensus       227 ~hLlLS~gmD~~vklW~vy~~~~~lrtf~gH~k~Vrd~~~s~~g~~fLS~sfD~~lKlwDtETG~~~~~f~--~~~~~~c  304 (503)
T KOG0282|consen  227 GHLLLSGGMDGLVKLWNVYDDRRCLRTFKGHRKPVRDASFNNCGTSFLSASFDRFLKLWDTETGQVLSRFH--LDKVPTC  304 (503)
T ss_pred             eeEEEecCCCceEEEEEEecCcceehhhhcchhhhhhhhccccCCeeeeeecceeeeeeccccceEEEEEe--cCCCcee
Confidence            57778888899999999987  55569999999                      9999999999999996  5899999


Q ss_pred             eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          213 AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       213 VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      |-|  .|++ .+.||  .|-.|+.|+.||.-+++  ++..-...-.|+-+++|
T Consensus       305 vkf--~pd~-~n~fl--~G~sd~ki~~wDiRs~k--vvqeYd~hLg~i~~i~F  350 (503)
T KOG0282|consen  305 VKF--HPDN-QNIFL--VGGSDKKIRQWDIRSGK--VVQEYDRHLGAILDITF  350 (503)
T ss_pred             eec--CCCC-CcEEE--EecCCCcEEEEeccchH--HHHHHHhhhhheeeeEE
Confidence            999  7777 33433  47799999999986653  11111123456677776


No 91 
>KOG1924 consensus RhoA GTPase effector DIA/Diaphanous [Signal transduction mechanisms; Cytoskeleton]
Probab=98.02  E-value=7.9e-06  Score=98.99  Aligned_cols=9  Identities=11%  Similarity=0.183  Sum_probs=5.3

Q ss_pred             CceEEeccc
Q 001070          114 DYVAYDVDA  122 (1165)
Q Consensus       114 ~~~~~dVd~  122 (1165)
                      +.-+|+||+
T Consensus       616 pKK~~k~e~  624 (1102)
T KOG1924|consen  616 PKKVYKPEV  624 (1102)
T ss_pred             ccccCCCCC
Confidence            455666665


No 92 
>KOG0306 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=97.95  E-value=2e-05  Score=95.60  Aligned_cols=117  Identities=23%  Similarity=0.302  Sum_probs=94.7

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      ++.||+|||-|+=|.++.|+-.+| ..-.-|-||.-                      ||||-..=|-|-..|-.|| ++
T Consensus       516 ~Spdgk~LaVsLLdnTVkVyflDtlKFflsLYGHkLPV~smDIS~DSklivTgSADKnVKiWGLdFGDCHKS~fAHd-DS  594 (888)
T KOG0306|consen  516 VSPDGKLLAVSLLDNTVKVYFLDTLKFFLSLYGHKLPVLSMDISPDSKLIVTGSADKNVKIWGLDFGDCHKSFFAHD-DS  594 (888)
T ss_pred             EcCCCcEEEEEeccCeEEEEEecceeeeeeecccccceeEEeccCCcCeEEeccCCCceEEeccccchhhhhhhccc-Cc
Confidence            455899999999999999999999 99999999987                      9999888787777777886 69


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |.+|.|+  |   .-.+..| .+-|+.||-||-            +.+.|+|+|.++.+.      ..  -.++.|.|+|
T Consensus       595 vm~V~F~--P---~~~~FFt-~gKD~kvKqWDg------------~kFe~iq~L~~H~~e------v~--cLav~~~G~~  648 (888)
T KOG0306|consen  595 VMSVQFL--P---KTHLFFT-CGKDGKVKQWDG------------EKFEEIQKLDGHHSE------VW--CLAVSPNGSF  648 (888)
T ss_pred             eeEEEEc--c---cceeEEE-ecCcceEEeech------------hhhhhheeeccchhe------ee--eeEEcCCCCe
Confidence            9999998  3   3343554 568999999994            678999999985433      34  4566899999


Q ss_pred             EEEeccC
Q 001070          290 LLFANAK  296 (1165)
Q Consensus       290 ilLan~~  296 (1165)
                      +|=+.-.
T Consensus       649 vvs~shD  655 (888)
T KOG0306|consen  649 VVSSSHD  655 (888)
T ss_pred             EEeccCC
Confidence            8876543


No 93 
>KOG0282 consensus mRNA splicing factor [Function unknown]
Probab=97.94  E-value=1.9e-05  Score=92.12  Aligned_cols=151  Identities=17%  Similarity=0.208  Sum_probs=95.9

Q ss_pred             CCCCCCCcccccccccCCCcccccccEeeecCceEEEee-------cCCcEEEEeCcc----hhhH-hhcCCcc------
Q 001070          126 GREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGL-------KGGNVRVLNLNT----ATRS-LLRGHTK------  187 (1165)
Q Consensus       126 ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~-------kdg~IRVwdi~t----~ir~-llrGH~q------  187 (1165)
                      +|.. ++--..+-+.|+.+-..+.||.-....+..---+       --++|+.|.=++    .+|. -++||=-      
T Consensus       158 ~e~~-~~~~ee~s~~h~k~~~dyq~r~~l~~P~dv~vnlR~~rc~~Pkk~~~~~~gH~kgvsai~~fp~~~hLlLS~gmD  236 (503)
T KOG0282|consen  158 KEDS-EHMAEESSTLHGKSLFDYQGRSYLQKPKDVGVNLREERCYLPKKLSHNLSGHTKGVSAIQWFPKKGHLLLSGGMD  236 (503)
T ss_pred             cccc-cccccccccccccchhhccccccccCCcccCCccccceeeccHhheeeccCCccccchhhhccceeeEEEecCCC
Confidence            3443 3444566788888888888887333222211111       123444444333    1111 1112211      


Q ss_pred             --EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          188 --IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       188 --VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                        |+||++.. +.+|++|.+|. ++|-+++|.  .+|   ..++ |++.|+.|||||.++            ++|+++|+
T Consensus       237 ~~vklW~vy~~~~~lrtf~gH~-k~Vrd~~~s--~~g---~~fL-S~sfD~~lKlwDtET------------G~~~~~f~  297 (503)
T KOG0282|consen  237 GLVKLWNVYDDRRCLRTFKGHR-KPVRDASFN--NCG---TSFL-SASFDRFLKLWDTET------------GQVLSRFH  297 (503)
T ss_pred             ceEEEEEEecCcceehhhhcch-hhhhhhhcc--ccC---Ceee-eeecceeeeeecccc------------ceEEEEEe
Confidence              99999987 78899999884 799999993  443   4466 588999999999854            49999999


Q ss_pred             ccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEe
Q 001070          265 LKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       265 ~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl  305 (1165)
                      .         +....-|-.+|+..-+||+-....-|-..-+
T Consensus       298 ~---------~~~~~cvkf~pd~~n~fl~G~sd~ki~~wDi  329 (503)
T KOG0282|consen  298 L---------DKVPTCVKFHPDNQNIFLVGGSDKKIRQWDI  329 (503)
T ss_pred             c---------CCCceeeecCCCCCcEEEEecCCCcEEEEec
Confidence            5         3444456788999777777666666544433


No 94 
>KOG0321 consensus WD40 repeat-containing protein L2DTL [Function unknown]
Probab=97.94  E-value=3e-05  Score=92.77  Aligned_cols=129  Identities=19%  Similarity=0.287  Sum_probs=85.2

Q ss_pred             eEEEeecCCcEEEEeCcc-hhhH--hhcCCcc-----------------------EEEeecCC-C---------------
Q 001070          159 YVCYGLKGGNVRVLNLNT-ATRS--LLRGHTK-----------------------IKIWEDSK-V---------------  196 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~t-~ir~--llrGH~q-----------------------VriWD~~~-g---------------  196 (1165)
                      -|++.+-|-+||+||.++ .++.  ++.||+.                       |.|||.+- +               
T Consensus       114 ~lVsasGDsT~r~Wdvk~s~l~G~~~~~GH~~SvkS~cf~~~n~~vF~tGgRDg~illWD~R~n~~d~~e~~~~~~~~~~  193 (720)
T KOG0321|consen  114 LLVSASGDSTIRPWDVKTSRLVGGRLNLGHTGSVKSECFMPTNPAVFCTGGRDGEILLWDCRCNGVDALEEFDNRIYGRH  193 (720)
T ss_pred             eEEEccCCceeeeeeeccceeecceeecccccccchhhhccCCCcceeeccCCCcEEEEEEeccchhhHHHHhhhhhccc
Confidence            456788899999999998 6655  5999998                       99999762 2               


Q ss_pred             ----ce-------eEEecCCCCC---CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEE
Q 001070          197 ----AP-------LIILKPHGGQ---PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQT  262 (1165)
Q Consensus       197 ----~p-------l~~lephdG~---sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QT  262 (1165)
                          .|       .++|.-|.+.   +|..|+|      .|-..|+++|-.|..||+||+-..            .|.-.
T Consensus       194 n~~ptpskp~~kr~~k~kA~s~ti~ssvTvv~f------kDe~tlaSaga~D~~iKVWDLRk~------------~~~~r  255 (720)
T KOG0321|consen  194 NTAPTPSKPLKKRIRKWKAASNTIFSSVTVVLF------KDESTLASAGAADSTIKVWDLRKN------------YTAYR  255 (720)
T ss_pred             cCCCCCCchhhccccccccccCceeeeeEEEEE------eccceeeeccCCCcceEEEeeccc------------ccccc
Confidence                01       4555555432   6888999      565668988889999999999433            22222


Q ss_pred             EeccC-CCCCccccccEEEE--EeecCCcEEEEeccCCCcEEEEEee
Q 001070          263 LDLKS-SAKPRVEEAFFNQV--VVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       263 Le~~~-s~~~~~~~aff~sV--~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      .+=.. ..-+..++.++-+|  ++|..|.+++.+.. -+.||..-+.
T Consensus       256 ~ep~~~~~~~t~skrs~G~~nL~lDssGt~L~AsCt-D~sIy~ynm~  301 (720)
T KOG0321|consen  256 QEPRGSDKYPTHSKRSVGQVNLILDSSGTYLFASCT-DNSIYFYNMR  301 (720)
T ss_pred             cCCCcccCccCcccceeeeEEEEecCCCCeEEEEec-CCcEEEEecc
Confidence            21100 11111123454445  56666788777766 8999987664


No 95 
>KOG4283 consensus Transcription-coupled repair protein CSA, contains WD40 domain [Transcription; Replication, recombination and repair]
Probab=97.94  E-value=3.2e-05  Score=86.21  Aligned_cols=90  Identities=18%  Similarity=0.380  Sum_probs=73.7

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------EEEeecCCC-ceeEEecCCCCC---
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------IKIWEDSKV-APLIILKPHGGQ---  208 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------VriWD~~~g-~pl~~lephdG~---  208 (1165)
                      --.||.|-+|-+||+-||++ ..-++|.||.+                       ||+||++.. .++.++.-|+|.   
T Consensus       158 HcLiA~gtr~~~VrLCDi~SGs~sH~LsGHr~~vlaV~Wsp~~e~vLatgsaDg~irlWDiRrasgcf~~lD~hn~k~~p  237 (397)
T KOG4283|consen  158 HCLIAAGTRDVQVRLCDIASGSFSHTLSGHRDGVLAVEWSPSSEWVLATGSADGAIRLWDIRRASGCFRVLDQHNTKRPP  237 (397)
T ss_pred             ceEEEEecCCCcEEEEeccCCcceeeeccccCceEEEEeccCceeEEEecCCCceEEEEEeecccceeEEeecccCccCc
Confidence            35689999999999999999 88899999999                       999999975 457888777652   


Q ss_pred             ----------CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCC
Q 001070          209 ----------PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPT  252 (1165)
Q Consensus       209 ----------sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~  252 (1165)
                                .|+++||.     .|+++|.+.| .|..|++|....+++-+.+.
T Consensus       238 ~~~~n~ah~gkvngla~t-----Sd~~~l~~~g-td~r~r~wn~~~G~ntl~~~  285 (397)
T KOG4283|consen  238 ILKTNTAHYGKVNGLAWT-----SDARYLASCG-TDDRIRVWNMESGRNTLREF  285 (397)
T ss_pred             cccccccccceeeeeeec-----ccchhhhhcc-CccceEEeecccCccccccc
Confidence                      67888884     5556677645 78889999999998866553


No 96 
>KOG0278 consensus Serine/threonine kinase receptor-associated protein [Lipid transport and metabolism]
Probab=97.93  E-value=2.1e-05  Score=86.11  Aligned_cols=94  Identities=21%  Similarity=0.460  Sum_probs=64.0

Q ss_pred             cCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-------------------EEEeecCCCc-----------------
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-------------------IKIWEDSKVA-----------------  197 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-------------------VriWD~~~g~-----------------  197 (1165)
                      .++-|.+.+.||.||+||+.|  .+.+|.-.|.-                   |+|||..+-.                 
T Consensus       154 eD~~iLSSadd~tVRLWD~rTgt~v~sL~~~s~VtSlEvs~dG~ilTia~gssV~Fwdaksf~~lKs~k~P~nV~SASL~  233 (334)
T KOG0278|consen  154 EDKCILSSADDKTVRLWDHRTGTEVQSLEFNSPVTSLEVSQDGRILTIAYGSSVKFWDAKSFGLLKSYKMPCNVESASLH  233 (334)
T ss_pred             cCceEEeeccCCceEEEEeccCcEEEEEecCCCCcceeeccCCCEEEEecCceeEEeccccccceeeccCcccccccccc
Confidence            356666679999999999998  55556555543                   8888865421                 


Q ss_pred             ------------------------eeEEe-cCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCC
Q 001070          198 ------------------------PLIIL-KPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPT  252 (1165)
Q Consensus       198 ------------------------pl~~l-ephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~  252 (1165)
                                              -+..+ ++|-| +|-+|-|  +|+|   - +-++||.|.||+||....+      .
T Consensus       234 P~k~~fVaGged~~~~kfDy~TgeEi~~~nkgh~g-pVhcVrF--SPdG---E-~yAsGSEDGTirlWQt~~~------~  300 (334)
T KOG0278|consen  234 PKKEFFVAGGEDFKVYKFDYNTGEEIGSYNKGHFG-PVHCVRF--SPDG---E-LYASGSEDGTIRLWQTTPG------K  300 (334)
T ss_pred             CCCceEEecCcceEEEEEeccCCceeeecccCCCC-ceEEEEE--CCCC---c-eeeccCCCceEEEEEecCC------C
Confidence                                    12222 23322 9999999  5665   3 5779999999999997433      1


Q ss_pred             CCCCcceEEE
Q 001070          253 HAESWKCTQT  262 (1165)
Q Consensus       253 ~~~~w~C~QT  262 (1165)
                      ..+.|+|+.-
T Consensus       301 ~~~~~~~~~~  310 (334)
T KOG0278|consen  301 TYGLWKCVKP  310 (334)
T ss_pred             chhhccccCh
Confidence            2247999654


No 97 
>KOG0644 consensus Uncharacterized conserved protein, contains WD40 repeat and BROMO domains [General function prediction only]
Probab=97.91  E-value=1.3e-05  Score=97.73  Aligned_cols=84  Identities=25%  Similarity=0.540  Sum_probs=72.4

Q ss_pred             cccEeee-------cCceEEEeecCCcEEEEeCcchhh-HhhcCCcc----------------------EEEeecCCCce
Q 001070          149 IGRQIAV-------NKHYVCYGLKGGNVRVLNLNTATR-SLLRGHTK----------------------IKIWEDSKVAP  198 (1165)
Q Consensus       149 ~GR~IAV-------n~~yIayG~kdg~IRVwdi~t~ir-~llrGH~q----------------------VriWD~~~g~p  198 (1165)
                      +|..=||       .|.||.+|..|..++||...|+.+ +-+|||+.                      ||||-...|.|
T Consensus       187 lgH~naVyca~fDrtg~~Iitgsdd~lvKiwS~et~~~lAs~rGhs~ditdlavs~~n~~iaaaS~D~vIrvWrl~~~~p  266 (1113)
T KOG0644|consen  187 LGHRNAVYCAIFDRTGRYIITGSDDRLVKIWSMETARCLASCRGHSGDITDLAVSSNNTMIAAASNDKVIRVWRLPDGAP  266 (1113)
T ss_pred             HhhhhheeeeeeccccceEeecCccceeeeeeccchhhhccCCCCccccchhccchhhhhhhhcccCceEEEEecCCCch
Confidence            4655455       399999999999999999999555 49999999                      99999999999


Q ss_pred             eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          199 LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       199 l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                      |.++.+|.| +|.+++|.  |-.        +.+-|.|+.+||..
T Consensus       267 vsvLrghtg-avtaiafs--P~~--------sss~dgt~~~wd~r  300 (1113)
T KOG0644|consen  267 VSVLRGHTG-AVTAIAFS--PRA--------SSSDDGTCRIWDAR  300 (1113)
T ss_pred             HHHHhcccc-ceeeeccC--ccc--------cCCCCCceEecccc
Confidence            999999998 99999994  333        56688999999986


No 98 
>KOG0277 consensus Peroxisomal targeting signal type 2 receptor [Intracellular trafficking, secretion, and vesicular transport]
Probab=97.89  E-value=1.3e-05  Score=88.01  Aligned_cols=53  Identities=23%  Similarity=0.621  Sum_probs=44.7

Q ss_pred             EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcC
Q 001070          188 IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE  246 (1165)
Q Consensus       188 VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~  246 (1165)
                      ||+||+++ ..||-.+.+| |-.|.+|.|  +|+..+   |++|++-|=|.+||+...+.
T Consensus       215 vr~wDir~~r~pl~eL~gh-~~AVRkvk~--Sph~~~---lLaSasYDmT~riw~~~~~d  268 (311)
T KOG0277|consen  215 VRGWDIRNLRTPLFELNGH-GLAVRKVKF--SPHHAS---LLASASYDMTVRIWDPERQD  268 (311)
T ss_pred             EEEEehhhccccceeecCC-ceEEEEEec--Ccchhh---HhhhccccceEEecccccch
Confidence            99999987 4788888777 679999999  566655   89999999999999986543


No 99 
>KOG4283 consensus Transcription-coupled repair protein CSA, contains WD40 domain [Transcription; Replication, recombination and repair]
Probab=97.87  E-value=0.00012  Score=81.81  Aligned_cols=126  Identities=21%  Similarity=0.287  Sum_probs=101.2

Q ss_pred             CceEEEeecCCcEEEEeCcc-h-hhH--hhcCCcc-----------------------------------EEEeecCCCc
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-A-TRS--LLRGHTK-----------------------------------IKIWEDSKVA  197 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~-ir~--llrGH~q-----------------------------------VriWD~~~g~  197 (1165)
                      |+|+.+|..||-|-|||.++ . .+.  |+-.|..                                   +||||+.+.+
T Consensus        56 grymlSGgadgsi~v~Dl~n~t~~e~s~li~k~~c~v~~~h~~~Hky~iss~~WyP~DtGmFtssSFDhtlKVWDtnTlQ  135 (397)
T KOG4283|consen   56 GRYMLSGGADGSIAVFDLQNATDYEASGLIAKHKCIVAKQHENGHKYAISSAIWYPIDTGMFTSSSFDHTLKVWDTNTLQ  135 (397)
T ss_pred             ceEEeecCCCccEEEEEeccccchhhccceeheeeeccccCCccceeeeeeeEEeeecCceeecccccceEEEeecccce
Confidence            89999999999999999986 2 122  4444433                                   9999999987


Q ss_pred             eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccccc
Q 001070          198 PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAF  277 (1165)
Q Consensus       198 pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~af  277 (1165)
                      -+..|+=.  .-|||-|+  +|=...|- ||+.|--+-.|+|-|++++            .|.-||.+        |.+=
T Consensus       136 ~a~~F~me--~~VYsham--Sp~a~sHc-LiA~gtr~~~VrLCDi~SG------------s~sH~LsG--------Hr~~  190 (397)
T KOG4283|consen  136 EAVDFKME--GKVYSHAM--SPMAMSHC-LIAAGTRDVQVRLCDIASG------------SFSHTLSG--------HRDG  190 (397)
T ss_pred             eeEEeecC--ceeehhhc--Chhhhcce-EEEEecCCCcEEEEeccCC------------cceeeecc--------ccCc
Confidence            77777654  37999999  56666655 8999999999999999766            89999994        8898


Q ss_pred             EEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          278 FNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       278 f~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ++.|.-.|...|||.+...--+|-.--+..
T Consensus       191 vlaV~Wsp~~e~vLatgsaDg~irlWDiRr  220 (397)
T KOG4283|consen  191 VLAVEWSPSSEWVLATGSADGAIRLWDIRR  220 (397)
T ss_pred             eEEEEeccCceeEEEecCCCceEEEEEeec
Confidence            999999999999998877666666555554


No 100
>KOG0267 consensus Microtubule severing protein katanin p80 subunit B (contains WD40 repeats) [Cell cycle control, cell division, chromosome partitioning]
Probab=97.86  E-value=1.3e-05  Score=96.91  Aligned_cols=80  Identities=20%  Similarity=0.452  Sum_probs=70.7

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCccee
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSA  213 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SV  213 (1165)
                      |.|-|.|+-|+.+.||||.. ..-+.++||.+                      |||||.+-|..+..|+.|.| .|.++
T Consensus       124 ~~~~a~gStdtd~~iwD~Rk~Gc~~~~~s~~~vv~~l~lsP~Gr~v~~g~ed~tvki~d~~agk~~~ef~~~e~-~v~sl  202 (825)
T KOG0267|consen  124 GEFFASGSTDTDLKIWDIRKKGCSHTYKSHTRVVDVLRLSPDGRWVASGGEDNTVKIWDLTAGKLSKEFKSHEG-KVQSL  202 (825)
T ss_pred             eEEeccccccccceehhhhccCceeeecCCcceeEEEeecCCCceeeccCCcceeeeecccccccccccccccc-ccccc
Confidence            67778899999999999996 77789999998                      99999999988999999987 77777


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                      -|      ..+.||+++|+.|+++++||+.
T Consensus       203 e~------hp~e~Lla~Gs~d~tv~f~dle  226 (825)
T KOG0267|consen  203 EF------HPLEVLLAPGSSDRTVRFWDLE  226 (825)
T ss_pred             cc------CchhhhhccCCCCceeeeeccc
Confidence            78      4557899999999999999984


No 101
>KOG0301 consensus Phospholipase A2-activating protein (contains WD40 repeats) [Lipid transport and metabolism]
Probab=97.85  E-value=0.0001  Score=89.15  Aligned_cols=122  Identities=16%  Similarity=0.287  Sum_probs=85.7

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhhHhhcCCcc---------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK---------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q---------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      ++....-+.||+-|++||+|.=.+.+ .+|.||+.                     ||.||. +|..|.+..+|. .-||
T Consensus       147 ~~l~e~~~vTgsaDKtIklWk~~~~l-~tf~gHtD~VRgL~vl~~~~flScsNDg~Ir~w~~-~ge~l~~~~ght-n~vY  223 (745)
T KOG0301|consen  147 ASLPENTYVTGSADKTIKLWKGGTLL-KTFSGHTDCVRGLAVLDDSHFLSCSNDGSIRLWDL-DGEVLLEMHGHT-NFVY  223 (745)
T ss_pred             eecCCCcEEeccCcceeeeccCCchh-hhhccchhheeeeEEecCCCeEeecCCceEEEEec-cCceeeeeeccc-eEEE
Confidence            33345566799999999999985544 57889999                     999999 566688888774 4899


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      |+..  ++++.    +|++..-||||+||+-              ..|.|.++++.        -=+-++.+.+-+.+++
T Consensus       224 sis~--~~~~~----~Ivs~gEDrtlriW~~--------------~e~~q~I~lPt--------tsiWsa~~L~NgDIvv  275 (745)
T KOG0301|consen  224 SISM--ALSDG----LIVSTGEDRTLRIWKK--------------DECVQVITLPT--------TSIWSAKVLLNGDIVV  275 (745)
T ss_pred             EEEe--cCCCC----eEEEecCCceEEEeec--------------CceEEEEecCc--------cceEEEEEeeCCCEEE
Confidence            9994  23322    3556779999999994              28999999742        1233666666666555


Q ss_pred             EeccCCCcEEEEEeec
Q 001070          292 FANAKKNAIYSVHLGY  307 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~  307 (1165)
                      -+  .-..||++-.++
T Consensus       276 g~--SDG~VrVfT~~k  289 (745)
T KOG0301|consen  276 GG--SDGRVRVFTVDK  289 (745)
T ss_pred             ec--cCceEEEEEecc
Confidence            43  234566665554


No 102
>KOG0772 consensus Uncharacterized conserved protein, contains WD40 repeat [Function unknown]
Probab=97.85  E-value=6.4e-05  Score=88.43  Aligned_cols=170  Identities=14%  Similarity=0.265  Sum_probs=105.1

Q ss_pred             eEEEeecCCcEEEEeCcc--hhhHhhcCCcc---------------------------EEEeecCCCc--e-eEEecCCC
Q 001070          159 YVCYGLKGGNVRVLNLNT--ATRSLLRGHTK---------------------------IKIWEDSKVA--P-LIILKPHG  206 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~t--~ir~llrGH~q---------------------------VriWD~~~g~--p-l~~lephd  206 (1165)
                      -..|.+.||..||||.+.  .++..|+--..                           |.|||..+..  | ..+-..|+
T Consensus       283 ~FlT~s~DgtlRiWdv~~~k~q~qVik~k~~~g~Rv~~tsC~~nrdg~~iAagc~DGSIQ~W~~~~~~v~p~~~vk~AH~  362 (641)
T KOG0772|consen  283 EFLTCSYDGTLRIWDVNNTKSQLQVIKTKPAGGKRVPVTSCAWNRDGKLIAAGCLDGSIQIWDKGSRTVRPVMKVKDAHL  362 (641)
T ss_pred             ceEEecCCCcEEEEecCCchhheeEEeeccCCCcccCceeeecCCCcchhhhcccCCceeeeecCCcccccceEeeeccC
Confidence            345778899999999997  44444443222                           9999976532  3 55666775


Q ss_pred             -CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          207 -GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       207 -G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                       |..+.||+|.     .|+++|+ |-+.|.+||||||..-           -+|+-+.++=....+.+      -++++|
T Consensus       363 ~g~~Itsi~FS-----~dg~~Ll-SRg~D~tLKvWDLrq~-----------kkpL~~~tgL~t~~~~t------dc~FSP  419 (641)
T KOG0772|consen  363 PGQDITSISFS-----YDGNYLL-SRGFDDTLKVWDLRQF-----------KKPLNVRTGLPTPFPGT------DCCFSP  419 (641)
T ss_pred             CCCceeEEEec-----cccchhh-hccCCCceeeeecccc-----------ccchhhhcCCCccCCCC------ccccCC
Confidence             5799999994     5556677 5779999999999443           26776666533222111      245689


Q ss_pred             CCcEEEEeccCC-----CcEEEEEeecCCCccccccccccccccccceeeeee-ccCC--------CCcceEEEEEeehh
Q 001070          286 QAGLLLFANAKK-----NAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTG-TIDP--------PSEHIIKLYCVQTQ  351 (1165)
Q Consensus       286 ~a~~ilLan~~r-----~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~-~~d~--------~ge~~vq~yCvQtq  351 (1165)
                      +..+||-.-.--     ..+|++.          ||.|=.-+++-.+=-|+-. .|.+        -|.|.+++|--+++
T Consensus       420 d~kli~TGtS~~~~~~~g~L~f~d----------~~t~d~v~ki~i~~aSvv~~~WhpkLNQi~~gsgdG~~~vyYdp~~  489 (641)
T KOG0772|consen  420 DDKLILTGTSAPNGMTAGTLFFFD----------RMTLDTVYKIDISTASVVRCLWHPKLNQIFAGSGDGTAHVYYDPNE  489 (641)
T ss_pred             CceEEEecccccCCCCCceEEEEe----------ccceeeEEEecCCCceEEEEeecchhhheeeecCCCceEEEECccc
Confidence            988888654321     1244432          2222233333333333322 2333        47789999999999


Q ss_pred             hhhhhccccccccC
Q 001070          352 AIQQYSLNLFQCLP  365 (1165)
Q Consensus       352 AIQqy~l~~~~c~p  365 (1165)
                      +|--    .+.|.-
T Consensus       490 S~RG----ak~cv~  499 (641)
T KOG0772|consen  490 SIRG----AKLCVV  499 (641)
T ss_pred             cccc----hhheee
Confidence            8753    345654


No 103
>KOG1445 consensus Tumor-specific antigen (contains WD repeats) [Cytoskeleton]
Probab=97.84  E-value=0.00012  Score=87.61  Aligned_cols=159  Identities=13%  Similarity=0.242  Sum_probs=107.8

Q ss_pred             ccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc--------hhhHhhcCCcc------------------
Q 001070          134 EVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT--------ATRSLLRGHTK------------------  187 (1165)
Q Consensus       134 ev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t--------~ir~llrGH~q------------------  187 (1165)
                      .=+-||.+-|||         .|...||-|..||+||+|-+.+        .--..|++|..                  
T Consensus       626 Ngt~vtDl~WdP---------FD~~rLAVa~ddg~i~lWr~~a~gl~e~~~tPe~~lt~h~eKI~slRfHPLAadvLa~a  696 (1012)
T KOG1445|consen  626 NGTLVTDLHWDP---------FDDERLAVATDDGQINLWRLTANGLPENEMTPEKILTIHGEKITSLRFHPLAADVLAVA  696 (1012)
T ss_pred             cCceeeecccCC---------CChHHeeecccCceEEEEEeccCCCCcccCCcceeeecccceEEEEEecchhhhHhhhh
Confidence            345677777777         3556677788999999999875        22347888887                  


Q ss_pred             -----EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCC----CC---
Q 001070          188 -----IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTH----AE---  255 (1165)
Q Consensus       188 -----VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~----~~---  255 (1165)
                           |++||.+++..-.+|.+|.| -++++||.  |+|   + ++++-.-|.+|++++-..++--++-..    +.   
T Consensus       697 syd~Ti~lWDl~~~~~~~~l~gHtd-qIf~~AWS--pdG---r-~~AtVcKDg~~rVy~Prs~e~pv~Eg~gpvgtRgAR  769 (1012)
T KOG1445|consen  697 SYDSTIELWDLANAKLYSRLVGHTD-QIFGIAWS--PDG---R-RIATVCKDGTLRVYEPRSREQPVYEGKGPVGTRGAR  769 (1012)
T ss_pred             hccceeeeeehhhhhhhheeccCcC-ceeEEEEC--CCC---c-ceeeeecCceEEEeCCCCCCCccccCCCCccCccee
Confidence                 99999999988889999964 79999994  554   5 455677999999999877653333221    11   


Q ss_pred             -CcceEEEEec----cCCCCC---------ccccccEEEE---E-------eecCCcEEEEeccCCCcEEEEEeecC
Q 001070          256 -SWKCTQTLDL----KSSAKP---------RVEEAFFNQV---V-------VLSQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       256 -~w~C~QTLe~----~~s~~~---------~~~~aff~sV---~-------~~p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                       .|.|-..+-.    ..+.|.         -.-.-++-++   +       +|+|++.|||+.---.-||+.++-|.
T Consensus       770 i~wacdgr~viv~Gfdk~SeRQv~~Y~Aq~l~~~pl~t~~lDvaps~LvP~YD~Ds~~lfltGKGD~~v~~yEv~~e  846 (1012)
T KOG1445|consen  770 ILWACDGRIVIVVGFDKSSERQVQMYDAQTLDLRPLYTQVLDVAPSPLVPHYDYDSNVLFLTGKGDRFVNMYEVIYE  846 (1012)
T ss_pred             EEEEecCcEEEEecccccchhhhhhhhhhhccCCcceeeeecccCccccccccCCCceEEEecCCCceEEEEEecCC
Confidence             3777555443    222110         0001122222   1       67888888888888888888888773


No 104
>KOG0649 consensus WD40 repeat protein [General function prediction only]
Probab=97.83  E-value=5e-05  Score=83.05  Aligned_cols=139  Identities=17%  Similarity=0.266  Sum_probs=88.8

Q ss_pred             Cceee--cCCceEEecccCCCCCCC--CCCcccccccccCCCcccccccEeeec--CceEEEeecCCcEEEEeCcc-hhh
Q 001070          107 YGKRV--FGDYVAYDVDAVEEGREP--TQQLEVNPITKYGSDPELLIGRQIAVN--KHYVCYGLKGGNVRVLNLNT-ATR  179 (1165)
Q Consensus       107 ~Gr~l--~g~~~~~dVd~~~~ge~~--~pqlev~pIt~Y~sd~~~~~GR~IAVn--~~yIayG~kdg~IRVwdi~t-~ir  179 (1165)
                      .-++|  -|+-.||--+-++--|.-  -+-+|+.+=- -...-.-+..+-..+|  ..-|.+..-|+.|--||..+ ++.
T Consensus        71 ~d~~Lls~gdG~V~gw~W~E~~es~~~K~lwe~~~P~-~~~~~evPeINam~ldP~enSi~~AgGD~~~y~~dlE~G~i~  149 (325)
T KOG0649|consen   71 HDDFLLSGGDGLVYGWEWNEEEESLATKRLWEVKIPM-QVDAVEVPEINAMWLDPSENSILFAGGDGVIYQVDLEDGRIQ  149 (325)
T ss_pred             ehhheeeccCceEEEeeehhhhhhccchhhhhhcCcc-ccCcccCCccceeEeccCCCcEEEecCCeEEEEEEecCCEEE
Confidence            44555  667888877776665521  0112222110 0001111222334444  33444555999999999999 999


Q ss_pred             HhhcCCcc----------------------EEEeecCCCceeEEecCC---------CCCCcceeEeecCCCCCCceEEE
Q 001070          180 SLLRGHTK----------------------IKIWEDSKVAPLIILKPH---------GGQPVNSAQYLTAPNQAGHIILV  228 (1165)
Q Consensus       180 ~llrGH~q----------------------VriWD~~~g~pl~~leph---------dG~sV~SVaFl~aP~~~d~~~lv  228 (1165)
                      ..||||++                      |||||.+++..+..++|+         .|.++..++-     ..||  ||
T Consensus       150 r~~rGHtDYvH~vv~R~~~~qilsG~EDGtvRvWd~kt~k~v~~ie~yk~~~~lRp~~g~wigala~-----~edW--lv  222 (325)
T KOG0649|consen  150 REYRGHTDYVHSVVGRNANGQILSGAEDGTVRVWDTKTQKHVSMIEPYKNPNLLRPDWGKWIGALAV-----NEDW--LV  222 (325)
T ss_pred             EEEcCCcceeeeeeecccCcceeecCCCccEEEEeccccceeEEeccccChhhcCcccCceeEEEec-----cCce--EE
Confidence            99999999                      999999999887776655         4667777766     2343  46


Q ss_pred             eecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          229 TAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       229 tsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      .||  ...+-||.+-..            .|+++|.++.
T Consensus       223 CGg--Gp~lslwhLrss------------e~t~vfpipa  247 (325)
T KOG0649|consen  223 CGG--GPKLSLWHLRSS------------ESTCVFPIPA  247 (325)
T ss_pred             ecC--CCceeEEeccCC------------CceEEEeccc
Confidence            444  567889998443            8999999854


No 105
>KOG0270 consensus WD40 repeat-containing protein [Function unknown]
Probab=97.83  E-value=0.00011  Score=85.40  Aligned_cols=81  Identities=23%  Similarity=0.494  Sum_probs=65.3

Q ss_pred             CceEEEeecCCcEEEEeCcc---hhhH-hh------------------cCCcc-----------------------EEEe
Q 001070          157 KHYVCYGLKGGNVRVLNLNT---ATRS-LL------------------RGHTK-----------------------IKIW  191 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t---~ir~-ll------------------rGH~q-----------------------VriW  191 (1165)
                      |+|+|-|.-|-.|-|||..=   ..-- +|                  .||+.                       |++|
T Consensus       192 gNyvAiGtmdp~IeIWDLDI~d~v~P~~~LGs~~sk~~~k~~k~~~~~~gHTdavl~Ls~n~~~~nVLaSgsaD~TV~lW  271 (463)
T KOG0270|consen  192 GNYVAIGTMDPEIEIWDLDIVDAVLPCVTLGSKASKKKKKKGKRSNSASGHTDAVLALSWNRNFRNVLASGSADKTVKLW  271 (463)
T ss_pred             cceEEEeccCceeEEeccccccccccceeechhhhhhhhhhcccccccccchHHHHHHHhccccceeEEecCCCceEEEE
Confidence            78999999999999999862   1111 11                  26886                       9999


Q ss_pred             ecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          192 EDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       192 D~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                      |+.+|.|..+++ |.|..|.++.|  .|..+.  +|| +|+-|++++|.||-
T Consensus       272 D~~~g~p~~s~~-~~~k~Vq~l~w--h~~~p~--~LL-sGs~D~~V~l~D~R  317 (463)
T KOG0270|consen  272 DVDTGKPKSSIT-HHGKKVQTLEW--HPYEPS--VLL-SGSYDGTVALKDCR  317 (463)
T ss_pred             EcCCCCcceehh-hcCCceeEEEe--cCCCce--EEE-eccccceEEeeecc
Confidence            999999999998 55889999999  465544  567 69999999999995


No 106
>KOG0303 consensus Actin-binding protein Coronin, contains WD40 repeats [Cytoskeleton]
Probab=97.82  E-value=0.00015  Score=83.37  Aligned_cols=168  Identities=19%  Similarity=0.290  Sum_probs=107.7

Q ss_pred             cccccccccC---CCcccccccEeee--------cCceEEEeecCCcEEEEeCcc-----hh---hHhhcCCcc------
Q 001070          133 LEVNPITKYG---SDPELLIGRQIAV--------NKHYVCYGLKGGNVRVLNLNT-----AT---RSLLRGHTK------  187 (1165)
Q Consensus       133 lev~pIt~Y~---sd~~~~~GR~IAV--------n~~yIayG~kdg~IRVwdi~t-----~i---r~llrGH~q------  187 (1165)
                      +-|-|+.+-|   .+|.++-|..=.|        |+.-||+|++|-.|.||.|--     .+   .-.|.||..      
T Consensus        59 f~ViPl~k~Gr~d~~~P~v~GHt~~vLDi~w~PfnD~vIASgSeD~~v~vW~IPe~~l~~~ltepvv~L~gH~rrVg~V~  138 (472)
T KOG0303|consen   59 FLVIPLVKTGRMDASYPLVCGHTAPVLDIDWCPFNDCVIASGSEDTKVMVWQIPENGLTRDLTEPVVELYGHQRRVGLVQ  138 (472)
T ss_pred             eeecccccccccCCCCCCccCccccccccccCccCCceeecCCCCceEEEEECCCcccccCcccceEEEeecceeEEEEe
Confidence            4566666655   4455555554222        688999999999999999863     11   235788887      


Q ss_pred             ----------------------------------------------------------EEEeecCCCceeEEecCCCCCC
Q 001070          188 ----------------------------------------------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       188 ----------------------------------------------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                                                                                |||||.++|..|+.-.+|.|..
T Consensus       139 wHPtA~NVLlsag~Dn~v~iWnv~tgeali~l~hpd~i~S~sfn~dGs~l~TtckDKkvRv~dpr~~~~v~e~~~heG~k  218 (472)
T KOG0303|consen  139 WHPTAPNVLLSAGSDNTVSIWNVGTGEALITLDHPDMVYSMSFNRDGSLLCTTCKDKKVRVIDPRRGTVVSEGVAHEGAK  218 (472)
T ss_pred             ecccchhhHhhccCCceEEEEeccCCceeeecCCCCeEEEEEeccCCceeeeecccceeEEEcCCCCcEeeecccccCCC
Confidence                                                                      6666666666666666667777


Q ss_pred             cceeEeecCCCCCCceEEEeec---CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          210 VNSAQYLTAPNQAGHIILVTAG---PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsG---slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      -..+.||     .++. +.|.|   -.+|.|-|||-..=         +...-.++|.--       ..-+|  =-+|++
T Consensus       219 ~~Raifl-----~~g~-i~tTGfsr~seRq~aLwdp~nl---------~eP~~~~elDtS-------nGvl~--PFyD~d  274 (472)
T KOG0303|consen  219 PARAIFL-----ASGK-IFTTGFSRMSERQIALWDPNNL---------EEPIALQELDTS-------NGVLL--PFYDPD  274 (472)
T ss_pred             cceeEEe-----ccCc-eeeeccccccccceeccCcccc---------cCcceeEEeccC-------CceEE--eeecCC
Confidence            7777776     4555 34434   37899999996332         223555666520       01111  125888


Q ss_pred             CcEEEEeccCCCcEEEEEeecCCCccccccccccccccccce
Q 001070          287 AGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPV  328 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PI  328 (1165)
                      +++|-|.-----+|--.++..    ..+.+-||.+|+-.-|=
T Consensus       275 t~ivYl~GKGD~~IRYyEit~----d~P~~hyln~f~S~epQ  312 (472)
T KOG0303|consen  275 TSIVYLCGKGDSSIRYFEITN----EPPFVHYLNTFSSKEPQ  312 (472)
T ss_pred             CCEEEEEecCCcceEEEEecC----CCceeEEecccccCCcc
Confidence            888888776666666555553    36689999999866553


No 107
>KOG0643 consensus Translation initiation factor 3, subunit i (eIF-3i)/TGF-beta receptor-interacting protein (TRIP-1) [Translation, ribosomal structure and biogenesis; Signal transduction mechanisms]
Probab=97.82  E-value=5.7e-05  Score=83.49  Aligned_cols=80  Identities=15%  Similarity=0.206  Sum_probs=61.2

Q ss_pred             EEEeecCCCc-eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          188 IKIWEDSKVA-PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       188 VriWD~~~g~-pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      |++||.++|. .+..-+-| +..++.+.|.     +|.-+.|| ||-|++-||||.            ....|+.|++  
T Consensus       171 is~~da~~g~~~v~s~~~h-~~~Ind~q~s-----~d~T~FiT-~s~Dttakl~D~------------~tl~v~Kty~--  229 (327)
T KOG0643|consen  171 ISIYDARTGKELVDSDEEH-SSKINDLQFS-----RDRTYFIT-GSKDTTAKLVDV------------RTLEVLKTYT--  229 (327)
T ss_pred             EEEEEcccCceeeechhhh-cccccccccc-----CCcceEEe-cccCccceeeec------------cceeeEEEee--
Confidence            7777777773 45555555 4588888883     44455775 999999999998            4459999999  


Q ss_pred             CCCCCccccccEEEEEeecCCcEEEEecc
Q 001070          267 SSAKPRVEEAFFNQVVVLSQAGLLLFANA  295 (1165)
Q Consensus       267 ~s~~~~~~~aff~sV~~~p~a~~ilLan~  295 (1165)
                             .+--+|.+++.|--.+|+|.--
T Consensus       230 -------te~PvN~aaisP~~d~VilgGG  251 (327)
T KOG0643|consen  230 -------TERPVNTAAISPLLDHVILGGG  251 (327)
T ss_pred             -------ecccccceecccccceEEecCC
Confidence                   3567889999999999888753


No 108
>KOG0275 consensus Conserved WD40 repeat-containing protein [General function prediction only]
Probab=97.79  E-value=0.00015  Score=81.65  Aligned_cols=134  Identities=21%  Similarity=0.412  Sum_probs=96.6

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-------------------------------------------
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-------------------------------------------  187 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-------------------------------------------  187 (1165)
                      ++-|...||+|+-||.|+||-|.|  -+|..=|.|++                                           
T Consensus       271 FSRDsEMlAsGsqDGkIKvWri~tG~ClRrFdrAHtkGvt~l~FSrD~SqiLS~sfD~tvRiHGlKSGK~LKEfrGHsSy  350 (508)
T KOG0275|consen  271 FSRDSEMLASGSQDGKIKVWRIETGQCLRRFDRAHTKGVTCLSFSRDNSQILSASFDQTVRIHGLKSGKCLKEFRGHSSY  350 (508)
T ss_pred             ecccHHHhhccCcCCcEEEEEEecchHHHHhhhhhccCeeEEEEccCcchhhcccccceEEEeccccchhHHHhcCcccc
Confidence            444677889999999999999999  56667778888                                           


Q ss_pred             ---------------------EEEeecCCCceeEEecCCCCC-CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          188 ---------------------IKIWEDSKVAPLIILKPHGGQ-PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       188 ---------------------VriWD~~~g~pl~~lephdG~-sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                                           ||||+..++.|+.+|+|...+ +|++|..+  |-.|.|. +| .. -..+|-|-+..+ 
T Consensus       351 vn~a~ft~dG~~iisaSsDgtvkvW~~KtteC~~Tfk~~~~d~~vnsv~~~--PKnpeh~-iV-CN-rsntv~imn~qG-  424 (508)
T KOG0275|consen  351 VNEATFTDDGHHIISASSDGTVKVWHGKTTECLSTFKPLGTDYPVNSVILL--PKNPEHF-IV-CN-RSNTVYIMNMQG-  424 (508)
T ss_pred             ccceEEcCCCCeEEEecCCccEEEecCcchhhhhhccCCCCcccceeEEEc--CCCCceE-EE-Ec-CCCeEEEEeccc-
Confidence                                 999999999999999998433 99999996  7777744 44 33 233566666522 


Q ss_pred             CCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCC
Q 001070          246 EGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       246 ~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~  310 (1165)
                                  .-+.+|.-  -.  |-..+|+ ..+++|.|.||.-.. .-..+||+-+..|.-
T Consensus       425 ------------QvVrsfsS--Gk--REgGdFi-~~~lSpkGewiYcig-ED~vlYCF~~~sG~L  471 (508)
T KOG0275|consen  425 ------------QVVRSFSS--GK--REGGDFI-NAILSPKGEWIYCIG-EDGVLYCFSVLSGKL  471 (508)
T ss_pred             ------------eEEeeecc--CC--ccCCceE-EEEecCCCcEEEEEc-cCcEEEEEEeecCce
Confidence                        34444441  11  1234676 678999999997654 446789988876554


No 109
>KOG0277 consensus Peroxisomal targeting signal type 2 receptor [Intracellular trafficking, secretion, and vesicular transport]
Probab=97.75  E-value=0.00027  Score=77.87  Aligned_cols=125  Identities=15%  Similarity=0.282  Sum_probs=92.8

Q ss_pred             CceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          157 KHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      ..-+.+..-||.+|+||..-  .=-+.|+-|++                       ||+||-.-+.-|.+|.+|. ..||
T Consensus        73 e~~~~~a~GDGSLrl~d~~~~s~Pi~~~kEH~~EV~Svdwn~~~r~~~ltsSWD~TiKLW~~~r~~Sv~Tf~gh~-~~Iy  151 (311)
T KOG0277|consen   73 ENQVIAASGDGSLRLFDLTMPSKPIHKFKEHKREVYSVDWNTVRRRIFLTSSWDGTIKLWDPNRPNSVQTFNGHN-SCIY  151 (311)
T ss_pred             cceEEEEecCceEEEeccCCCCcchhHHHhhhhheEEeccccccceeEEeeccCCceEeecCCCCcceEeecCCc-cEEE
Confidence            34455677899999999664  44457889988                       9999988777799999884 5999


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      .++|  +|..++   |+.|.|.|.+++|||+... |          +-+- ++-        |..=.+.+--.--...||
T Consensus       152 ~a~~--sp~~~n---lfas~Sgd~~l~lwdvr~~-g----------k~~~-i~a--------h~~Eil~cdw~ky~~~vl  206 (311)
T KOG0277|consen  152 QAAF--SPHIPN---LFASASGDGTLRLWDVRSP-G----------KFMS-IEA--------HNSEILCCDWSKYNHNVL  206 (311)
T ss_pred             EEec--CCCCCC---eEEEccCCceEEEEEecCC-C----------ceeE-EEe--------ccceeEeecccccCCcEE
Confidence            9999  688888   9999999999999997544 2          3333 553        332233444444456677


Q ss_pred             EeccCCCcEEEEEeec
Q 001070          292 FANAKKNAIYSVHLGY  307 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~  307 (1165)
                      ..-.-.++||.--|..
T Consensus       207 ~Tg~vd~~vr~wDir~  222 (311)
T KOG0277|consen  207 ATGGVDNLVRGWDIRN  222 (311)
T ss_pred             EecCCCceEEEEehhh
Confidence            8888888888877764


No 110
>KOG0303 consensus Actin-binding protein Coronin, contains WD40 repeats [Cytoskeleton]
Probab=97.74  E-value=9.6e-05  Score=84.95  Aligned_cols=133  Identities=23%  Similarity=0.386  Sum_probs=97.2

Q ss_pred             cccccccccCCCcccccccEeeecCceEEE---eecCCcEEEEeCcc-----hhhHhhcCCcc-----------------
Q 001070          133 LEVNPITKYGSDPELLIGRQIAVNKHYVCY---GLKGGNVRVLNLNT-----ATRSLLRGHTK-----------------  187 (1165)
Q Consensus       133 lev~pIt~Y~sd~~~~~GR~IAVn~~yIay---G~kdg~IRVwdi~t-----~ir~llrGH~q-----------------  187 (1165)
                      .+--.++.-.||-.|     .|||++|||-   ++-.|-.-|+=++.     ...-+++||+.                 
T Consensus        25 YddIrVs~~tWDS~f-----cavNPkfiAvi~easgGgaf~ViPl~k~Gr~d~~~P~v~GHt~~vLDi~w~PfnD~vIAS   99 (472)
T KOG0303|consen   25 YDDIRVSRVTWDSSF-----CAVNPKFVAVIIEASGGGAFLVIPLVKTGRMDASYPLVCGHTAPVLDIDWCPFNDCVIAS   99 (472)
T ss_pred             hcceeeeeeeccccc-----cccCCceEEEEEecCCCcceeecccccccccCCCCCCccCccccccccccCccCCceeec
Confidence            334455666787744     6899999987   33355666666664     33349999998                 


Q ss_pred             ------EEEeecCCC-------ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCC
Q 001070          188 ------IKIWEDSKV-------APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHA  254 (1165)
Q Consensus       188 ------VriWD~~~g-------~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~  254 (1165)
                            |+||++-.+       .|+..|++| -..|..|+|  .|-...  +|+ |++-|.+|+||++.+++.       
T Consensus       100 gSeD~~v~vW~IPe~~l~~~ltepvv~L~gH-~rrVg~V~w--HPtA~N--VLl-sag~Dn~v~iWnv~tgea-------  166 (472)
T KOG0303|consen  100 GSEDTKVMVWQIPENGLTRDLTEPVVELYGH-QRRVGLVQW--HPTAPN--VLL-SAGSDNTVSIWNVGTGEA-------  166 (472)
T ss_pred             CCCCceEEEEECCCcccccCcccceEEEeec-ceeEEEEee--cccchh--hHh-hccCCceEEEEeccCCce-------
Confidence                  999998765       379999988 469999999  555444  355 566889999999977743       


Q ss_pred             CCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCC
Q 001070          255 ESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKK  297 (1165)
Q Consensus       255 ~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r  297 (1165)
                           +-||.         |.+.+.++..+.+|++++-+...|
T Consensus       167 -----li~l~---------hpd~i~S~sfn~dGs~l~TtckDK  195 (472)
T KOG0303|consen  167 -----LITLD---------HPDMVYSMSFNRDGSLLCTTCKDK  195 (472)
T ss_pred             -----eeecC---------CCCeEEEEEeccCCceeeeecccc
Confidence                 33433         788999999999999888776655


No 111
>KOG1332 consensus Vesicle coat complex COPII, subunit SEC13 [Intracellular trafficking, secretion, and vesicular transport]
Probab=97.70  E-value=6.4e-05  Score=82.31  Aligned_cols=87  Identities=22%  Similarity=0.441  Sum_probs=71.0

Q ss_pred             CceEEEeecCCcEEEEeCcchh----hHhhcCCcc------------------------EEEeecCCCc--eeEEecCCC
Q 001070          157 KHYVCYGLKGGNVRVLNLNTAT----RSLLRGHTK------------------------IKIWEDSKVA--PLIILKPHG  206 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~i----r~llrGH~q------------------------VriWD~~~g~--pl~~lephd  206 (1165)
                      |+.|||...||+|||+...+..    -..|+||+.                        |-||-...|.  -...+..|+
T Consensus        23 gkrlATcsSD~tVkIf~v~~n~~s~ll~~L~Gh~GPVwqv~wahPk~G~iLAScsYDgkVIiWke~~g~w~k~~e~~~h~  102 (299)
T KOG1332|consen   23 GKRLATCSSDGTVKIFEVRNNGQSKLLAELTGHSGPVWKVAWAHPKFGTILASCSYDGKVIIWKEENGRWTKAYEHAAHS  102 (299)
T ss_pred             cceeeeecCCccEEEEEEcCCCCceeeeEecCCCCCeeEEeecccccCcEeeEeecCceEEEEecCCCchhhhhhhhhhc
Confidence            7788899999999999998733    347999999                        8899888873  356666665


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGW  248 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~  248 (1165)
                      + +|+||+|  +|+.-+  ++++.|+.|.+|.+.+.....||
T Consensus       103 ~-SVNsV~w--apheyg--l~LacasSDG~vsvl~~~~~g~w  139 (299)
T KOG1332|consen  103 A-SVNSVAW--APHEYG--LLLACASSDGKVSVLTYDSSGGW  139 (299)
T ss_pred             c-cceeecc--cccccc--eEEEEeeCCCcEEEEEEcCCCCc
Confidence            4 9999999  888755  36778999999999999777555


No 112
>KOG0278 consensus Serine/threonine kinase receptor-associated protein [Lipid transport and metabolism]
Probab=97.69  E-value=8.2e-05  Score=81.65  Aligned_cols=117  Identities=18%  Similarity=0.325  Sum_probs=76.5

Q ss_pred             ecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      .+|-||.+..|||.=-+-+=.| .---+|.||..                      -||||.-+|--|+.|+ | -|-|-
T Consensus        27 p~g~flisa~kd~~pmlr~g~tgdwigtfeghkgavw~~~l~~na~~aasaaadftakvw~a~tgdelhsf~-h-khivk  104 (334)
T KOG0278|consen   27 PDGYFLISASKDGKPMLRNGDTGDWIGTFEGHKGAVWSATLNKNATRAASAAADFTAKVWDAVTGDELHSFE-H-KHIVK  104 (334)
T ss_pred             CCceEEEEeccCCCchhccCCCCCcEEeeeccCcceeeeecCchhhhhhhhcccchhhhhhhhhhhhhhhhh-h-hheee
Confidence            4566777777877655555555 55557777777                      5677776665555554 1 24555


Q ss_pred             eeEee--------------------cCCC-------------------CCCceEEEeecCCCceEEEeEccCcCCCCCCC
Q 001070          212 SAQYL--------------------TAPN-------------------QAGHIILVTAGPLNREVKLWASASEEGWSLPT  252 (1165)
Q Consensus       212 SVaFl--------------------~aP~-------------------~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~  252 (1165)
                      +|||.                    ..|+                   ..|+. ++ |..-|++|+|||+.++       
T Consensus       105 ~~af~~ds~~lltgg~ekllrvfdln~p~App~E~~ghtg~Ir~v~wc~eD~~-iL-SSadd~tVRLWD~rTg-------  175 (334)
T KOG0278|consen  105 AVAFSQDSNYLLTGGQEKLLRVFDLNRPKAPPKEISGHTGGIRTVLWCHEDKC-IL-SSADDKTVRLWDHRTG-------  175 (334)
T ss_pred             eEEecccchhhhccchHHHhhhhhccCCCCCchhhcCCCCcceeEEEeccCce-EE-eeccCCceEEEEeccC-------
Confidence            55551                    1121                   12333 34 4489999999999665       


Q ss_pred             CCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          253 HAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       253 ~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                           +-+|+|+|.+..         .+.-+++++.+|..|+..
T Consensus       176 -----t~v~sL~~~s~V---------tSlEvs~dG~ilTia~gs  205 (334)
T KOG0278|consen  176 -----TEVQSLEFNSPV---------TSLEVSQDGRILTIAYGS  205 (334)
T ss_pred             -----cEEEEEecCCCC---------cceeeccCCCEEEEecCc
Confidence                 899999996543         366678888888887765


No 113
>KOG2139 consensus WD40 repeat protein [General function prediction only]
Probab=97.66  E-value=0.00033  Score=80.09  Aligned_cols=152  Identities=22%  Similarity=0.331  Sum_probs=107.5

Q ss_pred             cccccEeeecCceEEE--eecCCcEEEEeCcchhhHhhcCCcc-----------------------EEEeecCC-C----
Q 001070          147 LLIGRQIAVNKHYVCY--GLKGGNVRVLNLNTATRSLLRGHTK-----------------------IKIWEDSK-V----  196 (1165)
Q Consensus       147 ~~~GR~IAVn~~yIay--G~kdg~IRVwdi~t~ir~llrGH~q-----------------------VriWD~~~-g----  196 (1165)
                      ..+-|-+|=+-++||.  ++-|-.|||+|-+...-..|+.-.|                       |-||.+.. +    
T Consensus        98 ~~dlr~~aWhqH~~~fava~nddvVriy~ksst~pt~Lks~sQrnvtclawRPlsaselavgCr~gIciW~~s~tln~~r  177 (445)
T KOG2139|consen   98 EIDLRGVAWHQHIIAFAVATNDDVVRIYDKSSTCPTKLKSVSQRNVTCLAWRPLSASELAVGCRAGICIWSDSRTLNANR  177 (445)
T ss_pred             hcceeeEeechhhhhhhhhccCcEEEEeccCCCCCceecchhhcceeEEEeccCCcceeeeeecceeEEEEcCccccccc
Confidence            3456778888888776  7889999999998766666666666                       89997632 2    


Q ss_pred             -------ceeEEecCCCCC-CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCC-------------C-
Q 001070          197 -------APLIILKPHGGQ-PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTH-------------A-  254 (1165)
Q Consensus       197 -------~pl~~lephdG~-sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~-------------~-  254 (1165)
                             .++++++.. || +|.|+.+  ++||   -.|+++...++.|.|||.+.+.+.-++--             + 
T Consensus       178 ~~~~~s~~~~qvl~~p-gh~pVtsmqw--n~dg---t~l~tAS~gsssi~iWdpdtg~~~pL~~~glgg~slLkwSPdgd  251 (445)
T KOG2139|consen  178 NIRMMSTHHLQVLQDP-GHNPVTSMQW--NEDG---TILVTASFGSSSIMIWDPDTGQKIPLIPKGLGGFSLLKWSPDGD  251 (445)
T ss_pred             ccccccccchhheeCC-CCceeeEEEE--cCCC---CEEeecccCcceEEEEcCCCCCcccccccCCCceeeEEEcCCCC
Confidence                   246666644 55 9999999  5554   44999999999999999988765433310             0 


Q ss_pred             -----------CCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          255 -----------ESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       255 -----------~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                                 ..|.|.|+-.-  +.-.-+.. .+-..+-+|+|++||.+......||-+|+.-
T Consensus       252 ~lfaAt~davfrlw~e~q~wt~--erw~lgsg-rvqtacWspcGsfLLf~~sgsp~lysl~f~~  312 (445)
T KOG2139|consen  252 VLFAATCDAVFRLWQENQSWTK--ERWILGSG-RVQTACWSPCGSFLLFACSGSPRLYSLTFDG  312 (445)
T ss_pred             EEEEecccceeeeehhccccee--cceeccCC-ceeeeeecCCCCEEEEEEcCCceEEEEeecC
Confidence                       13555554331  11111222 5555678999999999999999999999984


No 114
>KOG4328 consensus WD40 protein [Function unknown]
Probab=97.66  E-value=0.0002  Score=83.47  Aligned_cols=137  Identities=20%  Similarity=0.276  Sum_probs=94.7

Q ss_pred             ccccccEeee------cCceEEEeecCCcEEEEeCcc-----hhhHhhcCCcc---------------------------
Q 001070          146 ELLIGRQIAV------NKHYVCYGLKGGNVRVLNLNT-----ATRSLLRGHTK---------------------------  187 (1165)
Q Consensus       146 ~~~~GR~IAV------n~~yIayG~kdg~IRVwdi~t-----~ir~llrGH~q---------------------------  187 (1165)
                      ....||-.++      |.+.|+.|.|-|+|=+||..+     .--.+|.+|++                           
T Consensus       183 kv~~~Rit~l~fHPt~~~~lva~GdK~G~VG~Wn~~~~~~d~d~v~~f~~hs~~Vs~l~F~P~n~s~i~ssSyDGtiR~~  262 (498)
T KOG4328|consen  183 KVTDRRITSLAFHPTENRKLVAVGDKGGQVGLWNFGTQEKDKDGVYLFTPHSGPVSGLKFSPANTSQIYSSSYDGTIRLQ  262 (498)
T ss_pred             EecccceEEEEecccCcceEEEEccCCCcEEEEecCCCCCccCceEEeccCCccccceEecCCChhheeeeccCceeeee
Confidence            3344554444      579999999999999999954     22238999988                           


Q ss_pred             ----------------------------------------EEEeecCCCc-eeEEecCCCCCCcceeEeecCCCCCCceE
Q 001070          188 ----------------------------------------IKIWEDSKVA-PLIILKPHGGQPVNSAQYLTAPNQAGHII  226 (1165)
Q Consensus       188 ----------------------------------------VriWD~~~g~-pl~~lephdG~sV~SVaFl~aP~~~d~~~  226 (1165)
                                                              .-+||.+++. -++-|+-|+ ..|.+|+|  .|-.+.   
T Consensus       263 D~~~~i~e~v~s~~~d~~~fs~~d~~~e~~~vl~~~~~G~f~~iD~R~~~s~~~~~~lh~-kKI~sv~~--NP~~p~---  336 (498)
T KOG4328|consen  263 DFEGNISEEVLSLDTDNIWFSSLDFSAESRSVLFGDNVGNFNVIDLRTDGSEYENLRLHK-KKITSVAL--NPVCPW---  336 (498)
T ss_pred             eecchhhHHHhhcCccceeeeeccccCCCccEEEeecccceEEEEeecCCccchhhhhhh-cccceeec--CCCCch---
Confidence                                                    4577776542 366666665 48999999  666654   


Q ss_pred             EEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEe
Q 001070          227 LVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       227 lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl  305 (1165)
                      ++++|++|+|.||||+-.=.+       +.-.-+-|++         |..-++++.++|+++- ||.+-..+.|-++-.
T Consensus       337 ~laT~s~D~T~kIWD~R~l~~-------K~sp~lst~~---------HrrsV~sAyFSPs~gt-l~TT~~D~~IRv~ds  398 (498)
T KOG4328|consen  337 FLATASLDQTAKIWDLRQLRG-------KASPFLSTLP---------HRRSVNSAYFSPSGGT-LLTTCQDNEIRVFDS  398 (498)
T ss_pred             heeecccCcceeeeehhhhcC-------CCCcceeccc---------ccceeeeeEEcCCCCc-eEeeccCCceEEeec
Confidence            555699999999999833211       1101344444         7888999999999999 666666666655533


No 115
>KOG0288 consensus WD40 repeat protein TipD [General function prediction only]
Probab=97.66  E-value=3.8e-05  Score=88.44  Aligned_cols=93  Identities=23%  Similarity=0.361  Sum_probs=74.6

Q ss_pred             cCceEEEeecCCcEEEEeCcc-h--hhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-A--TRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPV  210 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~--ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV  210 (1165)
                      |.--+++|.-|..|.+||... .  ....|.|--.                      +|+|++..+..+++|.+|. +.|
T Consensus       186 ~sdtlatgg~Dr~Ik~W~v~~~k~~~~~tLaGs~g~it~~d~d~~~~~~iAas~d~~~r~Wnvd~~r~~~TLsGHt-dkV  264 (459)
T KOG0288|consen  186 NSDTLATGGSDRIIKLWNVLGEKSELISTLAGSLGNITSIDFDSDNKHVIAASNDKNLRLWNVDSLRLRHTLSGHT-DKV  264 (459)
T ss_pred             CcchhhhcchhhhhhhhhcccchhhhhhhhhccCCCcceeeecCCCceEEeecCCCceeeeeccchhhhhhhcccc-cce
Confidence            335678999999999999986 3  5557776633                      9999999999999999985 589


Q ss_pred             ceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          211 NSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      .++-|.     .++- .|++|+.||+||+||+...            .|..|+-+.+
T Consensus       265 t~ak~~-----~~~~-~vVsgs~DRtiK~WDl~k~------------~C~kt~l~~S  303 (459)
T KOG0288|consen  265 TAAKFK-----LSHS-RVVSGSADRTIKLWDLQKA------------YCSKTVLPGS  303 (459)
T ss_pred             eeehhh-----cccc-ceeeccccchhhhhhhhhh------------heeccccccc
Confidence            999995     3322 2678999999999999554            8999988743


No 116
>KOG1063 consensus RNA polymerase II elongator complex, subunit ELP2, WD repeat superfamily [Chromatin structure and dynamics; Transcription]
Probab=97.63  E-value=0.00016  Score=87.51  Aligned_cols=137  Identities=18%  Similarity=0.250  Sum_probs=95.8

Q ss_pred             eEEEeecCCcEEEEeCc-c--hhhHhhcCCcc--------------------EEEeecCCC---c---------------
Q 001070          159 YVCYGLKGGNVRVLNLN-T--ATRSLLRGHTK--------------------IKIWEDSKV---A---------------  197 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~-t--~ir~llrGH~q--------------------VriWD~~~g---~---------------  197 (1165)
                      |+++|..||+|++|-+. .  .....|.||+.                    |++||.+.-   +               
T Consensus        71 ~~vsG~sD~~v~lW~l~~~~~~~i~~~~g~~~~~~cv~a~~~~~~~~~ad~~v~vw~~~~~e~~~~~~~rf~~k~~ipLc  150 (764)
T KOG1063|consen   71 EMVSGDSDGRVILWKLRDEYLIKIYTIQGHCKECVCVVARSSVMTCKAADGTVSVWDKQQDEVFLLAVLRFEIKEAIPLC  150 (764)
T ss_pred             eEEEccCCCcEEEEEEeehheEEEEeecCcceeEEEEEeeeeEEEeeccCceEEEeecCCCceeeehheehhhhhHhhHH
Confidence            89999999999999988 3  22236778877                    889987221   0               


Q ss_pred             --------------------------------eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          198 --------------------------------PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       198 --------------------------------pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                                                      -+..+++| +++|-|++|  +--+.+.. +|+|||+|+.||||.+...
T Consensus       151 L~~~~~~~~~lla~Ggs~~~v~~~s~~~d~f~~v~el~GH-~DWIrsl~f--~~~~~~~~-~laS~SQD~yIRiW~i~~~  226 (764)
T KOG1063|consen  151 LAALKNNKTFLLACGGSKFVVDLYSSSADSFARVAELEGH-TDWIRSLAF--ARLGGDDL-LLASSSQDRYIRIWRIVLG  226 (764)
T ss_pred             HhhhccCCcEEEEecCcceEEEEeccCCcceeEEEEeecc-chhhhhhhh--hccCCCcE-EEEecCCceEEEEEEEEec
Confidence                                            15667777 579999999  33333434 7779999999999998543


Q ss_pred             C--C-------CCCCCCCCCcceEEEEeccCC--CCCccccccEEEEEeecCCcEEEEeccCCCc
Q 001070          246 E--G-------WSLPTHAESWKCTQTLDLKSS--AKPRVEEAFFNQVVVLSQAGLLLFANAKKNA  299 (1165)
Q Consensus       246 ~--~-------~~~~~~~~~w~C~QTLe~~~s--~~~~~~~aff~sV~~~p~a~~ilLan~~r~a  299 (1165)
                      .  +       -..+++.....|.-++.+.-+  +-.-||+|.+++|.-+|.+.-||-|.+.+--
T Consensus       227 ~~~~~~~~e~~~t~~~~~~~f~~l~~i~~~is~eall~GHeDWV~sv~W~p~~~~LLSASaDksm  291 (764)
T KOG1063|consen  227 DDEDSNEREDSLTTLSNLPVFMILEEIQYRISFEALLMGHEDWVYSVWWHPEGLDLLSASADKSM  291 (764)
T ss_pred             CCccccccccccccccCCceeeeeeeEEEEEehhhhhcCcccceEEEEEccchhhheecccCcce
Confidence            2  1       112233345678777775443  3334899999999999999777777666543


No 117
>KOG0645 consensus WD40 repeat protein [General function prediction only]
Probab=97.61  E-value=0.00037  Score=77.33  Aligned_cols=132  Identities=17%  Similarity=0.276  Sum_probs=93.6

Q ss_pred             ccE--eeec---CceEEEeecCCcEEEEeCcc----hhhH-hhcCCcc----------------------EEEeecCCC-
Q 001070          150 GRQ--IAVN---KHYVCYGLKGGNVRVLNLNT----ATRS-LLRGHTK----------------------IKIWEDSKV-  196 (1165)
Q Consensus       150 GR~--IAVn---~~yIayG~kdg~IRVwdi~t----~ir~-llrGH~q----------------------VriWD~~~g-  196 (1165)
                      ||-  +|.+   |..||+|..|+.||||+...    ..|. |=.||+.                      +-||....+ 
T Consensus        15 ~r~W~~awhp~~g~ilAscg~Dk~vriw~~~~~~s~~ck~vld~~hkrsVRsvAwsp~g~~La~aSFD~t~~Iw~k~~~e   94 (312)
T KOG0645|consen   15 DRVWSVAWHPGKGVILASCGTDKAVRIWSTSSGDSWTCKTVLDDGHKRSVRSVAWSPHGRYLASASFDATVVIWKKEDGE   94 (312)
T ss_pred             CcEEEEEeccCCceEEEeecCCceEEEEecCCCCcEEEEEeccccchheeeeeeecCCCcEEEEeeccceEEEeecCCCc
Confidence            454  6666   33899999999999999992    4444 3345655                      678877665 


Q ss_pred             -ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccc
Q 001070          197 -APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEE  275 (1165)
Q Consensus       197 -~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~  275 (1165)
                       .++.++|+|+ +-|-||+|.  +   ++.+|. ..+-||.+-||+.+.+         +-..|.--|+.|        .
T Consensus        95 fecv~~lEGHE-nEVK~Vaws--~---sG~~LA-TCSRDKSVWiWe~ded---------dEfec~aVL~~H--------t  150 (312)
T KOG0645|consen   95 FECVATLEGHE-NEVKCVAWS--A---SGNYLA-TCSRDKSVWIWEIDED---------DEFECIAVLQEH--------T  150 (312)
T ss_pred             eeEEeeeeccc-cceeEEEEc--C---CCCEEE-EeeCCCeEEEEEecCC---------CcEEEEeeeccc--------c
Confidence             4699999996 589999993  4   445466 5899999999999744         346999999853        3


Q ss_pred             ccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          276 AFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       276 aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      -=+-+|+-+|.-.+|+ +..+-|.|-+..-+
T Consensus       151 qDVK~V~WHPt~dlL~-S~SYDnTIk~~~~~  180 (312)
T KOG0645|consen  151 QDVKHVIWHPTEDLLF-SCSYDNTIKVYRDE  180 (312)
T ss_pred             ccccEEEEcCCcceeE-EeccCCeEEEEeec
Confidence            3344788888777654 44445666554444


No 118
>KOG1332 consensus Vesicle coat complex COPII, subunit SEC13 [Intracellular trafficking, secretion, and vesicular transport]
Probab=97.60  E-value=0.00025  Score=77.79  Aligned_cols=125  Identities=21%  Similarity=0.287  Sum_probs=94.2

Q ss_pred             CceEEEeecCCcEEEEeCcc----hhhHhhcCCcc------------------------------------EEEeecCCC
Q 001070          157 KHYVCYGLKGGNVRVLNLNT----ATRSLLRGHTK------------------------------------IKIWEDSKV  196 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t----~ir~llrGH~q------------------------------------VriWD~~~g  196 (1165)
                      |-.|+.|+.||.|+|+++++    .-..+..-|+.                                    ||||+...+
T Consensus       116 gl~LacasSDG~vsvl~~~~~g~w~t~ki~~aH~~GvnsVswapa~~~g~~~~~~~~~~~krlvSgGcDn~VkiW~~~~~  195 (299)
T KOG1332|consen  116 GLLLACASSDGKVSVLTYDSSGGWTTSKIVFAHEIGVNSVSWAPASAPGSLVDQGPAAKVKRLVSGGCDNLVKIWKFDSD  195 (299)
T ss_pred             ceEEEEeeCCCcEEEEEEcCCCCccchhhhhccccccceeeecCcCCCccccccCcccccceeeccCCccceeeeecCCc
Confidence            45577899999999999986    34557888887                                    999998876


Q ss_pred             ce-eE-EecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          197 AP-LI-ILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       197 ~p-l~-~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      .= ++ +|+.|. +.|..||+  +|.-...++.|+|+|+|+++-||-.. .+       .+.|+-+---+|         
T Consensus       196 ~w~~e~~l~~H~-dwVRDVAw--aP~~gl~~s~iAS~SqDg~viIwt~~-~e-------~e~wk~tll~~f---------  255 (299)
T KOG1332|consen  196 SWKLERTLEGHK-DWVRDVAW--APSVGLPKSTIASCSQDGTVIIWTKD-EE-------YEPWKKTLLEEF---------  255 (299)
T ss_pred             chhhhhhhhhcc-hhhhhhhh--ccccCCCceeeEEecCCCcEEEEEec-Cc-------cCcccccccccC---------
Confidence            31 33 488885 49999999  79888888899999999999999986 32       255665433333         


Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEE
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYS  302 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYa  302 (1165)
                      .+.+-+|.-++.|.+|-|+.-. |.||.
T Consensus       256 ~~~~w~vSWS~sGn~LaVs~Gd-Nkvtl  282 (299)
T KOG1332|consen  256 PDVVWRVSWSLSGNILAVSGGD-NKVTL  282 (299)
T ss_pred             CcceEEEEEeccccEEEEecCC-cEEEE
Confidence            3555688889999988888765 33443


No 119
>KOG1407 consensus WD40 repeat protein [Function unknown]
Probab=97.58  E-value=0.0008  Score=74.51  Aligned_cols=136  Identities=17%  Similarity=0.278  Sum_probs=92.1

Q ss_pred             eee--cCceEEEeecCCcEEEEeCcc---hhhHhhcCCcc-----------------------EEEeecCCCceeEEecC
Q 001070          153 IAV--NKHYVCYGLKGGNVRVLNLNT---ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAV--n~~yIayG~kdg~IRVwdi~t---~ir~llrGH~q-----------------------VriWD~~~g~pl~~lep  204 (1165)
                      ||-  ||.+|+.|+-|+.++|||+..   ......+||+.                       |||||++.+.|.++.+-
T Consensus        26 v~wn~~g~~lasgs~dktv~v~n~e~~r~~~~~~~~gh~~svdql~w~~~~~d~~atas~dk~ir~wd~r~~k~~~~i~~  105 (313)
T KOG1407|consen   26 VAWNCDGTKLASGSFDKTVSVWNLERDRFRKELVYRGHTDSVDQLCWDPKHPDLFATASGDKTIRIWDIRSGKCTARIET  105 (313)
T ss_pred             EEEcccCceeeecccCCceEEEEecchhhhhhhcccCCCcchhhheeCCCCCcceEEecCCceEEEEEeccCcEEEEeec
Confidence            444  599999999999999999997   33347899995                       99999999999888876


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC--------------cCCCCCCCCC---C-CcceEEEEecc
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS--------------EEGWSLPTHA---E-SWKCTQTLDLK  266 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~--------------~~~~~~~~~~---~-~w~C~QTLe~~  266 (1165)
                      - |+-++ ++|  .|+|..   .++ |..|..|-..|...              +.-|-.+.+-   . +--|++-|.++
T Consensus       106 ~-~eni~-i~w--sp~g~~---~~~-~~kdD~it~id~r~~~~~~~~~~~~e~ne~~w~~~nd~Fflt~GlG~v~ILsyp  177 (313)
T KOG1407|consen  106 K-GENIN-ITW--SPDGEY---IAV-GNKDDRITFIDARTYKIVNEEQFKFEVNEISWNNSNDLFFLTNGLGCVEILSYP  177 (313)
T ss_pred             c-CcceE-EEE--cCCCCE---EEE-ecCcccEEEEEecccceeehhcccceeeeeeecCCCCEEEEecCCceEEEEecc
Confidence            5 44444 334  354433   454 55666666666532              1223322221   1 23699999987


Q ss_pred             CCC---CCccccccEEEEEeecCCcEEEEeccC
Q 001070          267 SSA---KPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       267 ~s~---~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      +..   ..+.|.+=+.-+.++|+|+++-...+.
T Consensus       178 sLkpv~si~AH~snCicI~f~p~GryfA~GsAD  210 (313)
T KOG1407|consen  178 SLKPVQSIKAHPSNCICIEFDPDGRYFATGSAD  210 (313)
T ss_pred             ccccccccccCCcceEEEEECCCCceEeecccc
Confidence            543   234566767778899999988776554


No 120
>PF08662 eIF2A:  Eukaryotic translation initiation factor eIF2A;  InterPro: IPR013979  This entry contains beta propellor domains found in eukaryotic translation initiation factors and TolB domain-containing proteins. 
Probab=97.55  E-value=0.00028  Score=74.64  Aligned_cols=119  Identities=18%  Similarity=0.342  Sum_probs=83.3

Q ss_pred             ceeecCCceEEecccCCCCCCCCCCcc-cccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCC
Q 001070          108 GKRVFGDYVAYDVDAVEEGREPTQQLE-VNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGH  185 (1165)
Q Consensus       108 Gr~l~g~~~~~dVd~~~~ge~~~pqle-v~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH  185 (1165)
                      |+..-|...+|-++.... ....=+++ -.||....|+|   .|+.+||     +||..++.|++||++. .+..+-.++
T Consensus        32 ~ks~~~~~~l~~~~~~~~-~~~~i~l~~~~~I~~~~WsP---~g~~fav-----i~g~~~~~v~lyd~~~~~i~~~~~~~  102 (194)
T PF08662_consen   32 GKSYYGEFELFYLNEKNI-PVESIELKKEGPIHDVAWSP---NGNEFAV-----IYGSMPAKVTLYDVKGKKIFSFGTQP  102 (194)
T ss_pred             cceEEeeEEEEEEecCCC-ccceeeccCCCceEEEEECc---CCCEEEE-----EEccCCcccEEEcCcccEeEeecCCC
Confidence            444456777888866432 22201332 23788888888   5888886     8998899999999986 444333222


Q ss_pred             cc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecC-----CCceEE
Q 001070          186 TK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGP-----LNREVK  238 (1165)
Q Consensus       186 ~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGs-----lnrtIK  238 (1165)
                      -.                      |+|||+++...+..++-+   .+..++|.     |++++++|+.+     .|..+|
T Consensus       103 ~n~i~wsP~G~~l~~~g~~n~~G~l~~wd~~~~~~i~~~~~~---~~t~~~Ws-----PdGr~~~ta~t~~r~~~dng~~  174 (194)
T PF08662_consen  103 RNTISWSPDGRFLVLAGFGNLNGDLEFWDVRKKKKISTFEHS---DATDVEWS-----PDGRYLATATTSPRLRVDNGFK  174 (194)
T ss_pred             ceEEEECCCCCEEEEEEccCCCcEEEEEECCCCEEeeccccC---cEEEEEEc-----CCCCEEEEEEeccceeccccEE
Confidence            22                      899999998888877633   47899994     55567888877     499999


Q ss_pred             EeEcc
Q 001070          239 LWASA  243 (1165)
Q Consensus       239 LW~~a  243 (1165)
                      ||+..
T Consensus       175 Iw~~~  179 (194)
T PF08662_consen  175 IWSFQ  179 (194)
T ss_pred             EEEec
Confidence            99984


No 121
>KOG1274 consensus WD40 repeat protein [General function prediction only]
Probab=97.55  E-value=0.00028  Score=87.54  Aligned_cols=135  Identities=15%  Similarity=0.258  Sum_probs=89.2

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      ||+-+..++....++++|+| +|-+|.|  .|++   .||+ +.+-|..|++|++..+            .|..||.+..
T Consensus       120 vK~~~~~D~s~~~~lrgh~a-pVl~l~~--~p~~---~fLA-vss~dG~v~iw~~~~~------------~~~~tl~~v~  180 (933)
T KOG1274|consen  120 VKLLNLDDSSQEKVLRGHDA-PVLQLSY--DPKG---NFLA-VSSCDGKVQIWDLQDG------------ILSKTLTGVD  180 (933)
T ss_pred             EEEEeccccchheeecccCC-ceeeeeE--cCCC---CEEE-EEecCceEEEEEcccc------------hhhhhcccCC
Confidence            78887777777899999987 9999999  4555   5455 6789999999999655            8888888644


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeee-ccCCCCc------
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTG-TIDPPSE------  340 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~-~~d~~ge------  340 (1165)
                      ....-.....+..++-+|+++-+++...+. -|-.    |..+.-...|+|-..+.-+.    |+. ++.|.|.      
T Consensus       181 k~n~~~~s~i~~~~aW~Pk~g~la~~~~d~-~Vkv----y~r~~we~~f~Lr~~~~ss~----~~~~~wsPnG~YiAAs~  251 (933)
T KOG1274|consen  181 KDNEFILSRICTRLAWHPKGGTLAVPPVDN-TVKV----YSRKGWELQFKLRDKLSSSK----FSDLQWSPNGKYIAAST  251 (933)
T ss_pred             ccccccccceeeeeeecCCCCeEEeeccCC-eEEE----EccCCceeheeecccccccc----eEEEEEcCCCcEEeeec
Confidence            332111245788999999988666655543 2222    23333345566655555443    222 3445443      


Q ss_pred             --ceEEEEEeeh
Q 001070          341 --HIIKLYCVQT  350 (1165)
Q Consensus       341 --~~vq~yCvQt  350 (1165)
                        +.|-|+-|+|
T Consensus       252 ~~g~I~vWnv~t  263 (933)
T KOG1274|consen  252 LDGQILVWNVDT  263 (933)
T ss_pred             cCCcEEEEeccc
Confidence              4577888887


No 122
>KOG0264 consensus Nucleosome remodeling factor, subunit CAF1/NURF55/MSI1 [Chromatin structure and dynamics]
Probab=97.54  E-value=0.00043  Score=80.57  Aligned_cols=136  Identities=13%  Similarity=0.199  Sum_probs=99.6

Q ss_pred             CceEEEeecCCcEEEEeCc--c-hhhHhhcCCcc-----------------------EEEeecCCC-ceeEEecCCCCCC
Q 001070          157 KHYVCYGLKGGNVRVLNLN--T-ATRSLLRGHTK-----------------------IKIWEDSKV-APLIILKPHGGQP  209 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~--t-~ir~llrGH~q-----------------------VriWD~~~g-~pl~~lephdG~s  209 (1165)
                      ....|+...|+..-|||+.  + ..++.-.+|+.                       |++||.|+- .|++.+++|+ ..
T Consensus       240 ~~lF~sv~dd~~L~iwD~R~~~~~~~~~~~ah~~~vn~~~fnp~~~~ilAT~S~D~tV~LwDlRnL~~~lh~~e~H~-de  318 (422)
T KOG0264|consen  240 EDLFGSVGDDGKLMIWDTRSNTSKPSHSVKAHSAEVNCVAFNPFNEFILATGSADKTVALWDLRNLNKPLHTFEGHE-DE  318 (422)
T ss_pred             hhhheeecCCCeEEEEEcCCCCCCCcccccccCCceeEEEeCCCCCceEEeccCCCcEEEeechhcccCceeccCCC-cc
Confidence            5566778899999999999  4 77778999998                       999999986 5899999994 59


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcE
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGL  289 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~  289 (1165)
                      |+.|.|  +|+.-.   +++|...||.+.+||+..-..-..+.+.+.+.-  .|-|    ...||.+-++-+.-+|.--|
T Consensus       319 v~~V~W--SPh~et---vLASSg~D~rl~vWDls~ig~eq~~eda~dgpp--EllF----~HgGH~~kV~DfsWnp~ePW  387 (422)
T KOG0264|consen  319 VFQVEW--SPHNET---VLASSGTDRRLNVWDLSRIGEEQSPEDAEDGPP--ELLF----IHGGHTAKVSDFSWNPNEPW  387 (422)
T ss_pred             eEEEEe--CCCCCc---eeEecccCCcEEEEeccccccccChhhhccCCc--ceeE----EecCcccccccccCCCCCCe
Confidence            999999  677655   455556999999999955422111111111100  0111    22478888888889999999


Q ss_pred             EEEeccCCCcEEEEE
Q 001070          290 LLFANAKKNAIYSVH  304 (1165)
Q Consensus       290 ilLan~~r~aIYalh  304 (1165)
                      ++.+-+.-|.+-+-.
T Consensus       388 ~I~SvaeDN~LqIW~  402 (422)
T KOG0264|consen  388 TIASVAEDNILQIWQ  402 (422)
T ss_pred             EEEEecCCceEEEee
Confidence            999998887665543


No 123
>KOG1445 consensus Tumor-specific antigen (contains WD repeats) [Cytoskeleton]
Probab=97.53  E-value=0.00036  Score=83.69  Aligned_cols=172  Identities=22%  Similarity=0.350  Sum_probs=119.4

Q ss_pred             EEEeecCCcEEEEeCcchhh-HhhcCCcc----------------------EEEeecCC-CceeEEecCCCCCCcceeEe
Q 001070          160 VCYGLKGGNVRVLNLNTATR-SLLRGHTK----------------------IKIWEDSK-VAPLIILKPHGGQPVNSAQY  215 (1165)
Q Consensus       160 IayG~kdg~IRVwdi~t~ir-~llrGH~q----------------------VriWD~~~-g~pl~~lephdG~sV~SVaF  215 (1165)
                      |.|...-|.+.||||.|..- --|.||..                      |||+|-+. +.|++..++|.|-.=..|+|
T Consensus       143 il~s~a~g~v~i~D~stqk~~~el~~h~d~vQSa~WseDG~llatscKdkqirifDPRa~~~piQ~te~H~~~rdsRv~w  222 (1012)
T KOG1445|consen  143 ILASGAHGSVYITDISTQKTAVELSGHTDKVQSADWSEDGKLLATSCKDKQIRIFDPRASMEPIQTTEGHGGMRDSRVLW  222 (1012)
T ss_pred             eEEeccCceEEEEEcccCceeecccCCchhhhccccccCCceEeeecCCcceEEeCCccCCCccccccccccchhheeee
Confidence            44555579999999999433 36889987                      99999885 67999999998877778999


Q ss_pred             ecCCCCCCceEEEeecCC---CceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEE
Q 001070          216 LTAPNQAGHIILVTAGPL---NREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF  292 (1165)
Q Consensus       216 l~aP~~~d~~~lvtsGsl---nrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL  292 (1165)
                      +     +.|..||+.|-.   -|++++||.   +.|        ..-+.||+|.++.       =++-=.+|||+++|+|
T Consensus       223 ~-----Gn~~rlisTGF~~~R~reV~~~Dt---r~f--------~~p~~tleld~st-------GvLiPl~DpDt~llfL  279 (1012)
T KOG1445|consen  223 A-----GNWERLISTGFTTKRIREVRAYDT---RKF--------GAPVHTLELDSST-------GVLIPLYDPDTRLLFL  279 (1012)
T ss_pred             c-----cchhhhhhcccchhhheeeeeeec---ccc--------CCcceeEEeeccc-------ceEeeeecCCCceEEE
Confidence            7     666668887754   378999996   333        2446788875544       1334468999999999


Q ss_pred             eccCCCcEEEEEeecCCCccccccccccc-cccccceeeeeeccCC-------CCcc-----------eEEEEEeehhhh
Q 001070          293 ANAKKNAIYSVHLGYGNNSAATRIDYIAE-FTVTMPVLSFTGTIDP-------PSEH-----------IIKLYCVQTQAI  353 (1165)
Q Consensus       293 an~~r~aIYalhl~~g~~~~~~r~dyiae-F~v~~PILSft~~~d~-------~ge~-----------~vq~yCvQtqAI  353 (1165)
                      |.---+.||.+++-.       |--|+.+ |.++-+=--..++--+       |||.           +=-+|-|=.++.
T Consensus       280 aGKG~~~l~~lE~~d-------~qPyLs~v~~~tle~~~~GA~lvpkral~VM~~EV~rvlQLt~~~ivPi~y~VPRksy  352 (1012)
T KOG1445|consen  280 AGKGTNKLFMLEMQD-------RQPYLSHVFELTLEEQTLGATLVPKRALHVMDGEVDRVLQLTKSSIVPIPYIVPRKSY  352 (1012)
T ss_pred             ecCCcceEEEEEecC-------CCcchhhhhhhcchhhhccceecchhhhhhcchhhhhheecccCceeecccccchhhh
Confidence            999999999999874       3334443 2222221112221111       4553           234577888888


Q ss_pred             hhhccccc
Q 001070          354 QQYSLNLF  361 (1165)
Q Consensus       354 Qqy~l~~~  361 (1165)
                      -.+|-|+.
T Consensus       353 rdFH~DLf  360 (1012)
T KOG1445|consen  353 RDFHSDLF  360 (1012)
T ss_pred             hhhhhhhC
Confidence            88888875


No 124
>KOG0646 consensus WD40 repeat protein [General function prediction only]
Probab=97.52  E-value=0.00015  Score=84.53  Aligned_cols=95  Identities=23%  Similarity=0.356  Sum_probs=71.8

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcc----------hhhHhhcCCcc------------------------EEEeecCCCc
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNT----------ATRSLLRGHTK------------------------IKIWEDSKVA  197 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t----------~ir~llrGH~q------------------------VriWD~~~g~  197 (1165)
                      .|.-||+||.+|.+||.|+||++..          .-++.|.+|+-                        +|+||+..|.
T Consensus       130 ~fs~dgs~iiTgskDg~V~vW~l~~lv~a~~~~~~~p~~~f~~HtlsITDl~ig~Gg~~~rl~TaS~D~t~k~wdlS~g~  209 (476)
T KOG0646|consen  130 KFSDDGSHIITGSKDGAVLVWLLTDLVSADNDHSVKPLHIFSDHTLSITDLQIGSGGTNARLYTASEDRTIKLWDLSLGV  209 (476)
T ss_pred             EEeCCCcEEEecCCCccEEEEEEEeecccccCCCccceeeeccCcceeEEEEecCCCccceEEEecCCceEEEEEeccce
Confidence            3667999999999999999999864          33457888876                        9999987763


Q ss_pred             e---------------------------------------------------------eEEecCCCC-CCcceeEeecCC
Q 001070          198 P---------------------------------------------------------LIILKPHGG-QPVNSAQYLTAP  219 (1165)
Q Consensus       198 p---------------------------------------------------------l~~lephdG-~sV~SVaFl~aP  219 (1165)
                      .                                                         +..+.+|.| ..|.+++..   
T Consensus       210 LLlti~fp~si~av~lDpae~~~yiGt~~G~I~~~~~~~~~~~~~~v~~k~~~~~~t~~~~~~Gh~~~~~ITcLais---  286 (476)
T KOG0646|consen  210 LLLTITFPSSIKAVALDPAERVVYIGTEEGKIFQNLLFKLSGQSAGVNQKGRHEENTQINVLVGHENESAITCLAIS---  286 (476)
T ss_pred             eeEEEecCCcceeEEEcccccEEEecCCcceEEeeehhcCCcccccccccccccccceeeeeccccCCcceeEEEEe---
Confidence            1                                                         233444443 377777774   


Q ss_pred             CCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          220 NQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       220 ~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                        .|+- |+.||+-|..+.+||..+.            .|++|+.
T Consensus       287 --~Dgt-lLlSGd~dg~VcvWdi~S~------------Q~iRtl~  316 (476)
T KOG0646|consen  287 --TDGT-LLLSGDEDGKVCVWDIYSK------------QCIRTLQ  316 (476)
T ss_pred             --cCcc-EEEeeCCCCCEEEEecchH------------HHHHHHh
Confidence              4555 5558999999999998554            8999988


No 125
>KOG0973 consensus Histone transcription regulator HIRA, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning; Transcription]
Probab=97.52  E-value=0.00029  Score=88.47  Aligned_cols=121  Identities=18%  Similarity=0.260  Sum_probs=86.7

Q ss_pred             cCceEEEee--cCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCC
Q 001070          156 NKHYVCYGL--KGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPL  233 (1165)
Q Consensus       156 n~~yIayG~--kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsl  233 (1165)
                      ||+-+|||.  -||.||||++..-.+...       -||..--.+|-...-|+| +|++|-|  +|||..    +++|+-
T Consensus        24 dg~~~aTgGq~~d~~~~iW~~~~vl~~~~-------~~~~~l~k~l~~m~~h~~-sv~CVR~--S~dG~~----lAsGSD   89 (942)
T KOG0973|consen   24 DGVKFATGGQVLDGGIVIWSQDPVLDEKE-------EKNENLPKHLCTMDDHDG-SVNCVRF--SPDGSY----LASGSD   89 (942)
T ss_pred             CceeEecCCccccccceeeccccccchhh-------hhhcccchhheeeccccC-ceeEEEE--CCCCCe----EeeccC
Confidence            588889999  799999999998554422       234332234667777887 9999999  466544    558999


Q ss_pred             CceEEEeEccC-cCCCCCCCC-----CCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          234 NREVKLWASAS-EEGWSLPTH-----AESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       234 nrtIKLW~~a~-~~~~~~~~~-----~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      ||-|-||+.+. +.||+-.+.     .|.|+|..+|++|+        .=+.-|+.+|+..|++.--..+.
T Consensus        90 D~~v~iW~~~~~~~~~~fgs~g~~~~vE~wk~~~~l~~H~--------~DV~Dv~Wsp~~~~lvS~s~Dns  152 (942)
T KOG0973|consen   90 DRLVMIWERAEIGSGTVFGSTGGAKNVESWKVVSILRGHD--------SDVLDVNWSPDDSLLVSVSLDNS  152 (942)
T ss_pred             cceEEEeeecccCCcccccccccccccceeeEEEEEecCC--------CccceeccCCCccEEEEecccce
Confidence            99999999984 445555442     25799999999744        44556777887777766655543


No 126
>KOG4378 consensus Nuclear protein COP1 [Signal transduction mechanisms]
Probab=97.51  E-value=0.00031  Score=82.54  Aligned_cols=124  Identities=15%  Similarity=0.322  Sum_probs=90.0

Q ss_pred             CceEEEeecCCcEEEEeCcchhhH-hhcCCcc------------------------------------------------
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRS-LLRGHTK------------------------------------------------  187 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~-llrGH~q------------------------------------------------  187 (1165)
                      -.|||.|.-.|.++|||....+++ -|+||..                                                
T Consensus        91 S~y~~sgG~~~~Vkiwdl~~kl~hr~lkdh~stvt~v~YN~~DeyiAsvs~gGdiiih~~~t~~~tt~f~~~sgqsvRll  170 (673)
T KOG4378|consen   91 SLYEISGGQSGCVKIWDLRAKLIHRFLKDHQSTVTYVDYNNTDEYIASVSDGGDIIIHGTKTKQKTTTFTIDSGQSVRLL  170 (673)
T ss_pred             ceeeeccCcCceeeehhhHHHHHhhhccCCcceeEEEEecCCcceeEEeccCCcEEEEecccCccccceecCCCCeEEEe
Confidence            489999999999999999984444 8899987                                                


Q ss_pred             ------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCC
Q 001070          188 ------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWS  249 (1165)
Q Consensus       188 ------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~  249 (1165)
                                        |-+||++...|..-|.--.--+-.-|+|  .|...-   |+++-..|+.|-|||....    
T Consensus       171 ~ys~skr~lL~~asd~G~VtlwDv~g~sp~~~~~~~HsAP~~gicf--spsne~---l~vsVG~Dkki~~yD~~s~----  241 (673)
T KOG4378|consen  171 RYSPSKRFLLSIASDKGAVTLWDVQGMSPIFHASEAHSAPCRGICF--SPSNEA---LLVSVGYDKKINIYDIRSQ----  241 (673)
T ss_pred             ecccccceeeEeeccCCeEEEEeccCCCcccchhhhccCCcCccee--cCCccc---eEEEecccceEEEeecccc----
Confidence                              8899999888866664322347778999  466655   6667779999999998544    


Q ss_pred             CCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          250 LPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       250 ~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                              +-+.+|..         +.-|..|++.++|-+|...+ .|--||+--+.-
T Consensus       242 --------~s~~~l~y---------~~Plstvaf~~~G~~L~aG~-s~G~~i~YD~R~  281 (673)
T KOG4378|consen  242 --------ASTDRLTY---------SHPLSTVAFSECGTYLCAGN-SKGELIAYDMRS  281 (673)
T ss_pred             --------cccceeee---------cCCcceeeecCCceEEEeec-CCceEEEEeccc
Confidence                    44555654         35566788888776665555 455666655543


No 127
>KOG0270 consensus WD40 repeat-containing protein [Function unknown]
Probab=97.50  E-value=0.00043  Score=80.60  Aligned_cols=128  Identities=20%  Similarity=0.345  Sum_probs=89.8

Q ss_pred             Cceee-cC----CceEEecccCCCCCCCCCCccccccc--------------ccCCCcccccccEeeec---CceEEEee
Q 001070          107 YGKRV-FG----DYVAYDVDAVEEGREPTQQLEVNPIT--------------KYGSDPELLIGRQIAVN---KHYVCYGL  164 (1165)
Q Consensus       107 ~Gr~l-~g----~~~~~dVd~~~~ge~~~pqlev~pIt--------------~Y~sd~~~~~GR~IAVn---~~yIayG~  164 (1165)
                      +|-++ .|    .-.|+|.|.+.+   ..|.+.+..+.              -|-+|..+.    ++-|   .+.||+|+
T Consensus       191 ~gNyvAiGtmdp~IeIWDLDI~d~---v~P~~~LGs~~sk~~~k~~k~~~~~~gHTdavl~----Ls~n~~~~nVLaSgs  263 (463)
T KOG0270|consen  191 AGNYVAIGTMDPEIEIWDLDIVDA---VLPCVTLGSKASKKKKKKGKRSNSASGHTDAVLA----LSWNRNFRNVLASGS  263 (463)
T ss_pred             CcceEEEeccCceeEEeccccccc---cccceeechhhhhhhhhhcccccccccchHHHHH----HHhccccceeEEecC
Confidence            78888 77    445799999776   33655555321              111111111    1223   57899999


Q ss_pred             cCCcEEEEeCcc-hhhHhhcCCcc--------------------------------------------------------
Q 001070          165 KGGNVRVLNLNT-ATRSLLRGHTK--------------------------------------------------------  187 (1165)
Q Consensus       165 kdg~IRVwdi~t-~ir~llrGH~q--------------------------------------------------------  187 (1165)
                      .|++|.+||.++ .-...+.-|++                                                        
T Consensus       264 aD~TV~lWD~~~g~p~~s~~~~~k~Vq~l~wh~~~p~~LLsGs~D~~V~l~D~R~~~~s~~~wk~~g~VEkv~w~~~se~  343 (463)
T KOG0270|consen  264 ADKTVKLWDVDTGKPKSSITHHGKKVQTLEWHPYEPSVLLSGSYDGTVALKDCRDPSNSGKEWKFDGEVEKVAWDPHSEN  343 (463)
T ss_pred             CCceEEEEEcCCCCcceehhhcCCceeEEEecCCCceEEEeccccceEEeeeccCccccCceEEeccceEEEEecCCCce
Confidence            999999999999 55557776776                                                        


Q ss_pred             ----------EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCC
Q 001070          188 ----------IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEG  247 (1165)
Q Consensus       188 ----------VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~  247 (1165)
                                ||-+|.|. |.|+-++..||| +|.++.|  .+..|+   |+++|+.++.+|||++...++
T Consensus       344 ~f~~~tddG~v~~~D~R~~~~~vwt~~AHd~-~ISgl~~--n~~~p~---~l~t~s~d~~Vklw~~~~~~~  408 (463)
T KOG0270|consen  344 SFFVSTDDGTVYYFDIRNPGKPVWTLKAHDD-EISGLSV--NIQTPG---LLSTASTDKVVKLWKFDVDSP  408 (463)
T ss_pred             eEEEecCCceEEeeecCCCCCceeEEEeccC-CcceEEe--cCCCCc---ceeeccccceEEEEeecCCCC
Confidence                      55555554 467888888876 8999998  466666   777899999999999987754


No 128
>KOG0299 consensus U3 snoRNP-associated protein (contains WD40 repeats) [RNA processing and modification]
Probab=97.48  E-value=0.00018  Score=83.93  Aligned_cols=134  Identities=19%  Similarity=0.322  Sum_probs=97.9

Q ss_pred             ccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc--hhhHhh-----------------cCCcc-----------
Q 001070          138 ITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT--ATRSLL-----------------RGHTK-----------  187 (1165)
Q Consensus       138 It~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t--~ir~ll-----------------rGH~q-----------  187 (1165)
                      |.+|+--.-.+.+=-+..|++|+.+++++|+|-=||+-+  ..|..+                 ++|..           
T Consensus       135 ~~~~~~H~~s~~~vals~d~~~~fsask~g~i~kw~v~tgk~~~~i~~~~ev~k~~~~~~k~~r~~h~keil~~avS~Dg  214 (479)
T KOG0299|consen  135 FRVIGKHQLSVTSVALSPDDKRVFSASKDGTILKWDVLTGKKDRYIIERDEVLKSHGNPLKESRKGHVKEILTLAVSSDG  214 (479)
T ss_pred             ceeeccccCcceEEEeeccccceeecCCCcceeeeehhcCcccccccccchhhhhccCCCCcccccccceeEEEEEcCCC
Confidence            555655555555555677999999999999999999988  333322                 16665           


Q ss_pred             -----------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCC
Q 001070          188 -----------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAES  256 (1165)
Q Consensus       188 -----------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~  256 (1165)
                                 |-|||.+++.++..|.+|-| .|.+++|-..++.     |. +++.||+||||.++--+          
T Consensus       215 kylatgg~d~~v~Iw~~~t~ehv~~~~ghr~-~V~~L~fr~gt~~-----ly-s~s~Drsvkvw~~~~~s----------  277 (479)
T KOG0299|consen  215 KYLATGGRDRHVQIWDCDTLEHVKVFKGHRG-AVSSLAFRKGTSE-----LY-SASADRSVKVWSIDQLS----------  277 (479)
T ss_pred             cEEEecCCCceEEEecCcccchhhccccccc-ceeeeeeecCccc-----ee-eeecCCceEEEehhHhH----------
Confidence                       88999999999999999865 9999999644444     44 79999999999985542          


Q ss_pred             cceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          257 WKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       257 w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                        -+.||-        ||.+-+.++.++...+.+-+.-..|-
T Consensus       278 --~vetly--------GHqd~v~~IdaL~reR~vtVGgrDrT  309 (479)
T KOG0299|consen  278 --YVETLY--------GHQDGVLGIDALSRERCVTVGGRDRT  309 (479)
T ss_pred             --HHHHHh--------CCccceeeechhcccceEEeccccce
Confidence              223333        46676777777777777666644443


No 129
>KOG1188 consensus WD40 repeat protein [General function prediction only]
Probab=97.46  E-value=0.00088  Score=76.25  Aligned_cols=83  Identities=18%  Similarity=0.334  Sum_probs=65.8

Q ss_pred             CceEEEeecCCcEEEEeCcch---hhHhhcCCcc---------------------------EEEeecCCC-ceeEEecCC
Q 001070          157 KHYVCYGLKGGNVRVLNLNTA---TRSLLRGHTK---------------------------IKIWEDSKV-APLIILKPH  205 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~---ir~llrGH~q---------------------------VriWD~~~g-~pl~~leph  205 (1165)
                      +.-|-++..||.||+|||.++   -|....+|..                           |.|||+|+- ++|..|.-.
T Consensus        84 ~h~v~s~ssDG~Vr~wD~Rs~~e~a~~~~~~~~~~~f~~ld~nck~~ii~~GtE~~~s~A~v~lwDvR~~qq~l~~~~eS  163 (376)
T KOG1188|consen   84 PHGVISCSSDGTVRLWDIRSQAESARISWTQQSGTPFICLDLNCKKNIIACGTELTRSDASVVLWDVRSEQQLLRQLNES  163 (376)
T ss_pred             CCeeEEeccCCeEEEEEeecchhhhheeccCCCCCcceEeeccCcCCeEEeccccccCceEEEEEEeccccchhhhhhhh
Confidence            566778899999999999983   3336677773                           999999985 457777533


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      .-+-|.+|.|  .|..|+   |+.+||.|.=|-|+|+..
T Consensus       164 H~DDVT~lrF--HP~~pn---lLlSGSvDGLvnlfD~~~  197 (376)
T KOG1188|consen  164 HNDDVTQLRF--HPSDPN---LLLSGSVDGLVNLFDTKK  197 (376)
T ss_pred             ccCcceeEEe--cCCCCC---eEEeecccceEEeeecCC
Confidence            2458999999  798888   788999999999999743


No 130
>KOG1009 consensus Chromatin assembly complex 1 subunit B/CAC2 (contains WD40 repeats) [Chromatin structure and dynamics; Replication, recombination and repair]
Probab=97.45  E-value=0.0006  Score=78.79  Aligned_cols=160  Identities=18%  Similarity=0.232  Sum_probs=104.2

Q ss_pred             eeecCc-eEEEeecCCcEEEEeCcc----------hhhHhhcCCcc----------------------EEEeecCC----
Q 001070          153 IAVNKH-YVCYGLKGGNVRVLNLNT----------ATRSLLRGHTK----------------------IKIWEDSK----  195 (1165)
Q Consensus       153 IAVn~~-yIayG~kdg~IRVwdi~t----------~ir~llrGH~q----------------------VriWD~~~----  195 (1165)
                      +.=|.. +||+|.-|..||||=+++          ..-+.|.+|++                      |-+|-...    
T Consensus        21 fq~n~~~~laT~G~D~~iriW~v~r~~~~~~~~~V~y~s~Ls~H~~aVN~vRf~p~gelLASg~D~g~v~lWk~~~~~~~  100 (434)
T KOG1009|consen   21 FQKNSLNKLATAGGDKDIRIWKVNRSEPGGGDMKVEYLSSLSRHTRAVNVVRFSPDGELLASGGDGGEVFLWKQGDVRIF  100 (434)
T ss_pred             eccCcccceecccCccceeeeeeeecCCCCCceeEEEeecccCCcceeEEEEEcCCcCeeeecCCCceEEEEEecCcCCc
Confidence            333444 999999999999998875          12347899999                      66774330    


Q ss_pred             ---Cc---------eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEE
Q 001070          196 ---VA---------PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTL  263 (1165)
Q Consensus       196 ---g~---------pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTL  263 (1165)
                         .+         =..++++| ++-||-++|.     +++.|++ +|+.|.++.|||+..+            .-.+++
T Consensus       101 ~~d~e~~~~ke~w~v~k~lr~h-~~diydL~Ws-----~d~~~l~-s~s~dns~~l~Dv~~G------------~l~~~~  161 (434)
T KOG1009|consen  101 DADTEADLNKEKWVVKKVLRGH-RDDIYDLAWS-----PDSNFLV-SGSVDNSVRLWDVHAG------------QLLAIL  161 (434)
T ss_pred             cccchhhhCccceEEEEEeccc-ccchhhhhcc-----CCCceee-eeeccceEEEEEeccc------------eeEeec
Confidence               10         14556666 5689999993     5556577 6999999999998444            666666


Q ss_pred             eccCCCCCccccccEEEEEeecCCcEEEEeccCC-CcEEEEEeecCCCccccccccccccccccceeeeeeccCCCCcc-
Q 001070          264 DLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKK-NAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPSEH-  341 (1165)
Q Consensus       264 e~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r-~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~ge~-  341 (1165)
                      .        +|+-+++-|+.+|-+++|.-=...| .-+|-+-+.       .+..|++.  ..||+.     -+-.||+ 
T Consensus       162 ~--------dh~~yvqgvawDpl~qyv~s~s~dr~~~~~~~~~~-------~~~~~~~~--~~m~~~-----~~~~~e~~  219 (434)
T KOG1009|consen  162 D--------DHEHYVQGVAWDPLNQYVASKSSDRHPEGFSAKLK-------QVIKRHGL--DIMPAK-----AFNEREGK  219 (434)
T ss_pred             c--------ccccccceeecchhhhhhhhhccCcccceeeeeee-------eeeeeeee--eEeeec-----ccCCCCcc
Confidence            6        5788888999999999887655555 333333333       24445443  222221     1123444 


Q ss_pred             eEEEEEeehhhh
Q 001070          342 IIKLYCVQTQAI  353 (1165)
Q Consensus       342 ~vq~yCvQtqAI  353 (1165)
                      .++|||=-|.=-
T Consensus       220 s~rLfhDeTlks  231 (434)
T KOG1009|consen  220 STRLFHDETLKS  231 (434)
T ss_pred             eeeeeecCchhh
Confidence            688888666433


No 131
>KOG0294 consensus WD40 repeat-containing protein [Function unknown]
Probab=97.45  E-value=0.00022  Score=80.26  Aligned_cols=53  Identities=23%  Similarity=0.344  Sum_probs=43.7

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      |++||+.++.|+..|..|. ..|-+++|++.|++   -+|+ ++|.|..||+||....
T Consensus       231 i~~~D~ds~~~~~~~~AH~-~RVK~i~~~~~~~~---~~lv-TaSSDG~I~vWd~~~~  283 (362)
T KOG0294|consen  231 ISLKDTDSDTPLTEFLAHE-NRVKDIASYTNPEH---EYLV-TASSDGFIKVWDIDME  283 (362)
T ss_pred             EEEeccCCCccceeeecch-hheeeeEEEecCCc---eEEE-EeccCceEEEEEcccc
Confidence            8899988888899998884 58999999888777   3355 6889999999998654


No 132
>KOG2048 consensus WD40 repeat protein [General function prediction only]
Probab=97.44  E-value=0.00073  Score=81.85  Aligned_cols=101  Identities=18%  Similarity=0.228  Sum_probs=71.1

Q ss_pred             EEeecCCCceEEEeEccCcCCCCCCCCCCCc----ceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEE
Q 001070          227 LVTAGPLNREVKLWASASEEGWSLPTHAESW----KCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYS  302 (1165)
Q Consensus       227 lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w----~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYa  302 (1165)
                      ++.+++.++.+-+|--.+..=|.+.++.-.+    .-+--|..       .++.++...++.|+|+||..+-..+--||-
T Consensus       337 ~v~~a~~~~L~~~w~~h~v~lwrlGS~~~~g~~~~~~Llkl~~-------k~~~nIs~~aiSPdg~~Ia~st~~~~~iy~  409 (691)
T KOG2048|consen  337 RVSVAPENRLLVLWKAHGVDLWRLGSVILQGEYNYIHLLKLFT-------KEKENISCAAISPDGNLIAISTVSRTKIYR  409 (691)
T ss_pred             eeecCccceEEEEeccccccceeccCcccccccChhhheeeec-------CCccceeeeccCCCCCEEEEeeccceEEEE
Confidence            4667788888888865555556555542211    11111111       245678788999999999999999999997


Q ss_pred             EEeecCCCccccccccccccccccceeeeeeccC
Q 001070          303 VHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTID  336 (1165)
Q Consensus       303 lhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d  336 (1165)
                      |..+.  +=-..+.|-.-.|++..--++||++.+
T Consensus       410 L~~~~--~vk~~~v~~~~~~~~~a~~i~ftid~~  441 (691)
T KOG2048|consen  410 LQPDP--NVKVINVDDVPLALLDASAISFTIDKN  441 (691)
T ss_pred             eccCc--ceeEEEeccchhhhccceeeEEEecCc
Confidence            77654  445678888888888888999998653


No 133
>PRK11028 6-phosphogluconolactonase; Provisional
Probab=97.41  E-value=0.0023  Score=71.54  Aligned_cols=132  Identities=11%  Similarity=0.128  Sum_probs=82.9

Q ss_pred             ecCceE-EEeecCCcEEEEeCcc-h-hh----H---hhcCCcc---------------------EEEeecCC--Cc--ee
Q 001070          155 VNKHYV-CYGLKGGNVRVLNLNT-A-TR----S---LLRGHTK---------------------IKIWEDSK--VA--PL  199 (1165)
Q Consensus       155 Vn~~yI-ayG~kdg~IRVwdi~t-~-ir----~---llrGH~q---------------------VriWD~~~--g~--pl  199 (1165)
                      -||+|| +....++.|+|||+++ . +.    .   +..|..-                     |++||...  |.  .+
T Consensus       135 p~g~~l~v~~~~~~~v~v~d~~~~g~l~~~~~~~~~~~~g~~p~~~~~~pdg~~lyv~~~~~~~v~v~~~~~~~~~~~~~  214 (330)
T PRK11028        135 PDNRTLWVPCLKEDRIRLFTLSDDGHLVAQEPAEVTTVEGAGPRHMVFHPNQQYAYCVNELNSSVDVWQLKDPHGEIECV  214 (330)
T ss_pred             CCCCEEEEeeCCCCEEEEEEECCCCcccccCCCceecCCCCCCceEEECCCCCEEEEEecCCCEEEEEEEeCCCCCEEEE
Confidence            357888 5677889999999986 1 11    0   1112111                     89999873  32  23


Q ss_pred             EEec--CCC--C-CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          200 IILK--PHG--G-QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       200 ~~le--phd--G-~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      +.+.  |.+  | .....++|  .|   ++++|.++...+++|.+|+.+...+        .++-++++...        
T Consensus       215 ~~~~~~p~~~~~~~~~~~i~~--~p---dg~~lyv~~~~~~~I~v~~i~~~~~--------~~~~~~~~~~~--------  273 (330)
T PRK11028        215 QTLDMMPADFSDTRWAADIHI--TP---DGRHLYACDRTASLISVFSVSEDGS--------VLSFEGHQPTE--------  273 (330)
T ss_pred             EEEecCCCcCCCCccceeEEE--CC---CCCEEEEecCCCCeEEEEEEeCCCC--------eEEEeEEEecc--------
Confidence            3332  221  1 13335777  45   4567888888899999999865422        23333333321        


Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEEEEeecC
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                       ..-..+.++|+++||+++|...+.|-+++++..
T Consensus       274 -~~p~~~~~~~dg~~l~va~~~~~~v~v~~~~~~  306 (330)
T PRK11028        274 -TQPRGFNIDHSGKYLIAAGQKSHHISVYEIDGE  306 (330)
T ss_pred             -ccCCceEECCCCCEEEEEEccCCcEEEEEEcCC
Confidence             112245889999999999998999999998753


No 134
>KOG1446 consensus Histone H3 (Lys4) methyltransferase complex and RNA cleavage factor II complex, subunit SWD2 [RNA processing and modification; Chromatin structure and dynamics; Posttranslational modification, protein turnover, chaperones]
Probab=97.38  E-value=0.0014  Score=74.02  Aligned_cols=122  Identities=16%  Similarity=0.235  Sum_probs=88.5

Q ss_pred             eecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCC
Q 001070          154 AVNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       154 AVn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      +-||.++.+..+|..||++|..+  .+|.+=..|-.                       ||.-++.+-..|+.|.|| ++
T Consensus        23 s~~G~~litss~dDsl~LYd~~~g~~~~ti~skkyG~~~~~Fth~~~~~i~sStk~d~tIryLsl~dNkylRYF~GH-~~  101 (311)
T KOG1446|consen   23 SDDGLLLITSSEDDSLRLYDSLSGKQVKTINSKKYGVDLACFTHHSNTVIHSSTKEDDTIRYLSLHDNKYLRYFPGH-KK  101 (311)
T ss_pred             cCCCCEEEEecCCCeEEEEEcCCCceeeEeecccccccEEEEecCCceEEEccCCCCCceEEEEeecCceEEEcCCC-Cc
Confidence            34699999999999999999998  33333222222                       777777777779999998 57


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      .|.++.-  .|-+ |   ...||++|+||+|||+-.            .+|.--+...+-.          -+++||+|=
T Consensus       102 ~V~sL~~--sP~~-d---~FlS~S~D~tvrLWDlR~------------~~cqg~l~~~~~p----------i~AfDp~GL  153 (311)
T KOG1446|consen  102 RVNSLSV--SPKD-D---TFLSSSLDKTVRLWDLRV------------KKCQGLLNLSGRP----------IAAFDPEGL  153 (311)
T ss_pred             eEEEEEe--cCCC-C---eEEecccCCeEEeeEecC------------CCCceEEecCCCc----------ceeECCCCc
Confidence            9999988  4544 4   455899999999999943            4898888863322          247788887


Q ss_pred             EEEEeccC-CCcEEEEE
Q 001070          289 LLLFANAK-KNAIYSVH  304 (1165)
Q Consensus       289 ~ilLan~~-r~aIYalh  304 (1165)
                      +..+++-. +=-||-+.
T Consensus       154 ifA~~~~~~~IkLyD~R  170 (311)
T KOG1446|consen  154 IFALANGSELIKLYDLR  170 (311)
T ss_pred             EEEEecCCCeEEEEEec
Confidence            77777766 44455554


No 135
>KOG0643 consensus Translation initiation factor 3, subunit i (eIF-3i)/TGF-beta receptor-interacting protein (TRIP-1) [Translation, ribosomal structure and biogenesis; Signal transduction mechanisms]
Probab=97.36  E-value=0.00085  Score=74.52  Aligned_cols=79  Identities=22%  Similarity=0.263  Sum_probs=57.5

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      +.||=..+|.-|.++++|.| +|.|+.-     .-+-+.||| |+.|.++||||+.++            +|+-++.+.+
T Consensus        34 ~~vw~s~nGerlGty~GHtG-avW~~Di-----d~~s~~liT-GSAD~t~kLWDv~tG------------k~la~~k~~~   94 (327)
T KOG0643|consen   34 PTVWYSLNGERLGTYDGHTG-AVWCCDI-----DWDSKHLIT-GSADQTAKLWDVETG------------KQLATWKTNS   94 (327)
T ss_pred             ceEEEecCCceeeeecCCCc-eEEEEEe-----cCCcceeee-ccccceeEEEEcCCC------------cEEEEeecCC
Confidence            45666666777888888877 7777766     133455775 999999999999554            9999999844


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEec
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan  294 (1165)
                      .         +-.|-.++++.++|.+-
T Consensus        95 ~---------Vk~~~F~~~gn~~l~~t  112 (327)
T KOG0643|consen   95 P---------VKRVDFSFGGNLILAST  112 (327)
T ss_pred             e---------eEEEeeccCCcEEEEEe
Confidence            3         33566778888776553


No 136
>KOG0321 consensus WD40 repeat-containing protein L2DTL [Function unknown]
Probab=97.36  E-value=0.00028  Score=84.88  Aligned_cols=104  Identities=23%  Similarity=0.400  Sum_probs=71.9

Q ss_pred             ccccccccCCCc--ccccccEe--eecC-ceEEEeecCCcEEEEeCcc-hhh---Hhhc---CCcc--------------
Q 001070          134 EVNPITKYGSDP--ELLIGRQI--AVNK-HYVCYGLKGGNVRVLNLNT-ATR---SLLR---GHTK--------------  187 (1165)
Q Consensus       134 ev~pIt~Y~sd~--~~~~GR~I--AVn~-~yIayG~kdg~IRVwdi~t-~ir---~llr---GH~q--------------  187 (1165)
                      ...|||-|..+-  .-++|-.+  +.|. +.|+-+.|||.|+++|... ..|   .-|+   -|-.              
T Consensus        36 gi~~~~s~~~~~~p~pPf~~sFs~~~n~eHiLavadE~G~i~l~dt~~~~fr~ee~~lk~~~aH~nAifDl~wapge~~l  115 (720)
T KOG0321|consen   36 GIAPITSYANDGLPVPPFADSFSAAPNKEHILAVADEDGGIILFDTKSIVFRLEERQLKKPLAHKNAIFDLKWAPGESLL  115 (720)
T ss_pred             ccccccccccCCCCCCCccccccCCCCccceEEEecCCCceeeecchhhhcchhhhhhcccccccceeEeeccCCCceeE
Confidence            345666665432  11222232  3343 4445599999999999998 544   1122   2332              


Q ss_pred             --------EEEeecCCCceeEE--ecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          188 --------IKIWEDSKVAPLII--LKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       188 --------VriWD~~~g~pl~~--lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                              +|+||+..+.++..  +-+|.| +|-|+||  +|..++   ++..|.-|.+|+|||+-
T Consensus       116 VsasGDsT~r~Wdvk~s~l~G~~~~~GH~~-SvkS~cf--~~~n~~---vF~tGgRDg~illWD~R  175 (720)
T KOG0321|consen  116 VSASGDSTIRPWDVKTSRLVGGRLNLGHTG-SVKSECF--MPTNPA---VFCTGGRDGEILLWDCR  175 (720)
T ss_pred             EEccCCceeeeeeeccceeecceeeccccc-ccchhhh--ccCCCc---ceeeccCCCcEEEEEEe
Confidence                    99999998877555  888876 9999999  688777   66678899999999993


No 137
>KOG0316 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=97.35  E-value=0.0005  Score=75.25  Aligned_cols=110  Identities=21%  Similarity=0.275  Sum_probs=83.7

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCC--ceeEEecCCCCCCc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKV--APLIILKPHGGQPV  210 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g--~pl~~lephdG~sV  210 (1165)
                      |..-+|.|.-|+.|-|||.+| ++-.-||||-.                      ||+||-|+.  .|+++|.-. -+.|
T Consensus        70 Dnskf~s~GgDk~v~vwDV~TGkv~Rr~rgH~aqVNtV~fNeesSVv~SgsfD~s~r~wDCRS~s~ePiQildea-~D~V  148 (307)
T KOG0316|consen   70 DNSKFASCGGDKAVQVWDVNTGKVDRRFRGHLAQVNTVRFNEESSVVASGSFDSSVRLWDCRSRSFEPIQILDEA-KDGV  148 (307)
T ss_pred             cccccccCCCCceEEEEEcccCeeeeecccccceeeEEEecCcceEEEeccccceeEEEEcccCCCCccchhhhh-cCce
Confidence            567789999999999999999 77778999987                      999999875  589988654 2468


Q ss_pred             ceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEE
Q 001070          211 NSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLL  290 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~i  290 (1165)
                      .||--      .+|  .|.+||.|.+++-+|+--+                |+.  + +   .-..-+++|..+++++.+
T Consensus       149 ~Si~v------~~h--eIvaGS~DGtvRtydiR~G----------------~l~--s-D---y~g~pit~vs~s~d~nc~  198 (307)
T KOG0316|consen  149 SSIDV------AEH--EIVAGSVDGTVRTYDIRKG----------------TLS--S-D---YFGHPITSVSFSKDGNCS  198 (307)
T ss_pred             eEEEe------ccc--EEEeeccCCcEEEEEeecc----------------eee--h-h---hcCCcceeEEecCCCCEE
Confidence            88888      333  4668999999999998444                121  0 0   112346788889999988


Q ss_pred             EEeccC
Q 001070          291 LFANAK  296 (1165)
Q Consensus       291 lLan~~  296 (1165)
                      |.+...
T Consensus       199 La~~l~  204 (307)
T KOG0316|consen  199 LASSLD  204 (307)
T ss_pred             EEeecc
Confidence            877654


No 138
>KOG1007 consensus WD repeat protein TSSC1, WD repeat superfamily [Function unknown]
Probab=97.34  E-value=0.00045  Score=77.22  Aligned_cols=84  Identities=24%  Similarity=0.366  Sum_probs=66.5

Q ss_pred             ccccEeeecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCC-CceeEE
Q 001070          148 LIGRQIAVNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSK-VAPLII  201 (1165)
Q Consensus       148 ~~GR~IAVn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~-g~pl~~  201 (1165)
                      ..|.|+|+        +.|++++-||..|  ..-.+=+.|.|                       |||||.|+ -.||..
T Consensus       182 Hdgnqv~t--------t~d~tl~~~D~RT~~~~~sI~dAHgq~vrdlDfNpnkq~~lvt~gDdgyvriWD~R~tk~pv~e  253 (370)
T KOG1007|consen  182 HDGNQVAT--------TSDSTLQFWDLRTMKKNNSIEDAHGQRVRDLDFNPNKQHILVTCGDDGYVRIWDTRKTKFPVQE  253 (370)
T ss_pred             CccceEEE--------eCCCcEEEEEccchhhhcchhhhhcceeeeccCCCCceEEEEEcCCCccEEEEeccCCCccccc
Confidence            45666664        3689999999998  44447778877                       99999997 479999


Q ss_pred             ecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          202 LKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       202 lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      +.+| .|+|.+|-|  .   +.|--||-+|+.|-.+-||+..+-
T Consensus       254 l~~H-sHWvW~VRf--n---~~hdqLiLs~~SDs~V~Lsca~sv  291 (370)
T KOG1007|consen  254 LPGH-SHWVWAVRF--N---PEHDQLILSGGSDSAVNLSCASSV  291 (370)
T ss_pred             cCCC-ceEEEEEEe--c---CccceEEEecCCCceeEEEecccc
Confidence            9999 599999999  3   444447778999999999997443


No 139
>KOG0268 consensus Sof1-like rRNA processing protein (contains WD40 repeats) [RNA processing and modification]
Probab=97.32  E-value=0.00048  Score=78.80  Aligned_cols=121  Identities=16%  Similarity=0.284  Sum_probs=75.8

Q ss_pred             EEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------EEEeecC------------------------
Q 001070          160 VCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------IKIWEDS------------------------  194 (1165)
Q Consensus       160 IayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------VriWD~~------------------------  194 (1165)
                      +++|+-||.|||||+.+ ....+|+-|.+                    ||.|-+.                        
T Consensus        82 ~aSGs~DG~VkiWnlsqR~~~~~f~AH~G~V~Gi~v~~~~~~tvgdDKtvK~wk~~~~p~~tilg~s~~~gIdh~~~~~~  161 (433)
T KOG0268|consen   82 VASGSCDGEVKIWNLSQRECIRTFKAHEGLVRGICVTQTSFFTVGDDKTVKQWKIDGPPLHTILGKSVYLGIDHHRKNSV  161 (433)
T ss_pred             hhccccCceEEEEehhhhhhhheeecccCceeeEEecccceEEecCCcceeeeeccCCcceeeecccccccccccccccc
Confidence            57899999999999999 55569999996                    6666411                        


Q ss_pred             ---CCceeEEecCCCCC----------CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE
Q 001070          195 ---KVAPLIILKPHGGQ----------PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ  261 (1165)
Q Consensus       195 ---~g~pl~~lephdG~----------sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q  261 (1165)
                         .|.-+++|...--.          .+.|+-|  .|--.+   +|.++-.||.|.|+|+-...        ..-+-++
T Consensus       162 FaTcGe~i~IWD~~R~~Pv~smswG~Dti~svkf--NpvETs---ILas~~sDrsIvLyD~R~~~--------Pl~KVi~  228 (433)
T KOG0268|consen  162 FATCGEQIDIWDEQRDNPVSSMSWGADSISSVKF--NPVETS---ILASCASDRSIVLYDLRQAS--------PLKKVIL  228 (433)
T ss_pred             ccccCceeeecccccCCccceeecCCCceeEEec--CCCcch---heeeeccCCceEEEecccCC--------ccceeee
Confidence               12235566554322          4555666  454444   77788899999999984431        1223333


Q ss_pred             EEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          262 TLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       262 TLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      |..             =|.++.+| -.|.+++.-.-..||..-.-|
T Consensus       229 ~mR-------------TN~IswnP-eafnF~~a~ED~nlY~~DmR~  260 (433)
T KOG0268|consen  229 TMR-------------TNTICWNP-EAFNFVAANEDHNLYTYDMRN  260 (433)
T ss_pred             ecc-------------ccceecCc-cccceeeccccccceehhhhh
Confidence            333             23566677 555555555556666544443


No 140
>KOG1446 consensus Histone H3 (Lys4) methyltransferase complex and RNA cleavage factor II complex, subunit SWD2 [RNA processing and modification; Chromatin structure and dynamics; Posttranslational modification, protein turnover, chaperones]
Probab=97.31  E-value=0.0032  Score=71.09  Aligned_cols=196  Identities=19%  Similarity=0.234  Sum_probs=113.6

Q ss_pred             Cceee-c-C---CceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeec--CCcEEEEeCcc-hh
Q 001070          107 YGKRV-F-G---DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLK--GGNVRVLNLNT-AT  178 (1165)
Q Consensus       107 ~Gr~l-~-g---~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~k--dg~IRVwdi~t-~i  178 (1165)
                      .|-+| . -   .-++||.-.++.       +.--+--|||-+-    +|=+- ..+-+.|+..  |..||.+++.+ ..
T Consensus        25 ~G~~litss~dDsl~LYd~~~g~~-------~~ti~skkyG~~~----~~Fth-~~~~~i~sStk~d~tIryLsl~dNky   92 (311)
T KOG1446|consen   25 DGLLLITSSEDDSLRLYDSLSGKQ-------VKTINSKKYGVDL----ACFTH-HSNTVIHSSTKEDDTIRYLSLHDNKY   92 (311)
T ss_pred             CCCEEEEecCCCeEEEEEcCCCce-------eeEeecccccccE----EEEec-CCceEEEccCCCCCceEEEEeecCce
Confidence            57777 2 1   225688776544       3444555677665    44222 2333345554  99999999999 55


Q ss_pred             hHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCce
Q 001070          179 RSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNRE  236 (1165)
Q Consensus       179 r~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrt  236 (1165)
                      -.-|.||.+                      ||.||.+.-.|...+.-   ..-.-+||  .|.|   .++++ |.....
T Consensus        93 lRYF~GH~~~V~sL~~sP~~d~FlS~S~D~tvrLWDlR~~~cqg~l~~---~~~pi~Af--Dp~G---LifA~-~~~~~~  163 (311)
T KOG1446|consen   93 LRYFPGHKKRVNSLSVSPKDDTFLSSSLDKTVRLWDLRVKKCQGLLNL---SGRPIAAF--DPEG---LIFAL-ANGSEL  163 (311)
T ss_pred             EEEcCCCCceEEEEEecCCCCeEEecccCCeEEeeEecCCCCceEEec---CCCcceeE--CCCC---cEEEE-ecCCCe
Confidence            558999999                      99999995443333321   12334677  3444   43333 433449


Q ss_pred             EEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCcccccc
Q 001070          237 VKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRI  316 (1165)
Q Consensus       237 IKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~  316 (1165)
                      |||+|+-.-..          ---+||.....     ..+=++.+-.+|+|.+|||+... +.||.|----|.       
T Consensus       164 IkLyD~Rs~dk----------gPF~tf~i~~~-----~~~ew~~l~FS~dGK~iLlsT~~-s~~~~lDAf~G~-------  220 (311)
T KOG1446|consen  164 IKLYDLRSFDK----------GPFTTFSITDN-----DEAEWTDLEFSPDGKSILLSTNA-SFIYLLDAFDGT-------  220 (311)
T ss_pred             EEEEEecccCC----------CCceeEccCCC-----CccceeeeEEcCCCCEEEEEeCC-CcEEEEEccCCc-------
Confidence            99999833210          11245554322     23456788999999999998654 556665432222       


Q ss_pred             ccccccccc-----cceeeeeeccCC------CCcceEEEEEe
Q 001070          317 DYIAEFTVT-----MPVLSFTGTIDP------PSEHIIKLYCV  348 (1165)
Q Consensus       317 dyiaeF~v~-----~PILSft~~~d~------~ge~~vq~yCv  348 (1165)
                       ++.-|..-     .| |+.+-+.|+      .+.+-+++|-+
T Consensus       221 -~~~tfs~~~~~~~~~-~~a~ftPds~Fvl~gs~dg~i~vw~~  261 (311)
T KOG1446|consen  221 -VKSTFSGYPNAGNLP-LSATFTPDSKFVLSGSDDGTIHVWNL  261 (311)
T ss_pred             -EeeeEeeccCCCCcc-eeEEECCCCcEEEEecCCCcEEEEEc
Confidence             22222221     23 666667777      34466777765


No 141
>KOG0305 consensus Anaphase promoting complex, Cdc20, Cdh1, and Ama1 subunits [Cell cycle control, cell division, chromosome partitioning; Posttranslational modification, protein turnover, chaperones]
Probab=97.30  E-value=0.00055  Score=81.80  Aligned_cols=125  Identities=17%  Similarity=0.176  Sum_probs=85.5

Q ss_pred             ecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc--------------------EEEeecCCCceeEE-ecCCCCCCcc
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK--------------------IKIWEDSKVAPLII-LKPHGGQPVN  211 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q--------------------VriWD~~~g~pl~~-lephdG~sV~  211 (1165)
                      -+|.|||.|..+|.|.|||+.+  .+|.+.-+|..                    |.+||++....+.. +..| .+.|.
T Consensus       227 ~~G~~LavG~~~g~v~iwD~~~~k~~~~~~~~h~~rvg~laW~~~~lssGsr~~~I~~~dvR~~~~~~~~~~~H-~qeVC  305 (484)
T KOG0305|consen  227 PDGSHLAVGTSDGTVQIWDVKEQKKTRTLRGSHASRVGSLAWNSSVLSSGSRDGKILNHDVRISQHVVSTLQGH-RQEVC  305 (484)
T ss_pred             CCCCEEEEeecCCeEEEEehhhccccccccCCcCceeEEEeccCceEEEecCCCcEEEEEEecchhhhhhhhcc-cceee
Confidence            3699999999999999999998  55555444877                    88999998765444 8877 57999


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      -+.|.     +|++ .++||.+|..+.|||....            .-.++|.        .|++=+--++..|-.+=| 
T Consensus       306 gLkws-----~d~~-~lASGgnDN~~~Iwd~~~~------------~p~~~~~--------~H~aAVKA~awcP~q~~l-  358 (484)
T KOG0305|consen  306 GLKWS-----PDGN-QLASGGNDNVVFIWDGLSP------------EPKFTFT--------EHTAAVKALAWCPWQSGL-  358 (484)
T ss_pred             eeEEC-----CCCC-eeccCCCccceEeccCCCc------------cccEEEe--------ccceeeeEeeeCCCccCc-
Confidence            99994     5556 3558999999999998222            3345555        245544445555654432 


Q ss_pred             EeccCCCcEEEEEeec
Q 001070          292 FANAKKNAIYSVHLGY  307 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~  307 (1165)
                      ||-.-.-+-|++|+--
T Consensus       359 LAsGGGs~D~~i~fwn  374 (484)
T KOG0305|consen  359 LATGGGSADRCIKFWN  374 (484)
T ss_pred             eEEcCCCcccEEEEEE
Confidence            3334444455555543


No 142
>KOG0639 consensus Transducin-like enhancer of split protein (contains WD40 repeats) [Chromatin structure and dynamics]
Probab=97.29  E-value=0.0005  Score=80.92  Aligned_cols=125  Identities=18%  Similarity=0.302  Sum_probs=82.5

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCc------------
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVA------------  197 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~------------  197 (1165)
                      |..|.|..+....||+|+|||+.+ .+-..|.||+.                      ||-||.+.|.            
T Consensus       517 ~spDakvcFsccsdGnI~vwDLhnq~~VrqfqGhtDGascIdis~dGtklWTGGlDntvRcWDlregrqlqqhdF~SQIf  596 (705)
T KOG0639|consen  517 ISPDAKVCFSCCSDGNIAVWDLHNQTLVRQFQGHTDGASCIDISKDGTKLWTGGLDNTVRCWDLREGRQLQQHDFSSQIF  596 (705)
T ss_pred             cCCccceeeeeccCCcEEEEEcccceeeecccCCCCCceeEEecCCCceeecCCCccceeehhhhhhhhhhhhhhhhhhe
Confidence            566778888889999999999998 66678999999                      9999998872            


Q ss_pred             -----e-------------eEEe---cCCC---C---CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCC
Q 001070          198 -----P-------------LIIL---KPHG---G---QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSL  250 (1165)
Q Consensus       198 -----p-------------l~~l---ephd---G---~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~  250 (1165)
                           |             ++++   .|+.   +   -.|-|+-|.     ..+++.|+.| -|.-|-.|..--+..   
T Consensus       597 SLg~cP~~dWlavGMens~vevlh~skp~kyqlhlheScVLSlKFa-----~cGkwfvStG-kDnlLnawrtPyGas---  667 (705)
T KOG0639|consen  597 SLGYCPTGDWLAVGMENSNVEVLHTSKPEKYQLHLHESCVLSLKFA-----YCGKWFVSTG-KDNLLNAWRTPYGAS---  667 (705)
T ss_pred             ecccCCCccceeeecccCcEEEEecCCccceeecccccEEEEEEec-----ccCceeeecC-chhhhhhccCccccc---
Confidence                 1             2222   1110   0   167777772     3334455444 455555565422211   


Q ss_pred             CCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC-CCcEEEEE
Q 001070          251 PTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK-KNAIYSVH  304 (1165)
Q Consensus       251 ~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~-r~aIYalh  304 (1165)
                                 -  |.+     .|..-++++-++-+..|||-..-. +..||.|-
T Consensus       668 -----------i--Fqs-----kE~SsVlsCDIS~ddkyIVTGSGdkkATVYeV~  704 (705)
T KOG0639|consen  668 -----------I--FQS-----KESSSVLSCDISFDDKYIVTGSGDKKATVYEVI  704 (705)
T ss_pred             -----------e--eec-----cccCcceeeeeccCceEEEecCCCcceEEEEEe
Confidence                       1  222     234557788899999999987766 67788874


No 143
>KOG0772 consensus Uncharacterized conserved protein, contains WD40 repeat [Function unknown]
Probab=97.29  E-value=0.0029  Score=75.12  Aligned_cols=184  Identities=19%  Similarity=0.318  Sum_probs=116.2

Q ss_pred             cCCCcccccccE----eeec--CceEEEeecCCcEEEEeCcc---hhhH---h----------------------hcCCc
Q 001070          141 YGSDPELLIGRQ----IAVN--KHYVCYGLKGGNVRVLNLNT---ATRS---L----------------------LRGHT  186 (1165)
Q Consensus       141 Y~sd~~~~~GR~----IAVn--~~yIayG~kdg~IRVwdi~t---~ir~---l----------------------lrGH~  186 (1165)
                      |.-|..+..|-+    ++||  |..+++|.-|..|+.||.+.   ..|+   |                      +.||.
T Consensus       157 ~shEi~l~hgtk~Vsal~~Dp~GaR~~sGs~Dy~v~~wDf~gMdas~~~fr~l~P~E~h~i~sl~ys~Tg~~iLvvsg~a  236 (641)
T KOG0772|consen  157 GSHEIQLKHGTKIVSALAVDPSGARFVSGSLDYTVKFWDFQGMDASMRSFRQLQPCETHQINSLQYSVTGDQILVVSGSA  236 (641)
T ss_pred             ccceEeccCCceEEEEeeecCCCceeeeccccceEEEEecccccccchhhhccCcccccccceeeecCCCCeEEEEecCc
Confidence            445666677776    4554  99999999999999999884   4443   1                      23444


Q ss_pred             c-------------------------------------------------------EEEeecCCC-ceeEEecCC--CCC
Q 001070          187 K-------------------------------------------------------IKIWEDSKV-APLIILKPH--GGQ  208 (1165)
Q Consensus       187 q-------------------------------------------------------VriWD~~~g-~pl~~leph--dG~  208 (1165)
                      |                                                       +||||+.+- ..++++++-  .|.
T Consensus       237 qakl~DRdG~~~~e~~KGDQYI~Dm~nTKGHia~lt~g~whP~~k~~FlT~s~DgtlRiWdv~~~k~q~qVik~k~~~g~  316 (641)
T KOG0772|consen  237 QAKLLDRDGFEIVEFSKGDQYIRDMYNTKGHIAELTCGCWHPDNKEEFLTCSYDGTLRIWDVNNTKSQLQVIKTKPAGGK  316 (641)
T ss_pred             ceeEEccCCceeeeeeccchhhhhhhccCCceeeeeccccccCcccceEEecCCCcEEEEecCCchhheeEEeeccCCCc
Confidence            4                                                       999998753 346666654  454


Q ss_pred             --CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          209 --PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       209 --sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                        +|.+-+|  .|+++    +|++|.+|..|.+|+.   ++|.+    ..-.|+.--..       +. .=+.+|+++++
T Consensus       317 Rv~~tsC~~--nrdg~----~iAagc~DGSIQ~W~~---~~~~v----~p~~~vk~AH~-------~g-~~Itsi~FS~d  375 (641)
T KOG0772|consen  317 RVPVTSCAW--NRDGK----LIAAGCLDGSIQIWDK---GSRTV----RPVMKVKDAHL-------PG-QDITSISFSYD  375 (641)
T ss_pred             ccCceeeec--CCCcc----hhhhcccCCceeeeec---CCccc----ccceEeeeccC-------CC-CceeEEEeccc
Confidence              8999999  56654    4889999999999997   22311    11233332221       01 13457888999


Q ss_pred             CcEEEEeccCCCcEEEEEeecCCCccccccccccccccccce------eeeeeccCC--CCcceEEEE
Q 001070          287 AGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPV------LSFTGTIDP--PSEHIIKLY  346 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PI------LSft~~~d~--~ge~~vq~y  346 (1165)
                      |++| |+----+++-+--|..-..+...+.+-.+.|.-+-=+      |.|||++-+  .+++.+..|
T Consensus       376 g~~L-lSRg~D~tLKvWDLrq~kkpL~~~tgL~t~~~~tdc~FSPd~kli~TGtS~~~~~~~g~L~f~  442 (641)
T KOG0772|consen  376 GNYL-LSRGFDDTLKVWDLRQFKKPLNVRTGLPTPFPGTDCCFSPDDKLILTGTSAPNGMTAGTLFFF  442 (641)
T ss_pred             cchh-hhccCCCceeeeeccccccchhhhcCCCccCCCCccccCCCceEEEecccccCCCCCceEEEE
Confidence            8875 4545556666666665555555555555555544433      457888765  455644444


No 144
>KOG0269 consensus WD40 repeat-containing protein [Function unknown]
Probab=97.28  E-value=0.00037  Score=85.29  Aligned_cols=114  Identities=12%  Similarity=0.259  Sum_probs=87.5

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhH----hhcCCcc-----------------------EEEeecCCCceeEEecCCCCC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRS----LLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~----llrGH~q-----------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      +..||||.+-+|.|-|||++..+|.    .|.-|+-                       ||+||.+.---...+.. +-+
T Consensus        99 ~~NlIAT~s~nG~i~vWdlnk~~rnk~l~~f~EH~Rs~~~ldfh~tep~iliSGSQDg~vK~~DlR~~~S~~t~~~-nSE  177 (839)
T KOG0269|consen   99 YSNLIATCSTNGVISVWDLNKSIRNKLLTVFNEHERSANKLDFHSTEPNILISGSQDGTVKCWDLRSKKSKSTFRS-NSE  177 (839)
T ss_pred             hhhhheeecCCCcEEEEecCccccchhhhHhhhhccceeeeeeccCCccEEEecCCCceEEEEeeecccccccccc-cch
Confidence            3679999999999999999984433    7888887                       99999997666677775 467


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      +|..|.|.  |.-++   -.+++.-+..|++||+--..           +|..-|.        .|..+++=+-.+|...
T Consensus       178 SiRDV~fs--p~~~~---~F~s~~dsG~lqlWDlRqp~-----------r~~~k~~--------AH~GpV~c~nwhPnr~  233 (839)
T KOG0269|consen  178 SIRDVKFS--PGYGN---KFASIHDSGYLQLWDLRQPD-----------RCEKKLT--------AHNGPVLCLNWHPNRE  233 (839)
T ss_pred             hhhceeec--cCCCc---eEEEecCCceEEEeeccCch-----------hHHHHhh--------cccCceEEEeecCCCc
Confidence            99999995  43333   56689999999999994442           5555555        5778888888899777


Q ss_pred             EEEEec
Q 001070          289 LLLFAN  294 (1165)
Q Consensus       289 ~ilLan  294 (1165)
                      ||--.-
T Consensus       234 ~lATGG  239 (839)
T KOG0269|consen  234 WLATGG  239 (839)
T ss_pred             eeeecC
Confidence            765443


No 145
>COG2319 FOG: WD40 repeat [General function prediction only]
Probab=97.24  E-value=0.0037  Score=65.63  Aligned_cols=124  Identities=23%  Similarity=0.392  Sum_probs=88.1

Q ss_pred             cCc-eEEE-eecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCC
Q 001070          156 NKH-YVCY-GLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       156 n~~-yIay-G~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~  208 (1165)
                      ++. +++. +..|+.|++||+.+  .....+.+|..                       +++||...+.++..+..|+ .
T Consensus       121 ~~~~~~~~~~~~d~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~  199 (466)
T COG2319         121 DGNSILLASSSLDGTVKLWDLSTPGKLIRTLEGHSESVTSLAFSPDGKLLASGSSLDGTIKLWDLRTGKPLSTLAGHT-D  199 (466)
T ss_pred             CcceEEeccCCCCccEEEEEecCCCeEEEEEecCcccEEEEEECCCCCEEEecCCCCCceEEEEcCCCceEEeeccCC-C
Confidence            555 4444 44499999999996  66667888876                       9999999888899998874 5


Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE-EEeccCCCCCcccccc-EEEEEeecC
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ-TLDLKSSAKPRVEEAF-FNQVVVLSQ  286 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q-TLe~~~s~~~~~~~af-f~sV~~~p~  286 (1165)
                      .|.+++|.  |+++   +++++++.|.+|++|+..            ...|.. ++.+        |... ++  .+.|+
T Consensus       200 ~v~~~~~~--~~~~---~~~~~~~~d~~i~~wd~~------------~~~~~~~~~~~--------~~~~~~~--~~~~~  252 (466)
T COG2319         200 PVSSLAFS--PDGG---LLIASGSSDGTIRLWDLS------------TGKLLRSTLSG--------HSDSVVS--SFSPD  252 (466)
T ss_pred             ceEEEEEc--CCcc---eEEEEecCCCcEEEEECC------------CCcEEeeecCC--------CCcceeE--eECCC
Confidence            99999995  6665   467678999999999764            236666 4554        3333 22  56777


Q ss_pred             CcEEEEeccCCCcEEEEEeecC
Q 001070          287 AGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      +.+++ +......++...+...
T Consensus       253 ~~~~~-~~~~d~~~~~~~~~~~  273 (466)
T COG2319         253 GSLLA-SGSSDGTIRLWDLRSS  273 (466)
T ss_pred             CCEEE-EecCCCcEEEeeecCC
Confidence            74444 5566666777766643


No 146
>KOG0322 consensus G-protein beta subunit-like protein GNB1L, contains WD repeats [General function prediction only]
Probab=97.21  E-value=0.00045  Score=76.54  Aligned_cols=48  Identities=27%  Similarity=0.571  Sum_probs=41.6

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      |||+..+++.||.+|+=|. .-|++|||  .|+. .   |+++|+-|.+|-||++
T Consensus       275 iRVyswrtl~pLAVLkyHs-agvn~vAf--spd~-~---lmAaaskD~rISLWkL  322 (323)
T KOG0322|consen  275 IRVYSWRTLNPLAVLKYHS-AGVNAVAF--SPDC-E---LMAAASKDARISLWKL  322 (323)
T ss_pred             EEEEEeccCCchhhhhhhh-cceeEEEe--CCCC-c---hhhhccCCceEEeeec
Confidence            8899999999999999996 47999999  4652 1   6889999999999986


No 147
>KOG2096 consensus WD40 repeat protein [General function prediction only]
Probab=97.21  E-value=0.0024  Score=72.38  Aligned_cols=138  Identities=11%  Similarity=0.181  Sum_probs=80.7

Q ss_pred             ccEeeecCceEEEeecCCcEEEEeCcc----h---hhH-hhcCCcc-EEEeecCCC--------ceeEEec---CCCCC-
Q 001070          150 GRQIAVNKHYVCYGLKGGNVRVLNLNT----A---TRS-LLRGHTK-IKIWEDSKV--------APLIILK---PHGGQ-  208 (1165)
Q Consensus       150 GR~IAVn~~yIayG~kdg~IRVwdi~t----~---ir~-llrGH~q-VriWD~~~g--------~pl~~le---phdG~-  208 (1165)
                      |=-++-|||||||.+-||.|||||..-    .   +|. +=-||-. |+|=++.+.        --|.++.   -.||. 
T Consensus        91 ~~~FsSdGK~lat~~~Dr~Ir~w~~~DF~~~eHr~~R~nve~dhpT~V~FapDc~s~vv~~~~g~~l~vyk~~K~~dG~~  170 (420)
T KOG2096|consen   91 DVAFSSDGKKLATISGDRSIRLWDVRDFENKEHRCIRQNVEYDHPTRVVFAPDCKSVVVSVKRGNKLCVYKLVKKTDGSG  170 (420)
T ss_pred             eeEEcCCCceeEEEeCCceEEEEecchhhhhhhhHhhccccCCCceEEEECCCcceEEEEEccCCEEEEEEeeecccCCC
Confidence            334777999999999999999999885    1   222 2223433 444443322        1111111   00221 


Q ss_pred             C-------------cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccc
Q 001070          209 P-------------VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEE  275 (1165)
Q Consensus       209 s-------------V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~  275 (1165)
                      +             +.+|--.+---....+|+. ++++|.+|-||++-             +.-+|++.-.-+.      
T Consensus       171 ~~~~v~~D~~~f~~kh~v~~i~iGiA~~~k~im-sas~dt~i~lw~lk-------------Gq~L~~idtnq~~------  230 (420)
T KOG2096|consen  171 SHHFVHIDNLEFERKHQVDIINIGIAGNAKYIM-SASLDTKICLWDLK-------------GQLLQSIDTNQSS------  230 (420)
T ss_pred             CcccccccccccchhcccceEEEeecCCceEEE-EecCCCcEEEEecC-------------Cceeeeecccccc------
Confidence            1             1111111100012345444 79999999999983             3677777742211      


Q ss_pred             ccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCC
Q 001070          276 AFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       276 aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~  310 (1165)
                      .+  ..+++|+|+||..+.-+ +-+.+.++-|+.+
T Consensus       231 n~--~aavSP~GRFia~~gFT-pDVkVwE~~f~kd  262 (420)
T KOG2096|consen  231 NY--DAAVSPDGRFIAVSGFT-PDVKVWEPIFTKD  262 (420)
T ss_pred             cc--ceeeCCCCcEEEEecCC-CCceEEEEEeccC
Confidence            11  45789999998877554 7788999999888


No 148
>KOG1034 consensus Transcriptional repressor EED/ESC/FIE, required for transcriptional silencing, WD repeat superfamily [Transcription]
Probab=97.20  E-value=0.00082  Score=76.21  Aligned_cols=83  Identities=14%  Similarity=0.229  Sum_probs=73.1

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      |||-|..++...-.+.+| |++|+-+-|  .|+.+.   ||.+||-|++||||+..+.            .|+--|-|. 
T Consensus       117 IrVid~~~~~~~~~~~gh-G~sINeik~--~p~~~q---lvls~SkD~svRlwnI~~~------------~Cv~VfGG~-  177 (385)
T KOG1034|consen  117 IRVIDVVSGQCSKNYRGH-GGSINEIKF--HPDRPQ---LVLSASKDHSVRLWNIQTD------------VCVAVFGGV-  177 (385)
T ss_pred             EEEEecchhhhccceecc-Cccchhhhc--CCCCCc---EEEEecCCceEEEEeccCC------------eEEEEeccc-
Confidence            999999999999999999 889999999  587777   8889999999999999666            999888762 


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEe
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFA  293 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLa  293 (1165)
                        +  ||.+-+|+|-.++++.+|+=.
T Consensus       178 --e--gHrdeVLSvD~~~~gd~i~Sc  199 (385)
T KOG1034|consen  178 --E--GHRDEVLSVDFSLDGDRIASC  199 (385)
T ss_pred             --c--cccCcEEEEEEcCCCCeeecc
Confidence              2  799999999999999976544


No 149
>KOG0307 consensus Vesicle coat complex COPII, subunit SEC31 [Intracellular trafficking, secretion, and vesicular transport]
Probab=97.18  E-value=0.0012  Score=83.57  Aligned_cols=168  Identities=19%  Similarity=0.263  Sum_probs=119.0

Q ss_pred             cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeec-CceEEEeecCCcEEEEeCcc-hhhHhhc------
Q 001070          112 FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVN-KHYVCYGLKGGNVRVLNLNT-ATRSLLR------  183 (1165)
Q Consensus       112 ~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn-~~yIayG~kdg~IRVwdi~t-~ir~llr------  183 (1165)
                      .|.-+.||++.-+.|+.-      .-|.-|....+-+.|.-+-.. |..||.|+.||.|-|||++. ..-..+-      
T Consensus        89 dG~I~ly~p~~~~~~~~~------~~la~~~~h~G~V~gLDfN~~q~nlLASGa~~geI~iWDlnn~~tP~~~~~~~~~~  162 (1049)
T KOG0307|consen   89 DGNIVLYDPASIIANASE------EVLATKSKHTGPVLGLDFNPFQGNLLASGADDGEILIWDLNKPETPFTPGSQAPPS  162 (1049)
T ss_pred             CCceEEecchhhccCcch------HHHhhhcccCCceeeeeccccCCceeeccCCCCcEEEeccCCcCCCCCCCCCCCcc
Confidence            456677998886444443      346677777878888333333 67999999999999999996 3222221      


Q ss_pred             -----------------CCcc--EEEeecCCCceeEEecCCCCC-CcceeEeecCCCCCCceEEEeecC-CCceEEEeEc
Q 001070          184 -----------------GHTK--IKIWEDSKVAPLIILKPHGGQ-PVNSAQYLTAPNQAGHIILVTAGP-LNREVKLWAS  242 (1165)
Q Consensus       184 -----------------GH~q--VriWD~~~g~pl~~lephdG~-sV~SVaFl~aP~~~d~~~lvtsGs-lnrtIKLW~~  242 (1165)
                                       ||..  +-|||+++-.|+-.+.-|-|. -+.+|+|  .|++.. +.++++++ .+-.|+|||+
T Consensus       163 eI~~lsWNrkvqhILAS~s~sg~~~iWDlr~~~pii~ls~~~~~~~~S~l~W--hP~~aT-ql~~As~dd~~PviqlWDl  239 (1049)
T KOG0307|consen  163 EIKCLSWNRKVSHILASGSPSGRAVIWDLRKKKPIIKLSDTPGRMHCSVLAW--HPDHAT-QLLVASGDDSAPVIQLWDL  239 (1049)
T ss_pred             cceEeccchhhhHHhhccCCCCCceeccccCCCcccccccCCCccceeeeee--CCCCce-eeeeecCCCCCceeEeecc
Confidence                             1111  789999998887777655453 5889999  788876 44565554 4568999997


Q ss_pred             cCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          243 ASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       243 a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      --.           -.-.++|+        +|+.=++++...++..-+||+..+-+-||+--.+-
T Consensus       240 R~a-----------ssP~k~~~--------~H~~GilslsWc~~D~~lllSsgkD~~ii~wN~~t  285 (1049)
T KOG0307|consen  240 RFA-----------SSPLKILE--------GHQRGILSLSWCPQDPRLLLSSGKDNRIICWNPNT  285 (1049)
T ss_pred             ccc-----------CCchhhhc--------ccccceeeeccCCCCchhhhcccCCCCeeEecCCC
Confidence            222           12345565        46777778888899989999999999999986654


No 150
>KOG0300 consensus WD40 repeat-containing protein [Function unknown]
Probab=97.12  E-value=0.0019  Score=72.88  Aligned_cols=118  Identities=24%  Similarity=0.372  Sum_probs=82.4

Q ss_pred             CceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhH--hhcCCcc----
Q 001070          114 DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRS--LLRGHTK----  187 (1165)
Q Consensus       114 ~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~--llrGH~q----  187 (1165)
                      -+.+||||++++         |.++|-..+|---+-.   -.+-+.++|.++|-+.|+||..-+|.+  .|.||+.    
T Consensus       295 TAnlwDVEtge~---------v~~LtGHd~ELtHcst---HptQrLVvTsSrDtTFRLWDFReaI~sV~VFQGHtdtVTS  362 (481)
T KOG0300|consen  295 TANLWDVETGEV---------VNILTGHDSELTHCST---HPTQRLVVTSSRDTTFRLWDFREAIQSVAVFQGHTDTVTS  362 (481)
T ss_pred             cceeeeeccCce---------eccccCcchhcccccc---CCcceEEEEeccCceeEeccchhhcceeeeecccccceeE
Confidence            467899999765         3344443333211111   113345579999999999999987766  8999998    


Q ss_pred             -----------------EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCC
Q 001070          188 -----------------IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWS  249 (1165)
Q Consensus       188 -----------------VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~  249 (1165)
                                       |||||.++ ..||.+++..  -+++.|+-.     .++. +|+=---||.|+|+|+.+-+=.-
T Consensus       363 ~vF~~dd~vVSgSDDrTvKvWdLrNMRsplATIRtd--S~~NRvavs-----~g~~-iIAiPhDNRqvRlfDlnG~RlaR  434 (481)
T KOG0300|consen  363 VVFNTDDRVVSGSDDRTVKVWDLRNMRSPLATIRTD--SPANRVAVS-----KGHP-IIAIPHDNRQVRLFDLNGNRLAR  434 (481)
T ss_pred             EEEecCCceeecCCCceEEEeeeccccCcceeeecC--CccceeEee-----cCCc-eEEeccCCceEEEEecCCCcccc
Confidence                             99999987 5688888743  489999985     5554 33335579999999997765333


Q ss_pred             CC
Q 001070          250 LP  251 (1165)
Q Consensus       250 ~~  251 (1165)
                      +|
T Consensus       435 lP  436 (481)
T KOG0300|consen  435 LP  436 (481)
T ss_pred             CC
Confidence            34


No 151
>KOG1408 consensus WD40 repeat protein [Function unknown]
Probab=97.12  E-value=0.00059  Score=82.86  Aligned_cols=85  Identities=14%  Similarity=0.246  Sum_probs=72.8

Q ss_pred             eeec--CceEEEeecCCcEEEEeCcc-hhhHhhcC---Ccc----------------------EEEeecCCCceeEEecC
Q 001070          153 IAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRG---HTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrG---H~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      .+||  -||+++|--|++|||+||.+ .+..+|+|   |+.                      +-|+|.-+|.++.+.-+
T Consensus       602 m~Vdp~~k~v~t~cQDrnirif~i~sgKq~k~FKgs~~~eG~lIKv~lDPSgiY~atScsdktl~~~Df~sgEcvA~m~G  681 (1080)
T KOG1408|consen  602 MAVDPTSKLVVTVCQDRNIRIFDIESGKQVKSFKGSRDHEGDLIKVILDPSGIYLATSCSDKTLCFVDFVSGECVAQMTG  681 (1080)
T ss_pred             eeeCCCcceEEEEecccceEEEeccccceeeeecccccCCCceEEEEECCCccEEEEeecCCceEEEEeccchhhhhhcC
Confidence            4565  69999999999999999999 88888876   433                      66888888989999999


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      | ++.|.-|-|+     +|-++|| |.+.|..|-+|.+..
T Consensus       682 H-sE~VTG~kF~-----nDCkHlI-SvsgDgCIFvW~lp~  714 (1080)
T KOG1408|consen  682 H-SEAVTGVKFL-----NDCKHLI-SVSGDGCIFVWKLPL  714 (1080)
T ss_pred             c-chheeeeeec-----ccchhhe-eecCCceEEEEECch
Confidence            9 7999999997     6667788 699999999999844


No 152
>KOG0641 consensus WD40 repeat protein [General function prediction only]
Probab=96.95  E-value=0.0019  Score=70.33  Aligned_cols=118  Identities=19%  Similarity=0.279  Sum_probs=85.3

Q ss_pred             Cceee----cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeee---cCceEEEeecCCcEEEEeCcc--h
Q 001070          107 YGKRV----FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAV---NKHYVCYGLKGGNVRVLNLNT--A  177 (1165)
Q Consensus       107 ~Gr~l----~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAV---n~~yIayG~kdg~IRVwdi~t--~  177 (1165)
                      +|+.|    .|+--+|--|-+   ..| +      .--|.    -..|.-+|.   ||..+++|+.|++||.||+.-  -
T Consensus       151 ~~~il~s~gagdc~iy~tdc~---~g~-~------~~a~s----ghtghilalyswn~~m~~sgsqdktirfwdlrv~~~  216 (350)
T KOG0641|consen  151 GGAILASAGAGDCKIYITDCG---RGQ-G------FHALS----GHTGHILALYSWNGAMFASGSQDKTIRFWDLRVNSC  216 (350)
T ss_pred             CceEEEecCCCcceEEEeecC---CCC-c------ceeec----CCcccEEEEEEecCcEEEccCCCceEEEEeeeccce
Confidence            68887    347777877763   224 1      11121    122444443   788999999999999999862  1


Q ss_pred             h--------------------------hHhhcCCcc--EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEe
Q 001070          178 T--------------------------RSLLRGHTK--IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVT  229 (1165)
Q Consensus       178 i--------------------------r~llrGH~q--VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvt  229 (1165)
                      +                          |.|-.||..  -.+||++.|.++++|-||. -.|.+|-|.     |+-.||+|
T Consensus       217 v~~l~~~~~~~glessavaav~vdpsgrll~sg~~dssc~lydirg~r~iq~f~phs-adir~vrfs-----p~a~yllt  290 (350)
T KOG0641|consen  217 VNTLDNDFHDGGLESSAVAAVAVDPSGRLLASGHADSSCMLYDIRGGRMIQRFHPHS-ADIRCVRFS-----PGAHYLLT  290 (350)
T ss_pred             eeeccCcccCCCcccceeEEEEECCCcceeeeccCCCceEEEEeeCCceeeeeCCCc-cceeEEEeC-----CCceEEEE
Confidence            1                          334555655  7899999999999999995 589999994     55566886


Q ss_pred             ecCCCceEEEeEccCc
Q 001070          230 AGPLNREVKLWASASE  245 (1165)
Q Consensus       230 sGslnrtIKLW~~a~~  245 (1165)
                       +|.|..|||=|+.+.
T Consensus       291 -~syd~~ikltdlqgd  305 (350)
T KOG0641|consen  291 -CSYDMKIKLTDLQGD  305 (350)
T ss_pred             -ecccceEEEeecccc
Confidence             999999999998654


No 153
>KOG0771 consensus Prolactin regulatory element-binding protein/Protein transport protein SEC12p [Intracellular trafficking, secretion, and vesicular transport]
Probab=96.90  E-value=0.0045  Score=71.95  Aligned_cols=133  Identities=16%  Similarity=0.178  Sum_probs=83.4

Q ss_pred             cccEe--ee--cCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc--------------------EEEeecCCCceeEEe
Q 001070          149 IGRQI--AV--NKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK--------------------IKIWEDSKVAPLIIL  202 (1165)
Q Consensus       149 ~GR~I--AV--n~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q--------------------VriWD~~~g~pl~~l  202 (1165)
                      .|++.  |.  ||.-|++|..||.+|||+--+  .+-....-|.-                    -||||+++|.++.++
T Consensus       144 ~g~~k~vaf~~~gs~latgg~dg~lRv~~~Ps~~t~l~e~~~~~eV~DL~FS~dgk~lasig~d~~~VW~~~~g~~~a~~  223 (398)
T KOG0771|consen  144 FGQQKVVAFNGDGSKLATGGTDGTLRVWEWPSMLTILEEIAHHAEVKDLDFSPDGKFLASIGADSARVWSVNTGAALARK  223 (398)
T ss_pred             cCcceEEEEcCCCCEeeeccccceEEEEecCcchhhhhhHhhcCccccceeCCCCcEEEEecCCceEEEEeccCchhhhc
Confidence            45553  33  589999999999999999433  33333333332                    789999999999999


Q ss_pred             cCCCCCCcce-eEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEE
Q 001070          203 KPHGGQPVNS-AQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQV  281 (1165)
Q Consensus       203 ephdG~sV~S-VaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV  281 (1165)
                      .|.+++..++ .-|...+.+ +..+|.+.-.-.+-|.+|++..-.+        . .-.+....   .   .-..-..+.
T Consensus       224 t~~~k~~~~~~cRF~~d~~~-~~l~laa~~~~~~~v~~~~~~~w~~--------~-~~l~~~~~---~---~~~~siSsl  287 (398)
T KOG0771|consen  224 TPFSKDEMFSSCRFSVDNAQ-ETLRLAASQFPGGGVRLCDISLWSG--------S-NFLRLRKK---I---KRFKSISSL  287 (398)
T ss_pred             CCcccchhhhhceecccCCC-ceEEEEEecCCCCceeEEEeeeecc--------c-cccchhhh---h---hccCcceeE
Confidence            9998875555 456544555 4444666555566666677633211        0 11111110   0   001234577


Q ss_pred             EeecCCcEEEEeccCC
Q 001070          282 VVLSQAGLLLFANAKK  297 (1165)
Q Consensus       282 ~~~p~a~~ilLan~~r  297 (1165)
                      +++.+|.|+.|+-...
T Consensus       288 ~VS~dGkf~AlGT~dG  303 (398)
T KOG0771|consen  288 AVSDDGKFLALGTMDG  303 (398)
T ss_pred             EEcCCCcEEEEeccCC
Confidence            8999999999887644


No 154
>COG2319 FOG: WD40 repeat [General function prediction only]
Probab=96.84  E-value=0.014  Score=61.31  Aligned_cols=120  Identities=22%  Similarity=0.401  Sum_probs=84.8

Q ss_pred             cCceEEEeecCCcEEEEeCcch--hhHhhcC-Cc-------------------------cEEEeecCC-CceeEEecCCC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTA--TRSLLRG-HT-------------------------KIKIWEDSK-VAPLIILKPHG  206 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~--ir~llrG-H~-------------------------qVriWD~~~-g~pl~~lephd  206 (1165)
                      ++.+++.+.-|+.|++||....  ....+.+ |.                         .|++||..+ +..+..+..|.
T Consensus        76 ~~~~~~~~~~d~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~d~~~~~~~~~~~~~~~~~~~~~~  155 (466)
T COG2319          76 DGELLLSGSSDGTIKLWDLDNGEKLIKSLEGLHDSSVSKLALSSPDGNSILLASSSLDGTVKLWDLSTPGKLIRTLEGHS  155 (466)
T ss_pred             CCcEEEEecCCCcEEEEEcCCCceeEEEEeccCCCceeeEEEECCCcceEEeccCCCCccEEEEEecCCCeEEEEEecCc
Confidence            4666666667788888887763  2333333 21                         088999987 77788888884


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                       ..|+.++|  .|++.   +++.++..+..+++|+...            +.++.++.+        |...+..+...|+
T Consensus       156 -~~v~~~~~--~~~~~---~~~~~~~~~~~~~~~~~~~------------~~~~~~~~~--------~~~~v~~~~~~~~  209 (466)
T COG2319         156 -ESVTSLAF--SPDGK---LLASGSSLDGTIKLWDLRT------------GKPLSTLAG--------HTDPVSSLAFSPD  209 (466)
T ss_pred             -ccEEEEEE--CCCCC---EEEecCCCCCceEEEEcCC------------CceEEeecc--------CCCceEEEEEcCC
Confidence             58999999  45554   4554433599999999844            478888885        6777778888899


Q ss_pred             CcEEEEeccCCCcEE
Q 001070          287 AGLLLFANAKKNAIY  301 (1165)
Q Consensus       287 a~~ilLan~~r~aIY  301 (1165)
                      +.+++++......|+
T Consensus       210 ~~~~~~~~~~d~~i~  224 (466)
T COG2319         210 GGLLIASGSSDGTIR  224 (466)
T ss_pred             cceEEEEecCCCcEE
Confidence            987777755556665


No 155
>KOG1036 consensus Mitotic spindle checkpoint protein BUB3, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning]
Probab=96.82  E-value=0.0023  Score=72.20  Aligned_cols=116  Identities=25%  Similarity=0.363  Sum_probs=82.6

Q ss_pred             CCCceee----cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhH
Q 001070          105 PIYGKRV----FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRS  180 (1165)
Q Consensus       105 p~~Gr~l----~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~  180 (1165)
                      |.++..|    -|.-.+|||+...-      .+      +|..+..+..  -=-.|.+-+++|.-||.||.+|+++.--.
T Consensus        23 ~~~~~LLvssWDgslrlYdv~~~~l------~~------~~~~~~plL~--c~F~d~~~~~~G~~dg~vr~~Dln~~~~~   88 (323)
T KOG1036|consen   23 PSSSDLLVSSWDGSLRLYDVPANSL------KL------KFKHGAPLLD--CAFADESTIVTGGLDGQVRRYDLNTGNED   88 (323)
T ss_pred             CcCCcEEEEeccCcEEEEeccchhh------hh------heecCCceee--eeccCCceEEEeccCceEEEEEecCCcce
Confidence            6678887    46888999998521      12      2222221111  11124677789999999999999996666


Q ss_pred             hhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEE
Q 001070          181 LLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVK  238 (1165)
Q Consensus       181 llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIK  238 (1165)
                      .+-.|..                      ||+||.+..+++..++  .|+.||++.-      .+.+ ||+ |-.||.+-
T Consensus        89 ~igth~~~i~ci~~~~~~~~vIsgsWD~~ik~wD~R~~~~~~~~d--~~kkVy~~~v------~g~~-LvV-g~~~r~v~  158 (323)
T KOG1036|consen   89 QIGTHDEGIRCIEYSYEVGCVISGSWDKTIKFWDPRNKVVVGTFD--QGKKVYCMDV------SGNR-LVV-GTSDRKVL  158 (323)
T ss_pred             eeccCCCceEEEEeeccCCeEEEcccCccEEEEeccccccccccc--cCceEEEEec------cCCE-EEE-eecCceEE
Confidence            6666766                      9999999877777776  4679999988      4545 565 66999999


Q ss_pred             EeEccC
Q 001070          239 LWASAS  244 (1165)
Q Consensus       239 LW~~a~  244 (1165)
                      +|||-.
T Consensus       159 iyDLRn  164 (323)
T KOG1036|consen  159 IYDLRN  164 (323)
T ss_pred             EEEccc
Confidence            999843


No 156
>KOG0650 consensus WD40 repeat nucleolar protein Bop1, involved in ribosome biogenesis [Translation, ribosomal structure and biogenesis]
Probab=96.81  E-value=0.00091  Score=80.20  Aligned_cols=37  Identities=24%  Similarity=0.521  Sum_probs=30.9

Q ss_pred             cEeeec--CceEEEeecCCcEEEEeCcc--hhhH-hhcCCcc
Q 001070          151 RQIAVN--KHYVCYGLKGGNVRVLNLNT--ATRS-LLRGHTK  187 (1165)
Q Consensus       151 R~IAVn--~~yIayG~kdg~IRVwdi~t--~ir~-llrGH~q  187 (1165)
                      |.|+|+  |.||++|.+||.+|||-|.|  -+|. +|-+|-.
T Consensus       404 r~iSvdp~G~wlasGsdDGtvriWEi~TgRcvr~~~~d~~I~  445 (733)
T KOG0650|consen  404 RSISVDPSGEWLASGSDDGTVRIWEIATGRCVRTVQFDSEIR  445 (733)
T ss_pred             EEEEecCCcceeeecCCCCcEEEEEeecceEEEEEeecceeE
Confidence            558887  99999999999999999999  5555 6777665


No 157
>PRK01742 tolB translocation protein TolB; Provisional
Probab=96.76  E-value=0.018  Score=67.69  Aligned_cols=125  Identities=12%  Similarity=0.207  Sum_probs=78.0

Q ss_pred             eeecCceEEEeecC---CcEEEEeCcchh-h--HhhcCCcc----------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLKG---GNVRVLNLNTAT-R--SLLRGHTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~kd---g~IRVwdi~t~i-r--~llrGH~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      .+-||++|+|...+   .+|++||+.+.. +  .-+.||..                      |.+||..++. +.++..
T Consensus       211 wSPDG~~la~~s~~~~~~~i~i~dl~tg~~~~l~~~~g~~~~~~wSPDG~~La~~~~~~g~~~Iy~~d~~~~~-~~~lt~  289 (429)
T PRK01742        211 WSPDGSKLAYVSFENKKSQLVVHDLRSGARKVVASFRGHNGAPAFSPDGSRLAFASSKDGVLNIYVMGANGGT-PSQLTS  289 (429)
T ss_pred             EcCCCCEEEEEEecCCCcEEEEEeCCCCceEEEecCCCccCceeECCCCCEEEEEEecCCcEEEEEEECCCCC-eEeecc
Confidence            56689999997643   479999998732 2  23566655                      4445666555 566766


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      +.+ .+.+++|  +|||   +.|+.++.-+...+||+.....+          . ...+.+         ..+  ...++
T Consensus       290 ~~~-~~~~~~w--SpDG---~~i~f~s~~~g~~~I~~~~~~~~----------~-~~~l~~---------~~~--~~~~S  341 (429)
T PRK01742        290 GAG-NNTEPSW--SPDG---QSILFTSDRSGSPQVYRMSASGG----------G-ASLVGG---------RGY--SAQIS  341 (429)
T ss_pred             CCC-CcCCEEE--CCCC---CEEEEEECCCCCceEEEEECCCC----------C-eEEecC---------CCC--CccCC
Confidence            544 5889999  4665   33554455567789998755422          1 122221         112  35679


Q ss_pred             cCCcEEEEeccCCCcEEEEEeecC
Q 001070          285 SQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       285 p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      |++++|+++..  ..||.+.+.-|
T Consensus       342 pDG~~ia~~~~--~~i~~~Dl~~g  363 (429)
T PRK01742        342 ADGKTLVMING--DNVVKQDLTSG  363 (429)
T ss_pred             CCCCEEEEEcC--CCEEEEECCCC
Confidence            99999887754  56777665443


No 158
>KOG1274 consensus WD40 repeat protein [General function prediction only]
Probab=96.76  E-value=0.0068  Score=75.77  Aligned_cols=132  Identities=20%  Similarity=0.336  Sum_probs=95.3

Q ss_pred             ccEeeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecC
Q 001070          150 GRQIAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       150 GR~IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      -|-.+||  |+|||-|+.|-.|+|+|... .+...||||+.                      |+|||.++|.....|..
T Consensus        99 ~r~~~v~g~g~~iaagsdD~~vK~~~~~D~s~~~~lrgh~apVl~l~~~p~~~fLAvss~dG~v~iw~~~~~~~~~tl~~  178 (933)
T KOG1274|consen   99 IRDLAVSGSGKMIAAGSDDTAVKLLNLDDSSQEKVLRGHDAPVLQLSYDPKGNFLAVSSCDGKVQIWDLQDGILSKTLTG  178 (933)
T ss_pred             ceEEEEecCCcEEEeecCceeEEEEeccccchheeecccCCceeeeeEcCCCCEEEEEecCceEEEEEcccchhhhhccc
Confidence            4556675  77999999999999999998 88889999998                      99999999977666654


Q ss_pred             CC-------CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccccc
Q 001070          205 HG-------GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAF  277 (1165)
Q Consensus       205 hd-------G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~af  277 (1165)
                      -+       -..+.-++|  .|++..  +++  -+.+++||+++-            .+|.-.-+|......      .-
T Consensus       179 v~k~n~~~~s~i~~~~aW--~Pk~g~--la~--~~~d~~Vkvy~r------------~~we~~f~Lr~~~~s------s~  234 (933)
T KOG1274|consen  179 VDKDNEFILSRICTRLAW--HPKGGT--LAV--PPVDNTVKVYSR------------KGWELQFKLRDKLSS------SK  234 (933)
T ss_pred             CCccccccccceeeeeee--cCCCCe--EEe--eccCCeEEEEcc------------CCceeheeecccccc------cc
Confidence            31       236778888  576544  334  679999999995            445666666653322      22


Q ss_pred             EEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          278 FNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       278 f~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      |.-+..+|-|.||--+ ..++-|-+.-++
T Consensus       235 ~~~~~wsPnG~YiAAs-~~~g~I~vWnv~  262 (933)
T KOG1274|consen  235 FSDLQWSPNGKYIAAS-TLDGQILVWNVD  262 (933)
T ss_pred             eEEEEEcCCCcEEeee-ccCCcEEEEecc
Confidence            7778899997776444 444555555444


No 159
>KOG4328 consensus WD40 protein [Function unknown]
Probab=96.76  E-value=0.0074  Score=70.99  Aligned_cols=123  Identities=24%  Similarity=0.347  Sum_probs=79.9

Q ss_pred             eecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCCC----ceeEEecCCCCCCccee
Q 001070          163 GLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSKV----APLIILKPHGGQPVNSA  213 (1165)
Q Consensus       163 G~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~g----~pl~~lephdG~sV~SV  213 (1165)
                      |-.=|..-|||..+  .--..++=|++                       +||||.|.-    .|+-..-+| -++|.|+
T Consensus       297 ~~~~G~f~~iD~R~~~s~~~~~~lh~kKI~sv~~NP~~p~~laT~s~D~T~kIWD~R~l~~K~sp~lst~~H-rrsV~sA  375 (498)
T KOG4328|consen  297 GDNVGNFNVIDLRTDGSEYENLRLHKKKITSVALNPVCPWFLATASLDQTAKIWDLRQLRGKASPFLSTLPH-RRSVNSA  375 (498)
T ss_pred             eecccceEEEEeecCCccchhhhhhhcccceeecCCCCchheeecccCcceeeeehhhhcCCCCcceecccc-cceeeee
Confidence            33446778899887  33447777777                       899999863    244444456 4799999


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEe
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFA  293 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLa  293 (1165)
                      .|  +|.+..   ||| -++|.+|+|||..--..|..|         .+.--|.....|--..|  +.+-+|+-.+|+++
T Consensus       376 yF--SPs~gt---l~T-T~~D~~IRv~dss~~sa~~~p---------~~~I~Hn~~t~RwlT~f--KA~W~P~~~li~vg  438 (498)
T KOG4328|consen  376 YF--SPSGGT---LLT-TCQDNEIRVFDSSCISAKDEP---------LGTIPHNNRTGRWLTPF--KAAWDPDYNLIVVG  438 (498)
T ss_pred             EE--cCCCCc---eEe-eccCCceEEeecccccccCCc---------cceeeccCcccccccch--hheeCCCccEEEEe
Confidence            99  688766   776 669999999998533334333         22211111111101122  66789999999999


Q ss_pred             ccCCCcEEEEE
Q 001070          294 NAKKNAIYSVH  304 (1165)
Q Consensus       294 n~~r~aIYalh  304 (1165)
                      +..|. |=++|
T Consensus       439 ~~~r~-IDv~~  448 (498)
T KOG4328|consen  439 RYPRP-IDVFD  448 (498)
T ss_pred             ccCcc-eeEEc
Confidence            99987 54444


No 160
>PRK04922 tolB translocation protein TolB; Provisional
Probab=96.74  E-value=0.024  Score=66.63  Aligned_cols=128  Identities=16%  Similarity=0.211  Sum_probs=75.9

Q ss_pred             eeecCceEEEeec---CCcEEEEeCcchhhHh---hcCCcc----------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLK---GGNVRVLNLNTATRSL---LRGHTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~k---dg~IRVwdi~t~ir~l---lrGH~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      ++-||++|+|...   +.+|++||+++..+..   +.|+..                      |++||..+|. +..+..
T Consensus       211 wSpDg~~la~~s~~~~~~~l~~~dl~~g~~~~l~~~~g~~~~~~~SpDG~~l~~~~s~~g~~~Iy~~d~~~g~-~~~lt~  289 (433)
T PRK04922        211 WSPDGKKLAYVSFERGRSAIYVQDLATGQRELVASFRGINGAPSFSPDGRRLALTLSRDGNPEIYVMDLGSRQ-LTRLTN  289 (433)
T ss_pred             CCCCCCEEEEEecCCCCcEEEEEECCCCCEEEeccCCCCccCceECCCCCEEEEEEeCCCCceEEEEECCCCC-eEECcc
Confidence            4557888888763   4579999998733332   233332                      7888888776 455655


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEee
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~  284 (1165)
                      +.+ .+++++|  +||+   +.|+.+...+.+..||......|          .+ +.+.+.        ..+...++++
T Consensus       290 ~~~-~~~~~~~--spDG---~~l~f~sd~~g~~~iy~~dl~~g----------~~-~~lt~~--------g~~~~~~~~S  344 (433)
T PRK04922        290 HFG-IDTEPTW--APDG---KSIYFTSDRGGRPQIYRVAASGG----------SA-ERLTFQ--------GNYNARASVS  344 (433)
T ss_pred             CCC-CccceEE--CCCC---CEEEEEECCCCCceEEEEECCCC----------Ce-EEeecC--------CCCccCEEEC
Confidence            533 4578899  4554   43554443344445555432211          21 233331        1233357889


Q ss_pred             cCCcEEEEeccCC--CcEEEEEee
Q 001070          285 SQAGLLLFANAKK--NAIYSVHLG  306 (1165)
Q Consensus       285 p~a~~ilLan~~r--~aIYalhl~  306 (1165)
                      |++++|+..+...  ..||.+.+.
T Consensus       345 pDG~~Ia~~~~~~~~~~I~v~d~~  368 (433)
T PRK04922        345 PDGKKIAMVHGSGGQYRIAVMDLS  368 (433)
T ss_pred             CCCCEEEEEECCCCceeEEEEECC
Confidence            9999998876543  357887764


No 161
>KOG0649 consensus WD40 repeat protein [General function prediction only]
Probab=96.74  E-value=0.014  Score=64.65  Aligned_cols=95  Identities=12%  Similarity=0.134  Sum_probs=59.4

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      ++-||.++|.--+++++|. +-|.+|+-  +-..  ++ ++ +|+-|.|++|||+-+            .+|+++++--.
T Consensus       138 ~y~~dlE~G~i~r~~rGHt-DYvH~vv~--R~~~--~q-il-sG~EDGtvRvWd~kt------------~k~v~~ie~yk  198 (325)
T KOG0649|consen  138 IYQVDLEDGRIQREYRGHT-DYVHSVVG--RNAN--GQ-IL-SGAEDGTVRVWDTKT------------QKHVSMIEPYK  198 (325)
T ss_pred             EEEEEecCCEEEEEEcCCc-ceeeeeee--cccC--cc-ee-ecCCCccEEEEeccc------------cceeEEecccc
Confidence            5566666666566666663 35555555  1111  23 34 699999999999944            49999999532


Q ss_pred             CC-CCccc-cccEEEEEeecCCcEEEEeccCCCcEEEE
Q 001070          268 SA-KPRVE-EAFFNQVVVLSQAGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       268 s~-~~~~~-~aff~sV~~~p~a~~ilLan~~r~aIYal  303 (1165)
                      .. -.|.| ...+  .+++=+..|+|-.--.+-+|+-+
T Consensus       199 ~~~~lRp~~g~wi--gala~~edWlvCGgGp~lslwhL  234 (325)
T KOG0649|consen  199 NPNLLRPDWGKWI--GALAVNEDWLVCGGGPKLSLWHL  234 (325)
T ss_pred             ChhhcCcccCcee--EEEeccCceEEecCCCceeEEec
Confidence            22 11111 1221  46677788999888877777644


No 162
>KOG4547 consensus WD40 repeat-containing protein [General function prediction only]
Probab=96.71  E-value=0.0079  Score=72.31  Aligned_cols=132  Identities=16%  Similarity=0.226  Sum_probs=95.2

Q ss_pred             hcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE
Q 001070          182 LRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ  261 (1165)
Q Consensus       182 lrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q  261 (1165)
                      +.+-.||++||..++.-++.|++|. -+|.++.|.+.-+|--+.|++++.--.|-|-.|-.....      +.+.-.|.-
T Consensus       160 ~~as~~ik~~~~~~kevv~~ftgh~-s~v~t~~f~~~~~g~~G~~vLssa~~~r~i~~w~v~~~~------kkks~~~sl  232 (541)
T KOG4547|consen  160 LTASRQIKVLDIETKEVVITFTGHG-SPVRTLSFTTLIDGIIGKYVLSSAAAERGITVWVVEKED------KKKSLSCSL  232 (541)
T ss_pred             EeccceEEEEEccCceEEEEecCCC-cceEEEEEEEeccccccceeeeccccccceeEEEEEccc------ccchhheee
Confidence            3333349999999998899999994 499999997666676678899999999999999875541      223456655


Q ss_pred             EEeccCCCCCccccc-cEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeeccC
Q 001070          262 TLDLKSSAKPRVEEA-FFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTID  336 (1165)
Q Consensus       262 TLe~~~s~~~~~~~a-ff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d  336 (1165)
                      +.+         +.. ++.+....--..-++||...++.+|.+-...       -.+|+.+-.++.++-.+....+
T Consensus       233 ~~~---------dipv~~ds~~~ed~~~~l~lAst~~~g~v~~~~~n-------l~~l~~~~~~kv~~~~~~~s~g  292 (541)
T KOG4547|consen  233 TVP---------DIPVTSDSGLLEDGTIPLVLASTLIPGIVHLKLSN-------LIILLHKKIVKVNGYNADSSKG  292 (541)
T ss_pred             ccC---------CCCeEeccccccccccceEEeeeccCceeeecccc-------HHHHhcCccccccceeeecccc
Confidence            554         223 3333333333346899999999999776553       6778888888888887777665


No 163
>KOG2096 consensus WD40 repeat protein [General function prediction only]
Probab=96.69  E-value=0.011  Score=67.31  Aligned_cols=171  Identities=15%  Similarity=0.175  Sum_probs=103.1

Q ss_pred             eEEecccCCCCCCCCCCcccccccccCCC---cccccccEeeecCceEEEeecCCcEEEEeCcc-hhhH----hhcCCcc
Q 001070          116 VAYDVDAVEEGREPTQQLEVNPITKYGSD---PELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRS----LLRGHTK  187 (1165)
Q Consensus       116 ~~~dVd~~~~ge~~~pqlev~pIt~Y~sd---~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~----llrGH~q  187 (1165)
                      .+|-.+-+..|...   +...+|....-+   -....-=.||-|++||++.+.|-.|-+||... .+.+    .+..|.-
T Consensus       158 ~vyk~~K~~dG~~~---~~~v~~D~~~f~~kh~v~~i~iGiA~~~k~imsas~dt~i~lw~lkGq~L~~idtnq~~n~~a  234 (420)
T KOG2096|consen  158 CVYKLVKKTDGSGS---HHFVHIDNLEFERKHQVDIINIGIAGNAKYIMSASLDTKICLWDLKGQLLQSIDTNQSSNYDA  234 (420)
T ss_pred             EEEEeeecccCCCC---cccccccccccchhcccceEEEeecCCceEEEEecCCCcEEEEecCCceeeeeccccccccce
Confidence            46888888887764   333333311111   11111223788999999999999999999885 2222    3334433


Q ss_pred             -----------------EEEeec---CCCc-----eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          188 -----------------IKIWED---SKVA-----PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       188 -----------------VriWD~---~~g~-----pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                                       |+||++   ++|.     -+-.|++|. -.|.+.||.  |+..-   +| +.|-|.++||||.
T Consensus       235 avSP~GRFia~~gFTpDVkVwE~~f~kdG~fqev~rvf~LkGH~-saV~~~aFs--n~S~r---~v-tvSkDG~wriwdt  307 (420)
T KOG2096|consen  235 AVSPDGRFIAVSGFTPDVKVWEPIFTKDGTFQEVKRVFSLKGHQ-SAVLAAAFS--NSSTR---AV-TVSKDGKWRIWDT  307 (420)
T ss_pred             eeCCCCcEEEEecCCCCceEEEEEeccCcchhhhhhhheeccch-hheeeeeeC--CCcce---eE-EEecCCcEEEeec
Confidence                             999996   3453     255566652 389999994  44422   45 6999999999998


Q ss_pred             cCcCCCCCCCCCCCcceEEEEe-ccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          243 ASEEGWSLPTHAESWKCTQTLD-LKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       243 a~~~~~~~~~~~~~w~C~QTLe-~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      +-.    +..+ +..+-+.++. +-..+   +..-.  -..+.|.|..+-++.-.---+|+-+-+
T Consensus       308 dVr----Y~~~-qDpk~Lk~g~~pl~aa---g~~p~--RL~lsP~g~~lA~s~gs~l~~~~se~g  362 (420)
T KOG2096|consen  308 DVR----YEAG-QDPKILKEGSAPLHAA---GSEPV--RLELSPSGDSLAVSFGSDLKVFASEDG  362 (420)
T ss_pred             cce----EecC-CCchHhhcCCcchhhc---CCCce--EEEeCCCCcEEEeecCCceEEEEcccC
Confidence            654    1111 1123333331 11111   11112  667889999988888877777776553


No 164
>KOG0642 consensus Cell-cycle nuclear protein, contains WD-40 repeats [Cell cycle control, cell division, chromosome partitioning]
Probab=96.64  E-value=0.0022  Score=76.61  Aligned_cols=54  Identities=24%  Similarity=0.220  Sum_probs=36.4

Q ss_pred             CcccccccccCCCcccccccE--eeecCceEEEeecCCcEEEEeC---------c--chhhHhhcCCcc
Q 001070          132 QLEVNPITKYGSDPELLIGRQ--IAVNKHYVCYGLKGGNVRVLNL---------N--TATRSLLRGHTK  187 (1165)
Q Consensus       132 qlev~pIt~Y~sd~~~~~GR~--IAVn~~yIayG~kdg~IRVwdi---------~--t~ir~llrGH~q  187 (1165)
                      .+.|.||  |++......-=.  +..||.++.+|.-||.||-||+         .  +++...|-||+.
T Consensus       331 ~~~~epi--~tfraH~gPVl~v~v~~n~~~~ysgg~Dg~I~~w~~p~n~dp~ds~dp~vl~~~l~Ghtd  397 (577)
T KOG0642|consen  331 EKDVEPI--LTFRAHEGPVLCVVVPSNGEHCYSGGIDGTIRCWNLPPNQDPDDSYDPSVLSGTLLGHTD  397 (577)
T ss_pred             ccceeee--EEEecccCceEEEEecCCceEEEeeccCceeeeeccCCCCCcccccCcchhccceecccc
Confidence            5677776  333221111112  3338999999999999999943         2  277889999999


No 165
>KOG0974 consensus WD-repeat protein WDR6, WD repeat superfamily [General function prediction only]
Probab=96.62  E-value=0.0017  Score=81.64  Aligned_cols=82  Identities=20%  Similarity=0.341  Sum_probs=60.4

Q ss_pred             cCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc--------------------EEEeecCCCceeEEecCCCCCCccee
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK--------------------IKIWEDSKVAPLIILKPHGGQPVNSA  213 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q--------------------VriWD~~~g~pl~~lephdG~sV~SV  213 (1165)
                      ||+|||+-++|+.||+|+|++  ..+-..=||+-                    -|+|+.. |.-|++++.|-|..+.++
T Consensus       186 dg~~i~s~SdDRsiRlW~i~s~~~~~~~~fgHsaRvw~~~~~~n~i~t~gedctcrvW~~~-~~~l~~y~~h~g~~iw~~  264 (967)
T KOG0974|consen  186 DGRYIASVSDDRSIRLWPIDSREVLGCTGFGHSARVWACCFLPNRIITVGEDCTCRVWGVN-GTQLEVYDEHSGKGIWKI  264 (967)
T ss_pred             CCcEEEEEecCcceeeeecccccccCcccccccceeEEEEeccceeEEeccceEEEEEecc-cceehhhhhhhhcceeEE
Confidence            799999999999999999999  55557778985                    4555333 333667777777788888


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      +.   +.+.-  .++| |-.|.+||+|++-.
T Consensus       265 ~~---~~~~~--~~vT-~g~Ds~lk~~~l~~  289 (967)
T KOG0974|consen  265 AV---PIGVI--IKVT-GGNDSTLKLWDLNG  289 (967)
T ss_pred             EE---cCCce--EEEe-eccCcchhhhhhhc
Confidence            87   22212  1454 66999999999844


No 166
>PRK01742 tolB translocation protein TolB; Provisional
Probab=96.57  E-value=0.016  Score=67.97  Aligned_cols=115  Identities=11%  Similarity=0.182  Sum_probs=70.2

Q ss_pred             cCCcEEEEeCcchhhHhhcCCcc-------------------------EEEeecCCCce--eEEecCCCCCCcceeEeec
Q 001070          165 KGGNVRVLNLNTATRSLLRGHTK-------------------------IKIWEDSKVAP--LIILKPHGGQPVNSAQYLT  217 (1165)
Q Consensus       165 kdg~IRVwdi~t~ir~llrGH~q-------------------------VriWD~~~g~p--l~~lephdG~sV~SVaFl~  217 (1165)
                      +++.|+|||.+..-+..|.+|..                         |++||..+|.+  +..++   |+ ..+++|  
T Consensus       182 ~~~~i~i~d~dg~~~~~lt~~~~~v~~p~wSPDG~~la~~s~~~~~~~i~i~dl~tg~~~~l~~~~---g~-~~~~~w--  255 (429)
T PRK01742        182 QPYEVRVADYDGFNQFIVNRSSQPLMSPAWSPDGSKLAYVSFENKKSQLVVHDLRSGARKVVASFR---GH-NGAPAF--  255 (429)
T ss_pred             ceEEEEEECCCCCCceEeccCCCccccceEcCCCCEEEEEEecCCCcEEEEEeCCCCceEEEecCC---Cc-cCceeE--
Confidence            35799999998732334455543                         88999988753  43343   32 346889  


Q ss_pred             CCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEe-cc-
Q 001070          218 APNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFA-NA-  295 (1165)
Q Consensus       218 aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLa-n~-  295 (1165)
                      +|||   +.|+.+.+.+..++||.++...+          .+ ..|..        +...+..+..+|++.+|+.+ +. 
T Consensus       256 SPDG---~~La~~~~~~g~~~Iy~~d~~~~----------~~-~~lt~--------~~~~~~~~~wSpDG~~i~f~s~~~  313 (429)
T PRK01742        256 SPDG---SRLAFASSKDGVLNIYVMGANGG----------TP-SQLTS--------GAGNNTEPSWSPDGQSILFTSDRS  313 (429)
T ss_pred             CCCC---CEEEEEEecCCcEEEEEEECCCC----------Ce-Eeecc--------CCCCcCCEEECCCCCEEEEEECCC
Confidence            4554   44666666677777776543211          22 33442        22334567889999976654 43 


Q ss_pred             CCCcEEEEEeec
Q 001070          296 KKNAIYSVHLGY  307 (1165)
Q Consensus       296 ~r~aIYalhl~~  307 (1165)
                      ....||.+....
T Consensus       314 g~~~I~~~~~~~  325 (429)
T PRK01742        314 GSPQVYRMSASG  325 (429)
T ss_pred             CCceEEEEECCC
Confidence            356788877643


No 167
>PF00400 WD40:  WD domain, G-beta repeat;  InterPro: IPR019781 WD-40 repeats (also known as WD or beta-transducin repeats) are short ~40 amino acid motifs, often terminating in a Trp-Asp (W-D) dipeptide. WD40 repeats usually assume a 7-8 bladed beta-propeller fold, but proteins have been found with 4 to 16 repeated units, which also form a circularised beta-propeller structure. WD-repeat proteins are a large family found in all eukaryotes and are implicated in a variety of functions ranging from signal transduction and transcription regulation to cell cycle control and apoptosis. Repeated WD40 motifs act as a site for protein-protein interaction, and proteins containing WD40 repeats are known to serve as platforms for the assembly of protein complexes or mediators of transient interplay among other proteins. The specificity of the proteins is determined by the sequences outside the repeats themselves. Examples of such complexes are G proteins (beta subunit is a beta-propeller), TAFII transcription factor, and E3 ubiquitin ligase [, ]. In Arabidopsis spp., several WD40-containing proteins act as key regulators of plant-specific developmental events.; PDB: 2ZKQ_a 3CFV_B 3CFS_B 1PEV_A 1NR0_A 1VYH_T 3RFH_A 3O2Z_T 3FRX_C 3U5G_g ....
Probab=96.56  E-value=0.0024  Score=49.65  Aligned_cols=39  Identities=18%  Similarity=0.441  Sum_probs=30.8

Q ss_pred             CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeE
Q 001070          196 VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWA  241 (1165)
Q Consensus       196 g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~  241 (1165)
                      |.++.+|++|. .+|++++|.  |+   ..+++ +|+.|++|+|||
T Consensus         1 g~~~~~~~~h~-~~i~~i~~~--~~---~~~~~-s~~~D~~i~vwd   39 (39)
T PF00400_consen    1 GKCVRTFRGHS-SSINSIAWS--PD---GNFLA-SGSSDGTIRVWD   39 (39)
T ss_dssp             EEEEEEEESSS-SSEEEEEEE--TT---SSEEE-EEETTSEEEEEE
T ss_pred             CeEEEEEcCCC-CcEEEEEEe--cc---cccce-eeCCCCEEEEEC
Confidence            35789999994 599999994  55   34355 688999999997


No 168
>KOG2048 consensus WD40 repeat protein [General function prediction only]
Probab=96.55  E-value=0.013  Score=71.40  Aligned_cols=129  Identities=18%  Similarity=0.238  Sum_probs=83.2

Q ss_pred             Eeeec--CceEEEeecCCcEEEEeCcc-h----------------------hhHhhcCCcc--EEEeecCCCceeEEec-
Q 001070          152 QIAVN--KHYVCYGLKGGNVRVLNLNT-A----------------------TRSLLRGHTK--IKIWEDSKVAPLIILK-  203 (1165)
Q Consensus       152 ~IAVn--~~yIayG~kdg~IRVwdi~t-~----------------------ir~llrGH~q--VriWD~~~g~pl~~le-  203 (1165)
                      +||+|  ++-|+-|.+||.+-.+++.. .                      ..++..|-.+  |||||+.+|.-+++.+ 
T Consensus       115 siai~p~~~~l~IgcddGvl~~~s~~p~~I~~~r~l~rq~sRvLslsw~~~~~~i~~Gs~Dg~Iriwd~~~~~t~~~~~~  194 (691)
T KOG2048|consen  115 SIAINPENTILAIGCDDGVLYDFSIGPDKITYKRSLMRQKSRVLSLSWNPTGTKIAGGSIDGVIRIWDVKSGQTLHIITM  194 (691)
T ss_pred             EEEeCCccceEEeecCCceEEEEecCCceEEEEeecccccceEEEEEecCCccEEEecccCceEEEEEcCCCceEEEeee
Confidence            46665  56666677777555555553 1                      1112233333  8888888876555211 


Q ss_pred             CCC----CC--CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccccc
Q 001070          204 PHG----GQ--PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAF  277 (1165)
Q Consensus       204 phd----G~--sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~af  277 (1165)
                      ..|    |+  -|.||.||     .+.  .|+||..-.+|+.||...+            .-+|.+.        .|++=
T Consensus       195 ~~d~l~k~~~~iVWSv~~L-----rd~--tI~sgDS~G~V~FWd~~~g------------TLiqS~~--------~h~ad  247 (691)
T KOG2048|consen  195 QLDRLSKREPTIVWSVLFL-----RDS--TIASGDSAGTVTFWDSIFG------------TLIQSHS--------CHDAD  247 (691)
T ss_pred             cccccccCCceEEEEEEEe-----ecC--cEEEecCCceEEEEcccCc------------chhhhhh--------hhhcc
Confidence            112    22  79999999     332  4778999999999998665            3333333        26777


Q ss_pred             EEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          278 FNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       278 f~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ++..+++++...++.|-+.+..|-.-.-..
T Consensus       248 Vl~Lav~~~~d~vfsaGvd~~ii~~~~~~~  277 (691)
T KOG2048|consen  248 VLALAVADNEDRVFSAGVDPKIIQYSLTTN  277 (691)
T ss_pred             eeEEEEcCCCCeEEEccCCCceEEEEecCC
Confidence            778889999999999999988775544443


No 169
>KOG2111 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=96.53  E-value=0.0049  Score=69.93  Aligned_cols=84  Identities=18%  Similarity=0.398  Sum_probs=65.8

Q ss_pred             cCceEEE-eecCCcEEEEeCcchhh---HhhcCCcc-----------------------EEEeecCCCceeEEec-CCCC
Q 001070          156 NKHYVCY-GLKGGNVRVLNLNTATR---SLLRGHTK-----------------------IKIWEDSKVAPLIILK-PHGG  207 (1165)
Q Consensus       156 n~~yIay-G~kdg~IRVwdi~t~ir---~llrGH~q-----------------------VriWD~~~g~pl~~le-phdG  207 (1165)
                      +..+||+ |.+-|+|+|.|.+....   ..+..|.-                       |||||.++|.++..|+ +.|-
T Consensus       147 ~k~~LafPg~k~GqvQi~dL~~~~~~~p~~I~AH~s~Iacv~Ln~~Gt~vATaStkGTLIRIFdt~~g~~l~E~RRG~d~  226 (346)
T KOG2111|consen  147 NKSLLAFPGFKTGQVQIVDLASTKPNAPSIINAHDSDIACVALNLQGTLVATASTKGTLIRIFDTEDGTLLQELRRGVDR  226 (346)
T ss_pred             CceEEEcCCCccceEEEEEhhhcCcCCceEEEcccCceeEEEEcCCccEEEEeccCcEEEEEEEcCCCcEeeeeecCCch
Confidence            4678888 88999999999998444   67788876                       9999999999887776 3333


Q ss_pred             CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          208 QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       208 ~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      -.+|+++|  +|+.   . +++..|.-.||-|+.+...
T Consensus       227 A~iy~iaF--Sp~~---s-~LavsSdKgTlHiF~l~~~  258 (346)
T KOG2111|consen  227 ADIYCIAF--SPNS---S-WLAVSSDKGTLHIFSLRDT  258 (346)
T ss_pred             heEEEEEe--CCCc---c-EEEEEcCCCeEEEEEeecC
Confidence            49999999  4555   4 3445788899999998654


No 170
>KOG1036 consensus Mitotic spindle checkpoint protein BUB3, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning]
Probab=96.52  E-value=0.021  Score=64.70  Aligned_cols=142  Identities=13%  Similarity=0.238  Sum_probs=91.9

Q ss_pred             ecCceEEEeecCCcEEEEeCcchhhHhhcCCcc---------------------EEEeecCCCceeEEecCCCCCCccee
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK---------------------IKIWEDSKVAPLIILKPHGGQPVNSA  213 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q---------------------VriWD~~~g~pl~~lephdG~sV~SV  213 (1165)
                      -.+.+|.-++=||..|++|..+..-.+.-.|+.                     ||.+|..+|. ...+-.| ++.|.++
T Consensus        23 ~~~~~LLvssWDgslrlYdv~~~~l~~~~~~~~plL~c~F~d~~~~~~G~~dg~vr~~Dln~~~-~~~igth-~~~i~ci  100 (323)
T KOG1036|consen   23 PSSSDLLVSSWDGSLRLYDVPANSLKLKFKHGAPLLDCAFADESTIVTGGLDGQVRRYDLNTGN-EDQIGTH-DEGIRCI  100 (323)
T ss_pred             CcCCcEEEEeccCcEEEEeccchhhhhheecCCceeeeeccCCceEEEeccCceEEEEEecCCc-ceeeccC-CCceEEE
Confidence            446777778899999999999843333334544                     9999988775 4455556 4699999


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEE-
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF-  292 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL-  292 (1165)
                      .|+  +. .+   .|.+|+-|++||+||.-..            .|.-|++    .    .+++|   +.+-.+..||| 
T Consensus       101 ~~~--~~-~~---~vIsgsWD~~ik~wD~R~~------------~~~~~~d----~----~kkVy---~~~v~g~~LvVg  151 (323)
T KOG1036|consen  101 EYS--YE-VG---CVISGSWDKTIKFWDPRNK------------VVVGTFD----Q----GKKVY---CMDVSGNRLVVG  151 (323)
T ss_pred             Eee--cc-CC---eEEEcccCccEEEEecccc------------ccccccc----c----CceEE---EEeccCCEEEEe
Confidence            995  22 22   4668999999999995221            3444444    2    22332   34556666666 


Q ss_pred             eccCCCcEEEEEeecCCC-ccccccccccccccccc
Q 001070          293 ANAKKNAIYSVHLGYGNN-SAATRIDYIAEFTVTMP  327 (1165)
Q Consensus       293 an~~r~aIYalhl~~g~~-~~~~r~dyiaeF~v~~P  327 (1165)
                      ..-++..||-+..-..+. -...+|.|.++=.-..|
T Consensus       152 ~~~r~v~iyDLRn~~~~~q~reS~lkyqtR~v~~~p  187 (323)
T KOG1036|consen  152 TSDRKVLIYDLRNLDEPFQRRESSLKYQTRCVALVP  187 (323)
T ss_pred             ecCceEEEEEcccccchhhhccccceeEEEEEEEec
Confidence            666777888776543222 12456777777666666


No 171
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=96.49  E-value=0.012  Score=69.42  Aligned_cols=163  Identities=20%  Similarity=0.199  Sum_probs=106.9

Q ss_pred             CceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCc-eEEEeecCCcEEEEeCcc-hh--hHhhcCCcc--
Q 001070          114 DYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKH-YVCYGLKGGNVRVLNLNT-AT--RSLLRGHTK--  187 (1165)
Q Consensus       114 ~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~-yIayG~kdg~IRVwdi~t-~i--r~llrGH~q--  187 (1165)
                      --.+|.||....-..|.-+|+-.||-+-          .|+.||+ -||++.+-+-.-+||+.+ .+  -+.+.||++  
T Consensus       236 ~lrifqvDGk~N~~lqS~~l~~fPi~~a----------~f~p~G~~~i~~s~rrky~ysyDle~ak~~k~~~~~g~e~~~  305 (514)
T KOG2055|consen  236 TLRIFQVDGKVNPKLQSIHLEKFPIQKA----------EFAPNGHSVIFTSGRRKYLYSYDLETAKVTKLKPPYGVEEKS  305 (514)
T ss_pred             cEEEEEecCccChhheeeeeccCcccee----------eecCCCceEEEecccceEEEEeeccccccccccCCCCcccch
Confidence            4568999987776666347777777542          1444555 556666666666666665 11  225555554  


Q ss_pred             --------------------------------------------------------------EEEeecCCCceeEEecCC
Q 001070          188 --------------------------------------------------------------IKIWEDSKVAPLIILKPH  205 (1165)
Q Consensus       188 --------------------------------------------------------------VriWD~~~g~pl~~leph  205 (1165)
                                                                                    |.|||++.-.++++|.--
T Consensus       306 ~e~FeVShd~~fia~~G~~G~I~lLhakT~eli~s~KieG~v~~~~fsSdsk~l~~~~~~GeV~v~nl~~~~~~~rf~D~  385 (514)
T KOG2055|consen  306 MERFEVSHDSNFIAIAGNNGHIHLLHAKTKELITSFKIEGVVSDFTFSSDSKELLASGGTGEVYVWNLRQNSCLHRFVDD  385 (514)
T ss_pred             hheeEecCCCCeEEEcccCceEEeehhhhhhhhheeeeccEEeeEEEecCCcEEEEEcCCceEEEEecCCcceEEEEeec
Confidence                                                                          999999998889999843


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                       | +|+--.|..++++.    +++.||.-.-+-|||..+...-      ...+-+.|+.=        =.-=+.++.+++
T Consensus       386 -G-~v~gts~~~S~ng~----ylA~GS~~GiVNIYd~~s~~~s------~~PkPik~~dN--------Ltt~Itsl~Fn~  445 (514)
T KOG2055|consen  386 -G-SVHGTSLCISLNGS----YLATGSDSGIVNIYDGNSCFAS------TNPKPIKTVDN--------LTTAITSLQFNH  445 (514)
T ss_pred             -C-ccceeeeeecCCCc----eEEeccCcceEEEeccchhhcc------CCCCchhhhhh--------hheeeeeeeeCc
Confidence             3 78888887777775    4667999999999996443110      11122222220        011244667899


Q ss_pred             CCcEE-EEeccCCCcEEEEEee
Q 001070          286 QAGLL-LFANAKKNAIYSVHLG  306 (1165)
Q Consensus       286 ~a~~i-lLan~~r~aIYalhl~  306 (1165)
                      +++++ +.+..++|++--||+-
T Consensus       446 d~qiLAiaS~~~knalrLVHvP  467 (514)
T KOG2055|consen  446 DAQILAIASRVKKNALRLVHVP  467 (514)
T ss_pred             chhhhhhhhhccccceEEEecc
Confidence            99955 6678899999999986


No 172
>PRK05137 tolB translocation protein TolB; Provisional
Probab=96.45  E-value=0.039  Score=64.90  Aligned_cols=126  Identities=14%  Similarity=0.160  Sum_probs=76.3

Q ss_pred             eeecCceEEEeec---CCcEEEEeCcchhhHhhcCCcc-------------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLK---GGNVRVLNLNTATRSLLRGHTK-------------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~k---dg~IRVwdi~t~ir~llrGH~q-------------------------VriWD~~~g~pl~~lep  204 (1165)
                      ++-||++|+|...   +.+|.+||+.+..+..+.++..                         |.+||..++. +.++..
T Consensus       209 wSpDG~~lay~s~~~g~~~i~~~dl~~g~~~~l~~~~g~~~~~~~SPDG~~la~~~~~~g~~~Iy~~d~~~~~-~~~Lt~  287 (435)
T PRK05137        209 FSPNRQEITYMSYANGRPRVYLLDLETGQRELVGNFPGMTFAPRFSPDGRKVVMSLSQGGNTDIYTMDLRSGT-TTRLTD  287 (435)
T ss_pred             ECCCCCEEEEEEecCCCCEEEEEECCCCcEEEeecCCCcccCcEECCCCCEEEEEEecCCCceEEEEECCCCc-eEEccC
Confidence            4568999999763   4789999998843333333332                         7777887765 566665


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeec--CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEE
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAG--PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVV  282 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsG--slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~  282 (1165)
                      +.| .+.+..|  +|||..   ++...  ..+..|.+|+++++             ..+.+.+.        ...+....
T Consensus       288 ~~~-~~~~~~~--spDG~~---i~f~s~~~g~~~Iy~~d~~g~-------------~~~~lt~~--------~~~~~~~~  340 (435)
T PRK05137        288 SPA-IDTSPSY--SPDGSQ---IVFESDRSGSPQLYVMNADGS-------------NPRRISFG--------GGRYSTPV  340 (435)
T ss_pred             CCC-ccCceeE--cCCCCE---EEEEECCCCCCeEEEEECCCC-------------CeEEeecC--------CCcccCeE
Confidence            544 5677888  466532   43322  22346777775432             22344431        12234567


Q ss_pred             eecCCcEEEEeccCC--CcEEEEEee
Q 001070          283 VLSQAGLLLFANAKK--NAIYSVHLG  306 (1165)
Q Consensus       283 ~~p~a~~ilLan~~r--~aIYalhl~  306 (1165)
                      .+|++++|++.....  ..||.+-+.
T Consensus       341 ~SpdG~~ia~~~~~~~~~~i~~~d~~  366 (435)
T PRK05137        341 WSPRGDLIAFTKQGGGQFSIGVMKPD  366 (435)
T ss_pred             ECCCCCEEEEEEcCCCceEEEEEECC
Confidence            899999998876543  456666553


No 173
>KOG1517 consensus Guanine nucleotide binding protein MIP1 [Cell cycle control, cell division, chromosome partitioning]
Probab=96.40  E-value=0.012  Score=74.72  Aligned_cols=127  Identities=16%  Similarity=0.305  Sum_probs=81.4

Q ss_pred             CceEEEeecCCcEEEEeCcc--hhhHhhcCCcc-----------------------EEEeecCCC---ceeEEecCCCC-
Q 001070          157 KHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK-----------------------IKIWEDSKV---APLIILKPHGG-  207 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q-----------------------VriWD~~~g---~pl~~lephdG-  207 (1165)
                      |+.+|+|- -+.|||||.++  .++.+-.|-+.                       ||+||.|..   +++.+|++|.- 
T Consensus      1178 G~Ll~tGd-~r~IRIWDa~~E~~~~diP~~s~t~vTaLS~~~~~gn~i~AGfaDGsvRvyD~R~a~~ds~v~~~R~h~~~ 1256 (1387)
T KOG1517|consen 1178 GHLLVTGD-VRSIRIWDAHKEQVVADIPYGSSTLVTALSADLVHGNIIAAGFADGSVRVYDRRMAPPDSLVCVYREHNDV 1256 (1387)
T ss_pred             CeEEecCC-eeEEEEEecccceeEeecccCCCccceeecccccCCceEEEeecCCceEEeecccCCccccceeecccCCc
Confidence            77788775 78999999987  44444444333                       999999875   46999999954 


Q ss_pred             CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCC
Q 001070          208 QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQA  287 (1165)
Q Consensus       208 ~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a  287 (1165)
                      ++|.-+.|  .+.|-+ . || ||+.|..|++||+-.......+..-..|..             |. + .-...+++++
T Consensus      1257 ~~Iv~~sl--q~~G~~-e-lv-Sgs~~G~I~~~DlR~~~~e~~~~iv~~~~y-------------Gs-~-lTal~VH~ha 1316 (1387)
T KOG1517|consen 1257 EPIVHLSL--QRQGLG-E-LV-SGSQDGDIQLLDLRMSSKETFLTIVAHWEY-------------GS-A-LTALTVHEHA 1316 (1387)
T ss_pred             ccceeEEe--ecCCCc-c-ee-eeccCCeEEEEecccCcccccceeeecccc-------------Cc-c-ceeeeeccCC
Confidence            25899998  444433 2 45 899999999999855311111111111111             10 0 1134467777


Q ss_pred             cEEEEeccCCCcEEEEE
Q 001070          288 GLLLFANAKKNAIYSVH  304 (1165)
Q Consensus       288 ~~ilLan~~r~aIYalh  304 (1165)
                      .+|--+++..=+||-+-
T Consensus      1317 piiAsGs~q~ikIy~~~ 1333 (1387)
T KOG1517|consen 1317 PIIASGSAQLIKIYSLS 1333 (1387)
T ss_pred             CeeeecCcceEEEEecC
Confidence            77777777777777654


No 174
>KOG3914 consensus WD repeat protein WDR4 [Function unknown]
Probab=96.39  E-value=0.005  Score=71.34  Aligned_cols=76  Identities=22%  Similarity=0.368  Sum_probs=55.2

Q ss_pred             eeecCceEEEeecCCcEEEEeCc-c-hhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEee
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLN-T-ATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTA  230 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~-t-~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvts  230 (1165)
                      ++-|++||+|.-||.+|||-.-. + .|.+.+-||+.                     =|..++-.      +.+ ++-|
T Consensus       159 vS~D~~~IitaDRDEkIRvs~ypa~f~IesfclGH~e---------------------FVS~isl~------~~~-~LlS  210 (390)
T KOG3914|consen  159 VSPDDQFIITADRDEKIRVSRYPATFVIESFCLGHKE---------------------FVSTISLT------DNY-LLLS  210 (390)
T ss_pred             ecCCCCEEEEecCCceEEEEecCcccchhhhccccHh---------------------heeeeeec------cCc-eeee
Confidence            44489999999999999995554 4 88888888875                     12222221      112 3448


Q ss_pred             cCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCC
Q 001070          231 GPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSS  268 (1165)
Q Consensus       231 GslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s  268 (1165)
                      |+.|+||++||...+            +|+.|+.+.+-
T Consensus       211 ~sGD~tlr~Wd~~sg------------k~L~t~dl~s~  236 (390)
T KOG3914|consen  211 GSGDKTLRLWDITSG------------KLLDTCDLSSL  236 (390)
T ss_pred             cCCCCcEEEEecccC------------CcccccchhHh
Confidence            999999999998554            99999998553


No 175
>PF10282 Lactonase:  Lactonase, 7-bladed beta-propeller;  InterPro: IPR019405  6-phosphogluconolactonases (6PGL) 3.1.1.31 from EC, which hydrolyses 6-phosphogluconolactone to 6-phosphogluconate is opne of the enzymes in the pentose phosphate pathway. Two families of structurally dissimilar 6PGLs are known to exist: the Escherichia coli (strain K12) YbhE IPR022528 from INTERPRO [] and the Pseudomonas aeruginosa DevB IPR005900 from INTERPRO [] types.  This entry contains bacterial 6-phosphogluconolactonases (6PGL) YbhE-type 3.1.1.31 from EC which hydrolyse 6-phosphogluconolactone to 6-phosphogluconate. The entry also contains the fungal muconate lactonizing enzyme carboxy-cis,cis-muconate cyclase 5.5.1.5 from EC and muconate cycloisomerase 5.5.1.1 from EC, which convert cis,cis-muconates to muconolactones and vice versa as part of the microbial beta-ketoadipate pathway. Structures have been reported for the E. coli 6-phosphogluconolactonase and Neurospora crassa muconate cycloisomerase. Structures of proteins in this family have revealed a 7-bladed beta-propeller fold [].; PDB: 3SCY_A 1L0Q_A 3HFQ_B 3FGB_A 1RI6_A 3U4Y_A 3BWS_A 1JOF_H.
Probab=96.37  E-value=0.21  Score=57.28  Aligned_cols=177  Identities=16%  Similarity=0.258  Sum_probs=110.4

Q ss_pred             eee--cCceEEEee-cCCcEEEEeCcc--hhhH---hhc-------------CCcc--------------------EEEe
Q 001070          153 IAV--NKHYVCYGL-KGGNVRVLNLNT--ATRS---LLR-------------GHTK--------------------IKIW  191 (1165)
Q Consensus       153 IAV--n~~yIayG~-kdg~IRVwdi~t--~ir~---llr-------------GH~q--------------------VriW  191 (1165)
                      |++  ||+||...- .+|.|-|++++.  .+..   +++             .|-+                    |++|
T Consensus        92 i~~~~~g~~l~vany~~g~v~v~~l~~~g~l~~~~~~~~~~g~g~~~~rq~~~h~H~v~~~pdg~~v~v~dlG~D~v~~~  171 (345)
T PF10282_consen   92 IAVDPDGRFLYVANYGGGSVSVFPLDDDGSLGEVVQTVRHEGSGPNPDRQEGPHPHQVVFSPDGRFVYVPDLGADRVYVY  171 (345)
T ss_dssp             EEECTTSSEEEEEETTTTEEEEEEECTTSEEEEEEEEEESEEEESSTTTTSSTCEEEEEE-TTSSEEEEEETTTTEEEEE
T ss_pred             EEEecCCCEEEEEEccCCeEEEEEccCCcccceeeeecccCCCCCcccccccccceeEEECCCCCEEEEEecCCCEEEEE
Confidence            677  688887654 489999999985  2222   221             1111                    8888


Q ss_pred             ecCCCc----eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          192 EDSKVA----PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       192 D~~~g~----pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      +.....    +...+....|.-...++|  .|   +++++.+...++.+|-.+++....        ..|+.+|++..-+
T Consensus       172 ~~~~~~~~l~~~~~~~~~~G~GPRh~~f--~p---dg~~~Yv~~e~s~~v~v~~~~~~~--------g~~~~~~~~~~~~  238 (345)
T PF10282_consen  172 DIDDDTGKLTPVDSIKVPPGSGPRHLAF--SP---DGKYAYVVNELSNTVSVFDYDPSD--------GSLTEIQTISTLP  238 (345)
T ss_dssp             EE-TTS-TEEEEEEEECSTTSSEEEEEE---T---TSSEEEEEETTTTEEEEEEEETTT--------TEEEEEEEEESCE
T ss_pred             EEeCCCceEEEeeccccccCCCCcEEEE--cC---CcCEEEEecCCCCcEEEEeecccC--------CceeEEEEeeecc
Confidence            776543    234444445677889999  45   445576679999999999986432        2567888877533


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCcccccccccccccc--ccceeeeeeccCC-------C
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTV--TMPVLSFTGTIDP-------P  338 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v--~~PILSft~~~d~-------~  338 (1165)
                      ...  .....-..++++|+++||.++|...+.|-++.++....    ++..+..+..  .+| -.|....|+       .
T Consensus       239 ~~~--~~~~~~~~i~ispdg~~lyvsnr~~~sI~vf~~d~~~g----~l~~~~~~~~~G~~P-r~~~~s~~g~~l~Va~~  311 (345)
T PF10282_consen  239 EGF--TGENAPAEIAISPDGRFLYVSNRGSNSISVFDLDPATG----TLTLVQTVPTGGKFP-RHFAFSPDGRYLYVANQ  311 (345)
T ss_dssp             TTS--CSSSSEEEEEE-TTSSEEEEEECTTTEEEEEEECTTTT----TEEEEEEEEESSSSE-EEEEE-TTSSEEEEEET
T ss_pred             ccc--cccCCceeEEEecCCCEEEEEeccCCEEEEEEEecCCC----ceEEEEEEeCCCCCc-cEEEEeCCCCEEEEEec
Confidence            321  12236778999999999999999999999999953222    3333333332  123 334443333       2


Q ss_pred             CcceEEEEEee
Q 001070          339 SEHIIKLYCVQ  349 (1165)
Q Consensus       339 ge~~vq~yCvQ  349 (1165)
                      +++.|.+|-+-
T Consensus       312 ~s~~v~vf~~d  322 (345)
T PF10282_consen  312 DSNTVSVFDID  322 (345)
T ss_dssp             TTTEEEEEEEE
T ss_pred             CCCeEEEEEEe
Confidence            45567777773


No 176
>PF08662 eIF2A:  Eukaryotic translation initiation factor eIF2A;  InterPro: IPR013979  This entry contains beta propellor domains found in eukaryotic translation initiation factors and TolB domain-containing proteins. 
Probab=96.37  E-value=0.048  Score=57.95  Aligned_cols=117  Identities=13%  Similarity=0.173  Sum_probs=78.0

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      +..++.. +.++.+++-....+|.+++|  .|+|.  +|+|..|..++.|.|||.               +|...+.|. 
T Consensus        41 l~~~~~~-~~~~~~i~l~~~~~I~~~~W--sP~g~--~favi~g~~~~~v~lyd~---------------~~~~i~~~~-   99 (194)
T PF08662_consen   41 LFYLNEK-NIPVESIELKKEGPIHDVAW--SPNGN--EFAVIYGSMPAKVTLYDV---------------KGKKIFSFG-   99 (194)
T ss_pred             EEEEecC-CCccceeeccCCCceEEEEE--CcCCC--EEEEEEccCCcccEEEcC---------------cccEeEeec-
Confidence            4444443 56777776543347999999  67763  466778999999999997               355555552 


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCC--cEEEEEeecCCCccccccccccccccccceeeeeeccCCCCcceE
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKN--AIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPSEHII  343 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~--aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~ge~~v  343 (1165)
                             ..-.|.|..+|+|++|+++....-  .|+...+.        .+..|.++.-..   .-...++|||..++
T Consensus       100 -------~~~~n~i~wsP~G~~l~~~g~~n~~G~l~~wd~~--------~~~~i~~~~~~~---~t~~~WsPdGr~~~  159 (194)
T PF08662_consen  100 -------TQPRNTISWSPDGRFLVLAGFGNLNGDLEFWDVR--------KKKKISTFEHSD---ATDVEWSPDGRYLA  159 (194)
T ss_pred             -------CCCceEEEECCCCCEEEEEEccCCCcEEEEEECC--------CCEEeeccccCc---EEEEEEcCCCCEEE
Confidence                   345678999999999999986532  36665444        344555554332   23556788887654


No 177
>TIGR02800 propeller_TolB tol-pal system beta propeller repeat protein TolB. The Tol-PAL system is required for bacterial outer membrane integrity. E. coli TolB is involved in the tonB-independent uptake of group A colicins (colicins A, E1, E2, E3 and K), and is necessary for the colicins to reach their respective targets after initial binding to the bacteria. It is also involved in uptake of filamentous DNA. Study of its structure suggest that the TolB protein might be involved in the recycling of peptidoglycan or in its covalent linking with lipoproteins. The Tol-Pal system is also implicated in pathogenesis of E. coli, Haemophilus ducreyi, Salmonella enterica and Vibrio cholerae, but the mechanism(s) is unclear.
Probab=96.34  E-value=0.034  Score=63.83  Aligned_cols=127  Identities=12%  Similarity=0.130  Sum_probs=74.4

Q ss_pred             eeecCceEEEeecC---CcEEEEeCcch-hhHhh--cCCcc----------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLKG---GNVRVLNLNTA-TRSLL--RGHTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~kd---g~IRVwdi~t~-ir~ll--rGH~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      ++.||++|+|+...   ..|+|||+.+. .+.+.  .|+..                      |++||..++. ...+..
T Consensus       197 ~Spdg~~la~~~~~~~~~~i~v~d~~~g~~~~~~~~~~~~~~~~~spDg~~l~~~~~~~~~~~i~~~d~~~~~-~~~l~~  275 (417)
T TIGR02800       197 WSPDGQKLAYVSFESGKPEIYVQDLATGQREKVASFPGMNGAPAFSPDGSKLAVSLSKDGNPDIYVMDLDGKQ-LTRLTN  275 (417)
T ss_pred             CCCCCCEEEEEEcCCCCcEEEEEECCCCCEEEeecCCCCccceEECCCCCEEEEEECCCCCccEEEEECCCCC-EEECCC
Confidence            66689999997654   48999999873 33221  22211                      6777777664 455544


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCCC--ceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEE
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPLN--REVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVV  282 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGsln--rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~  282 (1165)
                      +.+ .+.+..|  .|++   +.|+.+...+  ..|-+|++.++            + .+.+.+        +......+.
T Consensus       276 ~~~-~~~~~~~--s~dg---~~l~~~s~~~g~~~iy~~d~~~~------------~-~~~l~~--------~~~~~~~~~  328 (417)
T TIGR02800       276 GPG-IDTEPSW--SPDG---KSIAFTSDRGGSPQIYMMDADGG------------E-VRRLTF--------RGGYNASPS  328 (417)
T ss_pred             CCC-CCCCEEE--CCCC---CEEEEEECCCCCceEEEEECCCC------------C-EEEeec--------CCCCccCeE
Confidence            432 4567788  3544   3344333322  24555565332            2 234443        123344678


Q ss_pred             eecCCcEEEEeccCC--CcEEEEEeec
Q 001070          283 VLSQAGLLLFANAKK--NAIYSVHLGY  307 (1165)
Q Consensus       283 ~~p~a~~ilLan~~r--~aIYalhl~~  307 (1165)
                      ++|++.+|+.++...  ..||.+.+.-
T Consensus       329 ~spdg~~i~~~~~~~~~~~i~~~d~~~  355 (417)
T TIGR02800       329 WSPDGDLIAFVHREGGGFNIAVMDLDG  355 (417)
T ss_pred             ECCCCCEEEEEEccCCceEEEEEeCCC
Confidence            899999999987653  3677777654


No 178
>KOG0283 consensus WD40 repeat-containing protein [Function unknown]
Probab=96.32  E-value=0.019  Score=71.25  Aligned_cols=129  Identities=13%  Similarity=0.238  Sum_probs=87.5

Q ss_pred             ecCceEEEeecCCcEEEEeCcc-------hhhHhhcCCcc---------------EEEeecCCCceeEEecCCC------
Q 001070          155 VNKHYVCYGLKGGNVRVLNLNT-------ATRSLLRGHTK---------------IKIWEDSKVAPLIILKPHG------  206 (1165)
Q Consensus       155 Vn~~yIayG~kdg~IRVwdi~t-------~ir~llrGH~q---------------VriWD~~~g~pl~~lephd------  206 (1165)
                      ||++|+.+|.=||.||||+|-.       .++.+...-.=               +|||++....++..+.-+.      
T Consensus       420 vDDryFiSGSLD~KvRiWsI~d~~Vv~W~Dl~~lITAvcy~PdGk~avIGt~~G~C~fY~t~~lk~~~~~~I~~~~~Kk~  499 (712)
T KOG0283|consen  420 VDDRYFISGSLDGKVRLWSISDKKVVDWNDLRDLITAVCYSPDGKGAVIGTFNGYCRFYDTEGLKLVSDFHIRLHNKKKK  499 (712)
T ss_pred             cCCCcEeecccccceEEeecCcCeeEeehhhhhhheeEEeccCCceEEEEEeccEEEEEEccCCeEEEeeeEeeccCccc
Confidence            5799999999999999999984       33333322111               8999988776655554432      


Q ss_pred             -CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          207 -GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       207 -G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                       |+.|..+-|+  |-.++ ++|||  +.|-.|+|+|+...            .-+.-|.+..+... .+     +..++.
T Consensus       500 ~~~rITG~Q~~--p~~~~-~vLVT--SnDSrIRI~d~~~~------------~lv~KfKG~~n~~S-Q~-----~Asfs~  556 (712)
T KOG0283|consen  500 QGKRITGLQFF--PGDPD-EVLVT--SNDSRIRIYDGRDK------------DLVHKFKGFRNTSS-QI-----SASFSS  556 (712)
T ss_pred             cCceeeeeEec--CCCCC-eEEEe--cCCCceEEEeccch------------hhhhhhcccccCCc-ce-----eeeEcc
Confidence             4579999995  66666 66886  67999999997332            22223333222211 12     224577


Q ss_pred             CCcEEEEeccCCCcEEEEEeec
Q 001070          286 QAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       286 ~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ||.+||-+. .-+-||.-++..
T Consensus       557 Dgk~IVs~s-eDs~VYiW~~~~  577 (712)
T KOG0283|consen  557 DGKHIVSAS-EDSWVYIWKNDS  577 (712)
T ss_pred             CCCEEEEee-cCceEEEEeCCC
Confidence            999999988 889999999864


No 179
>KOG2110 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=96.21  E-value=0.11  Score=60.46  Aligned_cols=130  Identities=12%  Similarity=0.259  Sum_probs=91.9

Q ss_pred             eee--cCceEEEeecCCcEEEEeCcc-hhhHhhcCC---cc------------------------EEEeecCCCceeEEe
Q 001070          153 IAV--NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGH---TK------------------------IKIWEDSKVAPLIIL  202 (1165)
Q Consensus       153 IAV--n~~yIayG~kdg~IRVwdi~t-~ir~llrGH---~q------------------------VriWD~~~g~pl~~l  202 (1165)
                      ++|  |++.|+-.+++. |-|+||++ .+-+++.--   .+                        |.|||..+..|+..+
T Consensus        91 L~VrmNr~RLvV~Lee~-IyIydI~~MklLhTI~t~~~n~~gl~AlS~n~~n~ylAyp~s~t~GdV~l~d~~nl~~v~~I  169 (391)
T KOG2110|consen   91 LAVRMNRKRLVVCLEES-IYIYDIKDMKLLHTIETTPPNPKGLCALSPNNANCYLAYPGSTTSGDVVLFDTINLQPVNTI  169 (391)
T ss_pred             EEEEEccceEEEEEccc-EEEEecccceeehhhhccCCCccceEeeccCCCCceEEecCCCCCceEEEEEcccceeeeEE
Confidence            444  999999999988 99999998 665555433   22                        999999999999999


Q ss_pred             cCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccc-ccEEEE
Q 001070          203 KPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEE-AFFNQV  281 (1165)
Q Consensus       203 ephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~-aff~sV  281 (1165)
                      +-|+| +|-.+||  +|+|   ..|.|+-...+-|+++....+            .-++.|+       ||-. .=..|+
T Consensus       170 ~aH~~-~lAalaf--s~~G---~llATASeKGTVIRVf~v~~G------------~kl~eFR-------RG~~~~~IySL  224 (391)
T KOG2110|consen  170 NAHKG-PLAALAF--SPDG---TLLATASEKGTVIRVFSVPEG------------QKLYEFR-------RGTYPVSIYSL  224 (391)
T ss_pred             EecCC-ceeEEEE--CCCC---CEEEEeccCceEEEEEEcCCc------------cEeeeee-------CCceeeEEEEE
Confidence            99988 9999999  4555   436766666777899997444            3333333       1221 223478


Q ss_pred             EeecCCcEEEEeccCCCcEEEEEeecCC
Q 001070          282 VVLSQAGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       282 ~~~p~a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      +++|++.||-.+. .--.|.++-|+.-.
T Consensus       225 ~Fs~ds~~L~~sS-~TeTVHiFKL~~~~  251 (391)
T KOG2110|consen  225 SFSPDSQFLAASS-NTETVHIFKLEKVS  251 (391)
T ss_pred             EECCCCCeEEEec-CCCeEEEEEecccc
Confidence            8999999665443 33567777776644


No 180
>KOG0647 consensus mRNA export protein (contains WD40 repeats) [RNA processing and modification]
Probab=96.18  E-value=0.013  Score=66.24  Aligned_cols=82  Identities=16%  Similarity=0.280  Sum_probs=65.5

Q ss_pred             eecCceEEEeecCCcEEEEeCcchhhHhhcCCcc------------------------EEEeecCCCceeEEecCCCCCC
Q 001070          154 AVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       154 AVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q------------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      .-||+-++.|.-||+.++||+.+.+-..+--|..                        +|+||.|...|+.+++=.  +.
T Consensus        81 sddgskVf~g~~Dk~~k~wDL~S~Q~~~v~~Hd~pvkt~~wv~~~~~~cl~TGSWDKTlKfWD~R~~~pv~t~~LP--eR  158 (347)
T KOG0647|consen   81 SDDGSKVFSGGCDKQAKLWDLASGQVSQVAAHDAPVKTCHWVPGMNYQCLVTGSWDKTLKFWDTRSSNPVATLQLP--ER  158 (347)
T ss_pred             ccCCceEEeeccCCceEEEEccCCCeeeeeecccceeEEEEecCCCcceeEecccccceeecccCCCCeeeeeecc--ce
Confidence            3468888899999999999999977777777776                        999999999999999865  46


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      ||+.--+     ..   |++-|-.||.|.++.|+.+
T Consensus       159 vYa~Dv~-----~p---m~vVata~r~i~vynL~n~  186 (347)
T KOG0647|consen  159 VYAADVL-----YP---MAVVATAERHIAVYNLENP  186 (347)
T ss_pred             eeehhcc-----Cc---eeEEEecCCcEEEEEcCCC
Confidence            8876653     12   3334778999999999664


No 181
>PRK03629 tolB translocation protein TolB; Provisional
Probab=96.17  E-value=0.058  Score=63.69  Aligned_cols=130  Identities=10%  Similarity=0.122  Sum_probs=77.8

Q ss_pred             EeeecCceEEEee---cCCcEEEEeCcc-hhhHh--hcCCcc----------------------EEEeecCCCceeEEec
Q 001070          152 QIAVNKHYVCYGL---KGGNVRVLNLNT-ATRSL--LRGHTK----------------------IKIWEDSKVAPLIILK  203 (1165)
Q Consensus       152 ~IAVn~~yIayG~---kdg~IRVwdi~t-~ir~l--lrGH~q----------------------VriWD~~~g~pl~~le  203 (1165)
                      .++.||++|+|..   .+..|++||+.+ ..+.+  +.||..                      |++||..+|. +.++.
T Consensus       205 ~wSPDG~~la~~s~~~g~~~i~i~dl~~G~~~~l~~~~~~~~~~~~SPDG~~La~~~~~~g~~~I~~~d~~tg~-~~~lt  283 (429)
T PRK03629        205 AWSPDGSKLAYVTFESGRSALVIQTLANGAVRQVASFPRHNGAPAFSPDGSKLAFALSKTGSLNLYVMDLASGQ-IRQVT  283 (429)
T ss_pred             EEcCCCCEEEEEEecCCCcEEEEEECCCCCeEEccCCCCCcCCeEECCCCCEEEEEEcCCCCcEEEEEECCCCC-EEEcc
Confidence            3666889888854   346899999987 33333  456543                      7788998876 44554


Q ss_pred             CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEe
Q 001070          204 PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVV  283 (1165)
Q Consensus       204 phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~  283 (1165)
                      .++ ..+.+..|  +|||   +.|+.+...+...+||.+....|          . .+.|.+.        ......+.+
T Consensus       284 ~~~-~~~~~~~w--SPDG---~~I~f~s~~~g~~~Iy~~d~~~g----------~-~~~lt~~--------~~~~~~~~~  338 (429)
T PRK03629        284 DGR-SNNTEPTW--FPDS---QNLAYTSDQAGRPQVYKVNINGG----------A-PQRITWE--------GSQNQDADV  338 (429)
T ss_pred             CCC-CCcCceEE--CCCC---CEEEEEeCCCCCceEEEEECCCC----------C-eEEeecC--------CCCccCEEE
Confidence            432 36788899  4665   43544343344567776543311          1 2344431        122235678


Q ss_pred             ecCCcEEEEeccCC--CcEEEEEeec
Q 001070          284 LSQAGLLLFANAKK--NAIYSVHLGY  307 (1165)
Q Consensus       284 ~p~a~~ilLan~~r--~aIYalhl~~  307 (1165)
                      +|++.+|+.+....  ..||.+-++-
T Consensus       339 SpDG~~Ia~~~~~~g~~~I~~~dl~~  364 (429)
T PRK03629        339 SSDGKFMVMVSSNGGQQHIAKQDLAT  364 (429)
T ss_pred             CCCCCEEEEEEccCCCceEEEEECCC
Confidence            99999998876544  3466665543


No 182
>KOG4227 consensus WD40 repeat protein [General function prediction only]
Probab=96.15  E-value=0.013  Score=67.87  Aligned_cols=88  Identities=16%  Similarity=0.333  Sum_probs=66.9

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcc-hhhHh-----hcCCcc--------------------------------------
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNT-ATRSL-----LRGHTK--------------------------------------  187 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t-~ir~l-----lrGH~q--------------------------------------  187 (1165)
                      +++-||.||++|..|.+.|||+... -+|.+     ++||-+                                      
T Consensus        63 qFS~N~~~L~SGGDD~~~~~W~~de~~~~k~~KPI~~~~~~H~SNIF~L~F~~~N~~~~SG~~~~~VI~HDiEt~qsi~V  142 (609)
T KOG4227|consen   63 QFSHNDRFLASGGDDMHGRVWNVDELMVRKTPKPIGVMEHPHRSNIFSLEFDLENRFLYSGERWGTVIKHDIETKQSIYV  142 (609)
T ss_pred             eeccCCeEEeecCCcceeeeechHHHHhhcCCCCceeccCccccceEEEEEccCCeeEecCCCcceeEeeecccceeeee
Confidence            4667899999999999999999997 33333     667765                                      


Q ss_pred             ------------------------------EEEeecCCCc-eeEEecCCC-CCCcceeEeecCCCCCCceEEEeecCCCc
Q 001070          188 ------------------------------IKIWEDSKVA-PLIILKPHG-GQPVNSAQYLTAPNQAGHIILVTAGPLNR  235 (1165)
Q Consensus       188 ------------------------------VriWD~~~g~-pl~~lephd-G~sV~SVaFl~aP~~~d~~~lvtsGslnr  235 (1165)
                                                    |-|||.+... |.+-+.|.+ |..-|+|.|  .|..|.   ||..++.-.
T Consensus       143 ~~~~~~~~~VY~m~~~P~DN~~~~~t~~~~V~~~D~Rd~~~~~~~~~~AN~~~~F~t~~F--~P~~P~---Li~~~~~~~  217 (609)
T KOG4227|consen  143 ANENNNRGDVYHMDQHPTDNTLIVVTRAKLVSFIDNRDRQNPISLVLPANSGKNFYTAEF--HPETPA---LILVNSETG  217 (609)
T ss_pred             ecccCcccceeecccCCCCceEEEEecCceEEEEeccCCCCCCceeeecCCCccceeeee--cCCCce---eEEeccccC
Confidence                                          7899998765 666666654 778999999  788877   555566666


Q ss_pred             eEEEeEccC
Q 001070          236 EVKLWASAS  244 (1165)
Q Consensus       236 tIKLW~~a~  244 (1165)
                      -+-+||.--
T Consensus       218 G~~~~D~R~  226 (609)
T KOG4227|consen  218 GPNVFDRRM  226 (609)
T ss_pred             CCCceeecc
Confidence            678898743


No 183
>KOG2321 consensus WD40 repeat protein [General function prediction only]
Probab=96.11  E-value=0.016  Score=69.77  Aligned_cols=128  Identities=19%  Similarity=0.382  Sum_probs=86.3

Q ss_pred             eeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc---------------------------------EEEeecCCC
Q 001070          153 IAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK---------------------------------IKIWEDSKV  196 (1165)
Q Consensus       153 IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q---------------------------------VriWD~~~g  196 (1165)
                      |.||  -..||.|.++|.+--||..+ ..+.+|.--+.                                 |.|||.+..
T Consensus       181 v~in~~hgLla~Gt~~g~VEfwDpR~ksrv~~l~~~~~v~s~pg~~~~~svTal~F~d~gL~~aVGts~G~v~iyDLRa~  260 (703)
T KOG2321|consen  181 VSINEEHGLLACGTEDGVVEFWDPRDKSRVGTLDAASSVNSHPGGDAAPSVTALKFRDDGLHVAVGTSTGSVLIYDLRAS  260 (703)
T ss_pred             eeecCccceEEecccCceEEEecchhhhhheeeecccccCCCccccccCcceEEEecCCceeEEeeccCCcEEEEEcccC
Confidence            4454  46789999999999999987 44443321111                                 999999999


Q ss_pred             ceeEEecCCCCC-CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccc
Q 001070          197 APLIILKPHGGQ-PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEE  275 (1165)
Q Consensus       197 ~pl~~lephdG~-sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~  275 (1165)
                      .|+.+-. |+++ ++..+.|.++ ++..   .|.|. .-+.|||||-.++..            .-.+|-        ..
T Consensus       261 ~pl~~kd-h~~e~pi~~l~~~~~-~~q~---~v~S~-Dk~~~kiWd~~~Gk~------------~asiEp--------t~  314 (703)
T KOG2321|consen  261 KPLLVKD-HGYELPIKKLDWQDT-DQQN---KVVSM-DKRILKIWDECTGKP------------MASIEP--------TS  314 (703)
T ss_pred             Cceeecc-cCCccceeeeccccc-CCCc---eEEec-chHHhhhcccccCCc------------eeeccc--------cC
Confidence            9988775 5555 9999999866 3322   33333 457899999655532            222221        11


Q ss_pred             ccEEEEEeecCCcEEEEecc--CCCcEEEEEeec
Q 001070          276 AFFNQVVVLSQAGLLLFANA--KKNAIYSVHLGY  307 (1165)
Q Consensus       276 aff~sV~~~p~a~~ilLan~--~r~aIYalhl~~  307 (1165)
                      + +|-+++-|++|++|+||-  ++..+|+=.|+.
T Consensus       315 ~-lND~C~~p~sGm~f~Ane~~~m~~yyiP~LGP  347 (703)
T KOG2321|consen  315 D-LNDFCFVPGSGMFFTANESSKMHTYYIPSLGP  347 (703)
T ss_pred             C-cCceeeecCCceEEEecCCCcceeEEccccCC
Confidence            2 566777899999999975  566667666654


No 184
>KOG0318 consensus WD40 repeat stress protein/actin interacting protein [Cytoskeleton]
Probab=96.06  E-value=0.047  Score=65.44  Aligned_cols=32  Identities=22%  Similarity=0.399  Sum_probs=26.6

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhh--cCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLL--RGHTK  187 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~ll--rGH~q  187 (1165)
                      ||+||.+|..||+|-=||+.+....-|  ++|+.
T Consensus       331 d~~~i~SgsyDG~I~~W~~~~g~~~~~~g~~h~n  364 (603)
T KOG0318|consen  331 DGKTIYSGSYDGHINSWDSGSGTSDRLAGKGHTN  364 (603)
T ss_pred             CCCEEEeeccCceEEEEecCCccccccccccccc
Confidence            689999999999999999999444433  78876


No 185
>KOG2445 consensus Nuclear pore complex component (sc Seh1) [Nuclear structure; Intracellular trafficking, secretion, and vesicular transport]
Probab=96.04  E-value=0.062  Score=61.19  Aligned_cols=151  Identities=16%  Similarity=0.225  Sum_probs=93.4

Q ss_pred             CceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCce
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNRE  236 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrt  236 (1165)
                      |+.+|+++.|++|.|||....               .-+=.+-..|+-|+| +|..|.|. .|+  +|+ +|++.+.|||
T Consensus        25 GRRmAtCSsDq~vkI~d~~~~---------------s~~W~~Ts~Wrah~~-Si~rV~WA-hPE--fGq-vvA~cS~Drt   84 (361)
T KOG2445|consen   25 GRRMATCSSDQTVKIWDSTSD---------------SGTWSCTSSWRAHDG-SIWRVVWA-HPE--FGQ-VVATCSYDRT   84 (361)
T ss_pred             CceeeeccCCCcEEEEeccCC---------------CCceEEeeeEEecCC-cEEEEEec-Ccc--ccc-eEEEEecCCc
Confidence            444458999999888875321               001124677999987 99999995 333  334 6778999999


Q ss_pred             EEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCcccccc
Q 001070          237 VKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRI  316 (1165)
Q Consensus       237 IKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~  316 (1165)
                      ++||+=... .  ....+..|+-..||.        +.+.-++.|.+.|.--=+.||.+..-.|-.|.-+..+-+ ..+-
T Consensus        85 v~iWEE~~~-~--~~~~~~~Wv~~ttl~--------DsrssV~DV~FaP~hlGLklA~~~aDG~lRIYEA~dp~n-Ls~W  152 (361)
T KOG2445|consen   85 VSIWEEQEK-S--EEAHGRRWVRRTTLV--------DSRSSVTDVKFAPKHLGLKLAAASADGILRIYEAPDPMN-LSQW  152 (361)
T ss_pred             eeeeeeccc-c--cccccceeEEEEEee--------cCCcceeEEEecchhcceEEEEeccCcEEEEEecCCccc-cccc
Confidence            999995211 0  112234688888888        344556688888887777777777777766655544432 2233


Q ss_pred             ccccccccccceeeeeeccCCCCcceEEEEEe
Q 001070          317 DYIAEFTVTMPVLSFTGTIDPPSEHIIKLYCV  348 (1165)
Q Consensus       317 dyiaeF~v~~PILSft~~~d~~ge~~vq~yCv  348 (1165)
                      .-..||.+      +   .++-|....-.|||
T Consensus       153 ~Lq~Ei~~------~---~~pp~~~~~~~~Cv  175 (361)
T KOG2445|consen  153 TLQHEIQN------V---IDPPGKNKQPCFCV  175 (361)
T ss_pred             hhhhhhhh------c---cCCcccccCcceEE
Confidence            33344332      1   12445555556665


No 186
>KOG1524 consensus WD40 repeat-containing protein CHE-2 [General function prediction only]
Probab=95.97  E-value=0.034  Score=66.68  Aligned_cols=113  Identities=18%  Similarity=0.292  Sum_probs=81.3

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhhHhhcCCcc-EE--EeecCCC--------c----------eeEEecCCCCCCcc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK-IK--IWEDSKV--------A----------PLIILKPHGGQPVN  211 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q-Vr--iWD~~~g--------~----------pl~~lephdG~sV~  211 (1165)
                      -.-||.=|.+..|||.|+||.+..-+|+++.-.+. ||  =|+-.+.        .          -+-+|+.||| -|-
T Consensus       112 W~~dGtgLlt~GEDG~iKiWSrsGMLRStl~Q~~~~v~c~~W~p~S~~vl~c~g~h~~IKpL~~n~k~i~WkAHDG-iiL  190 (737)
T KOG1524|consen  112 WSPDGAGLLTAGEDGVIKIWSRSGMLRSTVVQNEESIRCARWAPNSNSIVFCQGGHISIKPLAANSKIIRWRAHDG-LVL  190 (737)
T ss_pred             cCCCCceeeeecCCceEEEEeccchHHHHHhhcCceeEEEEECCCCCceEEecCCeEEEeecccccceeEEeccCc-EEE
Confidence            34578888999999999999999999998766655 54  4775432        1          1789999999 788


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      |+-|.  |. .|   ||.+|.-|=..|+||..+.-                 -|.+++    |+--+-+|+..|+.-|+|
T Consensus       191 ~~~W~--~~-s~---lI~sgGED~kfKvWD~~G~~-----------------Lf~S~~----~ey~ITSva~npd~~~~v  243 (737)
T KOG1524|consen  191 SLSWS--TQ-SN---IIASGGEDFRFKIWDAQGAN-----------------LFTSAA----EEYAITSVAFNPEKDYLL  243 (737)
T ss_pred             EeecC--cc-cc---ceeecCCceeEEeecccCcc-----------------cccCCh----hccceeeeeeccccceee
Confidence            88882  22 34   78889999999999974431                 144443    455566888888855554


Q ss_pred             Ee
Q 001070          292 FA  293 (1165)
Q Consensus       292 La  293 (1165)
                      =+
T Consensus       244 ~S  245 (737)
T KOG1524|consen  244 WS  245 (737)
T ss_pred             ee
Confidence            33


No 187
>KOG3881 consensus Uncharacterized conserved protein [Function unknown]
Probab=95.95  E-value=0.026  Score=65.55  Aligned_cols=157  Identities=17%  Similarity=0.249  Sum_probs=105.4

Q ss_pred             CCCCCceeecCCceEEecccCCCCCCCCCCcc-----cccccccCCCcccccccEeeecCceEEEeecC--CcEEEEeCc
Q 001070          103 TAPIYGKRVFGDYVAYDVDAVEEGREPTQQLE-----VNPITKYGSDPELLIGRQIAVNKHYVCYGLKG--GNVRVLNLN  175 (1165)
Q Consensus       103 ~~p~~Gr~l~g~~~~~dVd~~~~ge~~~pqle-----v~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kd--g~IRVwdi~  175 (1165)
                      +.||+|-.+...-++-+|+.   |+.|--+++     -++.++.-+-+++++-|+-.=+..++|||.|-  ....|||..
T Consensus       105 ~~~I~gl~~~dg~Litc~~s---G~l~~~~~k~~d~hss~l~~la~g~g~~~~r~~~~~p~Iva~GGke~~n~lkiwdle  181 (412)
T KOG3881|consen  105 TKSIKGLKLADGTLITCVSS---GNLQVRHDKSGDLHSSKLIKLATGPGLYDVRQTDTDPYIVATGGKENINELKIWDLE  181 (412)
T ss_pred             cccccchhhcCCEEEEEecC---CcEEEEeccCCccccccceeeecCCceeeeccCCCCCceEecCchhcccceeeeecc
Confidence            67887777755666666654   444423444     77888999999999999988889999999998  889999988


Q ss_pred             chhhHhhcCCccEEEeecCCCce--eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCC
Q 001070          176 TATRSLLRGHTKIKIWEDSKVAP--LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTH  253 (1165)
Q Consensus       176 t~ir~llrGH~qVriWD~~~g~p--l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~  253 (1165)
                      +.          .+||....--+  |.-.-|   -|..++-|+..  .+ +..++ .+.--+.+++||...++       
T Consensus       182 ~~----------~qiw~aKNvpnD~L~LrVP---vW~tdi~Fl~g--~~-~~~fa-t~T~~hqvR~YDt~~qR-------  237 (412)
T KOG3881|consen  182 QS----------KQIWSAKNVPNDRLGLRVP---VWITDIRFLEG--SP-NYKFA-TITRYHQVRLYDTRHQR-------  237 (412)
T ss_pred             cc----------eeeeeccCCCCccccceee---eeeccceecCC--CC-CceEE-EEecceeEEEecCcccC-------
Confidence            75          34554332100  111111   13556677621  11 22245 47788999999987654       


Q ss_pred             CCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          254 AESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       254 ~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                          +-+.+|.|        .+--..++.++|++.+|..+|++.+
T Consensus       238 ----RPV~~fd~--------~E~~is~~~l~p~gn~Iy~gn~~g~  270 (412)
T KOG3881|consen  238 ----RPVAQFDF--------LENPISSTGLTPSGNFIYTGNTKGQ  270 (412)
T ss_pred             ----cceeEecc--------ccCcceeeeecCCCcEEEEecccch
Confidence                44556665        2344568899999999999998754


No 188
>PRK02889 tolB translocation protein TolB; Provisional
Probab=95.94  E-value=0.067  Score=62.96  Aligned_cols=130  Identities=14%  Similarity=0.197  Sum_probs=75.3

Q ss_pred             EeeecCceEEEeec---CCcEEEEeCcchhhH-h--hcCCcc--------------------EEEe--ecCCCceeEEec
Q 001070          152 QIAVNKHYVCYGLK---GGNVRVLNLNTATRS-L--LRGHTK--------------------IKIW--EDSKVAPLIILK  203 (1165)
Q Consensus       152 ~IAVn~~yIayG~k---dg~IRVwdi~t~ir~-l--lrGH~q--------------------VriW--D~~~g~pl~~le  203 (1165)
                      .++.||++|+|...   ..+|.+||+.+..+. +  +.|+..                    .+||  |..++. +.++.
T Consensus       202 ~wSPDG~~la~~s~~~~~~~I~~~dl~~g~~~~l~~~~g~~~~~~~SPDG~~la~~~~~~g~~~Iy~~d~~~~~-~~~lt  280 (427)
T PRK02889        202 AWSPDGTKLAYVSFESKKPVVYVHDLATGRRRVVANFKGSNSAPAWSPDGRTLAVALSRDGNSQIYTVNADGSG-LRRLT  280 (427)
T ss_pred             eEcCCCCEEEEEEccCCCcEEEEEECCCCCEEEeecCCCCccceEECCCCCEEEEEEccCCCceEEEEECCCCC-cEECC
Confidence            36668888888764   346999999973222 2  344432                    3444  444444 66776


Q ss_pred             CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEe
Q 001070          204 PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVV  283 (1165)
Q Consensus       204 phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~  283 (1165)
                      .++| .+.+..|  +|||   +.++.....+....||.+....|          . .+.+.+.        ..+.....+
T Consensus       281 ~~~~-~~~~~~w--SpDG---~~l~f~s~~~g~~~Iy~~~~~~g----------~-~~~lt~~--------g~~~~~~~~  335 (427)
T PRK02889        281 QSSG-IDTEPFF--SPDG---RSIYFTSDRGGAPQIYRMPASGG----------A-AQRVTFT--------GSYNTSPRI  335 (427)
T ss_pred             CCCC-CCcCeEE--cCCC---CEEEEEecCCCCcEEEEEECCCC----------c-eEEEecC--------CCCcCceEE
Confidence            6544 4567888  4655   33554333445678888754321          1 1223331        122335678


Q ss_pred             ecCCcEEEEeccCC--CcEEEEEeec
Q 001070          284 LSQAGLLLFANAKK--NAIYSVHLGY  307 (1165)
Q Consensus       284 ~p~a~~ilLan~~r--~aIYalhl~~  307 (1165)
                      +|++++|+.+....  ..||.+.+.-
T Consensus       336 SpDG~~Ia~~s~~~g~~~I~v~d~~~  361 (427)
T PRK02889        336 SPDGKLLAYISRVGGAFKLYVQDLAT  361 (427)
T ss_pred             CCCCCEEEEEEccCCcEEEEEEECCC
Confidence            99999998766543  3677777654


No 189
>KOG0268 consensus Sof1-like rRNA processing protein (contains WD40 repeats) [RNA processing and modification]
Probab=95.85  E-value=0.012  Score=67.77  Aligned_cols=162  Identities=11%  Similarity=0.194  Sum_probs=104.1

Q ss_pred             ecCCceEEecccCCCCCCCCC---C------cccccccccCCCccccc-ccEeeecCceEEEeecCCcEEEEeCcc--hh
Q 001070          111 VFGDYVAYDVDAVEEGREPTQ---Q------LEVNPITKYGSDPELLI-GRQIAVNKHYVCYGLKGGNVRVLNLNT--AT  178 (1165)
Q Consensus       111 l~g~~~~~dVd~~~~ge~~~p---q------lev~pIt~Y~sd~~~~~-GR~IAVn~~yIayG~kdg~IRVwdi~t--~i  178 (1165)
                      +-|+.+++++|...-+..-..   +      --.+|+..|.|.+-... ++-=.|--..|+.++.|+.|-++|..+  -+
T Consensus       144 ilg~s~~~gIdh~~~~~~FaTcGe~i~IWD~~R~~Pv~smswG~Dti~svkfNpvETsILas~~sDrsIvLyD~R~~~Pl  223 (433)
T KOG0268|consen  144 ILGKSVYLGIDHHRKNSVFATCGEQIDIWDEQRDNPVSSMSWGADSISSVKFNPVETSILASCASDRSIVLYDLRQASPL  223 (433)
T ss_pred             eeccccccccccccccccccccCceeeecccccCCccceeecCCCceeEEecCCCcchheeeeccCCceEEEecccCCcc
Confidence            356777888887544321100   1      12469999999874221 111112246678888999999999987  44


Q ss_pred             hHhhcCCcc--------------------EEEeecCCC-ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceE
Q 001070          179 RSLLRGHTK--------------------IKIWEDSKV-APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREV  237 (1165)
Q Consensus       179 r~llrGH~q--------------------VriWD~~~g-~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtI  237 (1165)
                      +.+.-+...                    ++.+|++.. .||.++..| +..|.+|.|  +|-|..    +++||.||+|
T Consensus       224 ~KVi~~mRTN~IswnPeafnF~~a~ED~nlY~~DmR~l~~p~~v~~dh-vsAV~dVdf--sptG~E----fvsgsyDksI  296 (433)
T KOG0268|consen  224 KKVILTMRTNTICWNPEAFNFVAANEDHNLYTYDMRNLSRPLNVHKDH-VSAVMDVDF--SPTGQE----FVSGSYDKSI  296 (433)
T ss_pred             ceeeeeccccceecCccccceeeccccccceehhhhhhcccchhhccc-ceeEEEecc--CCCcch----hccccccceE
Confidence            444444333                    778888874 689999988 679999999  687777    5589999999


Q ss_pred             EEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          238 KLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       238 KLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      +|+....+..         -.-.-|-+-          .-+..|..+-|+.||+-..-..|
T Consensus       297 RIf~~~~~~S---------RdiYhtkRM----------q~V~~Vk~S~Dskyi~SGSdd~n  338 (433)
T KOG0268|consen  297 RIFPVNHGHS---------RDIYHTKRM----------QHVFCVKYSMDSKYIISGSDDGN  338 (433)
T ss_pred             EEeecCCCcc---------hhhhhHhhh----------heeeEEEEeccccEEEecCCCcc
Confidence            9999744311         011111111          12237788888888886555444


No 190
>KOG1272 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=95.83  E-value=0.021  Score=67.55  Aligned_cols=76  Identities=28%  Similarity=0.576  Sum_probs=59.2

Q ss_pred             EEEeecCCcEEEEeCcc-hhhHhhc--------------------CCcc--EEEeecCCCceeEEecCCCCCCcceeEee
Q 001070          160 VCYGLKGGNVRVLNLNT-ATRSLLR--------------------GHTK--IKIWEDSKVAPLIILKPHGGQPVNSAQYL  216 (1165)
Q Consensus       160 IayG~kdg~IRVwdi~t-~ir~llr--------------------GH~q--VriWD~~~g~pl~~lephdG~sV~SVaFl  216 (1165)
                      |+++.+.|..+-.|+.+ .+-+-|+                    ||+.  |-.|--..-.||..+--|-| +|.|||| 
T Consensus       224 L~~~~~~G~L~Y~DVS~GklVa~~~t~~G~~~vm~qNP~NaVih~GhsnGtVSlWSP~skePLvKiLcH~g-~V~siAv-  301 (545)
T KOG1272|consen  224 LVAASEAGFLKYQDVSTGKLVASIRTGAGRTDVMKQNPYNAVIHLGHSNGTVSLWSPNSKEPLVKILCHRG-PVSSIAV-  301 (545)
T ss_pred             eeecccCCceEEEeechhhhhHHHHccCCccchhhcCCccceEEEcCCCceEEecCCCCcchHHHHHhcCC-CcceEEE-
Confidence            45567789999999987 4444332                    3333  99999888888888777876 9999999 


Q ss_pred             cCCCCCCceEEEeecCCCceEEEeEc
Q 001070          217 TAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       217 ~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                          .++++|++|+| +||.+||||+
T Consensus       302 ----~~~G~YMaTtG-~Dr~~kIWDl  322 (545)
T KOG1272|consen  302 ----DRGGRYMATTG-LDRKVKIWDL  322 (545)
T ss_pred             ----CCCCcEEeecc-cccceeEeee
Confidence                35567899977 9999999998


No 191
>KOG1063 consensus RNA polymerase II elongator complex, subunit ELP2, WD repeat superfamily [Chromatin structure and dynamics; Transcription]
Probab=95.80  E-value=0.096  Score=64.48  Aligned_cols=112  Identities=13%  Similarity=0.230  Sum_probs=75.2

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCC-------------------------CceeE-EecCCCCCC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSK-------------------------VAPLI-ILKPHGGQP  209 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~-------------------------g~pl~-~lephdG~s  209 (1165)
                      |.-|||+|+-|..||||.|              ++||+.+                         ++-++ .+-+|+ ++
T Consensus       205 ~~~~laS~SQD~yIRiW~i--------------~~~~~~~~~~~e~~~t~~~~~~~f~~l~~i~~~is~eall~GHe-DW  269 (764)
T KOG1063|consen  205 DDLLLASSSQDRYIRIWRI--------------VLGDDEDSNEREDSLTTLSNLPVFMILEEIQYRISFEALLMGHE-DW  269 (764)
T ss_pred             CcEEEEecCCceEEEEEEE--------------EecCCccccccccccccccCCceeeeeeeEEEEEehhhhhcCcc-cc
Confidence            5678999999999999985              3333221                         01122 233775 59


Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccc--cEEEEEeecCC
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEA--FFNQVVVLSQA  287 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~a--ff~sV~~~p~a  287 (1165)
                      ||||-|  .|.+-+   |+ |+|.|+++-||.-....        +.|.|.-.|-..+      +.+  || .+...|.+
T Consensus       270 V~sv~W--~p~~~~---LL-SASaDksmiiW~pd~~t--------GiWv~~vRlGe~g------g~a~GF~-g~lw~~n~  328 (764)
T KOG1063|consen  270 VYSVWW--HPEGLD---LL-SASADKSMIIWKPDENT--------GIWVDVVRLGEVG------GSAGGFW-GGLWSPNS  328 (764)
T ss_pred             eEEEEE--ccchhh---he-ecccCcceEEEecCCcc--------ceEEEEEEeeccc------cccccee-eEEEcCCC
Confidence            999999  465533   77 69999999999975543        3589988876432      223  55 77777777


Q ss_pred             cEEEEeccCCCcEEEEE
Q 001070          288 GLLLFANAKKNAIYSVH  304 (1165)
Q Consensus       288 ~~ilLan~~r~aIYalh  304 (1165)
                       -.++++.+--+.|.--
T Consensus       329 -~~ii~~g~~Gg~hlWk  344 (764)
T KOG1063|consen  329 -NVIIAHGRTGGFHLWK  344 (764)
T ss_pred             -CEEEEecccCcEEEEe
Confidence             4566777777766655


No 192
>PRK04922 tolB translocation protein TolB; Provisional
Probab=95.79  E-value=0.088  Score=61.97  Aligned_cols=115  Identities=14%  Similarity=0.163  Sum_probs=69.7

Q ss_pred             CcEEEEeCcc-hhhHhhcCCcc------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCC
Q 001070          167 GNVRVLNLNT-ATRSLLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQ  221 (1165)
Q Consensus       167 g~IRVwdi~t-~ir~llrGH~q------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~  221 (1165)
                      ++|+|||... ..+.|..++..                        |++||..+|.. ..+..++| .+.+++|  +|+|
T Consensus       184 ~~l~i~D~~g~~~~~lt~~~~~v~~p~wSpDg~~la~~s~~~~~~~l~~~dl~~g~~-~~l~~~~g-~~~~~~~--SpDG  259 (433)
T PRK04922        184 YALQVADSDGYNPQTILRSAEPILSPAWSPDGKKLAYVSFERGRSAIYVQDLATGQR-ELVASFRG-INGAPSF--SPDG  259 (433)
T ss_pred             EEEEEECCCCCCceEeecCCCccccccCCCCCCEEEEEecCCCCcEEEEEECCCCCE-EEeccCCC-CccCceE--CCCC
Confidence            5799999987 55656555433                        88889887764 33444444 3457888  5665


Q ss_pred             CCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEe-ccC-CCc
Q 001070          222 AGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFA-NAK-KNA  299 (1165)
Q Consensus       222 ~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLa-n~~-r~a  299 (1165)
                      .. .++..+...+.+|.+|+++++            .|.+ +..        +......+..+|++++|+.+ |.. ...
T Consensus       260 ~~-l~~~~s~~g~~~Iy~~d~~~g------------~~~~-lt~--------~~~~~~~~~~spDG~~l~f~sd~~g~~~  317 (433)
T PRK04922        260 RR-LALTLSRDGNPEIYVMDLGSR------------QLTR-LTN--------HFGIDTEPTWAPDGKSIYFTSDRGGRPQ  317 (433)
T ss_pred             CE-EEEEEeCCCCceEEEEECCCC------------CeEE-Ccc--------CCCCccceEECCCCCEEEEEECCCCCce
Confidence            43 212223444568999998654            4443 221        11222356789999976654 433 457


Q ss_pred             EEEEEeec
Q 001070          300 IYSVHLGY  307 (1165)
Q Consensus       300 IYalhl~~  307 (1165)
                      ||.+.+.-
T Consensus       318 iy~~dl~~  325 (433)
T PRK04922        318 IYRVAASG  325 (433)
T ss_pred             EEEEECCC
Confidence            99987754


No 193
>KOG1273 consensus WD40 repeat protein [General function prediction only]
Probab=95.77  E-value=0.051  Score=62.04  Aligned_cols=53  Identities=21%  Similarity=0.248  Sum_probs=44.1

Q ss_pred             cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc
Q 001070          112 FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       112 ~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t  176 (1165)
                      .|.-++||.+++..|..-  .-.+.||+-.-|-+          ||++|.|.++|..|..||.-.
T Consensus        44 nG~vvI~D~~T~~iar~l--saH~~pi~sl~WS~----------dgr~LltsS~D~si~lwDl~~   96 (405)
T KOG1273|consen   44 NGRVVIYDFDTFRIARML--SAHVRPITSLCWSR----------DGRKLLTSSRDWSIKLWDLLK   96 (405)
T ss_pred             CCcEEEEEccccchhhhh--hccccceeEEEecC----------CCCEeeeecCCceeEEEeccC
Confidence            345678999999998887  66788888777765          777888999999999999875


No 194
>KOG0290 consensus Conserved WD40 repeat-containing protein AN11 [Function unknown]
Probab=95.71  E-value=0.025  Score=63.92  Aligned_cols=52  Identities=23%  Similarity=0.408  Sum_probs=38.2

Q ss_pred             EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          188 IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       188 VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      |-|-|+|. +.|+.+|+.|.| +|+.++|  +|+.+.|+  .| +.-|...-|||+..-
T Consensus       268 V~iLDiR~P~tpva~L~~H~a-~VNgIaW--aPhS~~hi--ct-aGDD~qaliWDl~q~  320 (364)
T KOG0290|consen  268 VVILDIRVPCTPVARLRNHQA-SVNGIAW--APHSSSHI--CT-AGDDCQALIWDLQQM  320 (364)
T ss_pred             EEEEEecCCCcceehhhcCcc-cccceEe--cCCCCcee--ee-cCCcceEEEEecccc
Confidence            44555553 347899998854 9999999  89887743  54 557888899999654


No 195
>KOG2394 consensus WD40 protein DMR-N9 [General function prediction only]
Probab=95.67  E-value=0.041  Score=66.04  Aligned_cols=62  Identities=13%  Similarity=0.255  Sum_probs=46.9

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhHhh----cCCcc------------------EEEeecCCCceeEEecCCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRSLL----RGHTK------------------IKIWEDSKVAPLIILKPHGGQP  209 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~ll----rGH~q------------------VriWD~~~g~pl~~lephdG~s  209 (1165)
                      ++-||+|||+-++||-.||+|-.+ .++.++    -|--.                  |-||-...+.-|.|=.+|. -|
T Consensus       298 FS~DG~~LA~VSqDGfLRvF~fdt~eLlg~mkSYFGGLLCvcWSPDGKyIvtGGEDDLVtVwSf~erRVVARGqGHk-SW  376 (636)
T KOG2394|consen  298 FSPDGKYLATVSQDGFLRIFDFDTQELLGVMKSYFGGLLCVCWSPDGKYIVTGGEDDLVTVWSFEERRVVARGQGHK-SW  376 (636)
T ss_pred             EcCCCceEEEEecCceEEEeeccHHHHHHHHHhhccceEEEEEcCCccEEEecCCcceEEEEEeccceEEEeccccc-cc
Confidence            444899999999999999999998 444433    33333                  9999988776666665552 29


Q ss_pred             cceeEe
Q 001070          210 VNSAQY  215 (1165)
Q Consensus       210 V~SVaF  215 (1165)
                      |.-|||
T Consensus       377 Vs~VaF  382 (636)
T KOG2394|consen  377 VSVVAF  382 (636)
T ss_pred             eeeEee
Confidence            999999


No 196
>COG2706 3-carboxymuconate cyclase [Carbohydrate transport and metabolism]
Probab=95.64  E-value=0.48  Score=55.03  Aligned_cols=177  Identities=17%  Similarity=0.238  Sum_probs=113.3

Q ss_pred             Cceee-c-------CCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeec--CceEEEeec-CCcEEEEeCc
Q 001070          107 YGKRV-F-------GDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVN--KHYVCYGLK-GGNVRVLNLN  175 (1165)
Q Consensus       107 ~Gr~l-~-------g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn--~~yIayG~k-dg~IRVwdi~  175 (1165)
                      ++|+| .       |.-..|.+|- ..|+-.  .|.-.+|+.-..       --|+||  |+|++.+.- -|.|+|+=++
T Consensus        50 ~~~~LY~v~~~~~~ggvaay~iD~-~~G~Lt--~ln~~~~~g~~p-------~yvsvd~~g~~vf~AnY~~g~v~v~p~~  119 (346)
T COG2706          50 DQRHLYVVNEPGEEGGVAAYRIDP-DDGRLT--FLNRQTLPGSPP-------CYVSVDEDGRFVFVANYHSGSVSVYPLQ  119 (346)
T ss_pred             CCCEEEEEEecCCcCcEEEEEEcC-CCCeEE--EeeccccCCCCC-------eEEEECCCCCEEEEEEccCceEEEEEcc
Confidence            67777 2       2456788885 234443  444444433222       227775  778877655 4889998886


Q ss_pred             c--hhhHh-------hc--------CCcc--------------------EEEeecCCCc--e--eEEecCCCCCCcceeE
Q 001070          176 T--ATRSL-------LR--------GHTK--------------------IKIWEDSKVA--P--LIILKPHGGQPVNSAQ  214 (1165)
Q Consensus       176 t--~ir~l-------lr--------GH~q--------------------VriWD~~~g~--p--l~~lephdG~sV~SVa  214 (1165)
                      .  .+...       -.        .|.+                    |.+||...|.  +  ...++|  |--...++
T Consensus       120 ~dG~l~~~v~~~~h~g~~p~~rQ~~~h~H~a~~tP~~~~l~v~DLG~Dri~~y~~~dg~L~~~~~~~v~~--G~GPRHi~  197 (346)
T COG2706         120 ADGSLQPVVQVVKHTGSGPHERQESPHVHSANFTPDGRYLVVPDLGTDRIFLYDLDDGKLTPADPAEVKP--GAGPRHIV  197 (346)
T ss_pred             cCCccccceeeeecCCCCCCccccCCccceeeeCCCCCEEEEeecCCceEEEEEcccCccccccccccCC--CCCcceEE
Confidence            5  33322       11        1222                    8888877764  2  111233  44578889


Q ss_pred             eecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEec
Q 001070          215 YLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       215 Fl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan  294 (1165)
                      |  .|+++.   +-.-..||.||-.|+....        ....+|+||+---+..-.  .+.-.--+.++++|+||.++|
T Consensus       198 F--Hpn~k~---aY~v~EL~stV~v~~y~~~--------~g~~~~lQ~i~tlP~dF~--g~~~~aaIhis~dGrFLYasN  262 (346)
T COG2706         198 F--HPNGKY---AYLVNELNSTVDVLEYNPA--------VGKFEELQTIDTLPEDFT--GTNWAAAIHISPDGRFLYASN  262 (346)
T ss_pred             E--cCCCcE---EEEEeccCCEEEEEEEcCC--------CceEEEeeeeccCccccC--CCCceeEEEECCCCCEEEEec
Confidence            9  566644   5445899999999998664        235799999985444321  122344567999999999999


Q ss_pred             cCCCcEEEEEeecCCC
Q 001070          295 AKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       295 ~~r~aIYalhl~~g~~  310 (1165)
                      ..-+.|-++|+....+
T Consensus       263 Rg~dsI~~f~V~~~~g  278 (346)
T COG2706         263 RGHDSIAVFSVDPDGG  278 (346)
T ss_pred             CCCCeEEEEEEcCCCC
Confidence            9999999999997554


No 197
>PRK04792 tolB translocation protein TolB; Provisional
Probab=95.51  E-value=0.28  Score=58.43  Aligned_cols=129  Identities=13%  Similarity=0.153  Sum_probs=72.7

Q ss_pred             EeeecCceEEEeecC---CcEEEEeCcc-hhhH--hhcCCcc----------------------EEEeecCCCceeEEec
Q 001070          152 QIAVNKHYVCYGLKG---GNVRVLNLNT-ATRS--LLRGHTK----------------------IKIWEDSKVAPLIILK  203 (1165)
Q Consensus       152 ~IAVn~~yIayG~kd---g~IRVwdi~t-~ir~--llrGH~q----------------------VriWD~~~g~pl~~le  203 (1165)
                      .++-||++|+|...+   .+|.+||+.+ ..+.  -+.|+..                      |++||..++. +.++.
T Consensus       224 ~wSPDG~~La~~s~~~g~~~L~~~dl~tg~~~~lt~~~g~~~~~~wSPDG~~La~~~~~~g~~~Iy~~dl~tg~-~~~lt  302 (448)
T PRK04792        224 AWSPDGRKLAYVSFENRKAEIFVQDIYTQVREKVTSFPGINGAPRFSPDGKKLALVLSKDGQPEIYVVDIATKA-LTRIT  302 (448)
T ss_pred             eECCCCCEEEEEEecCCCcEEEEEECCCCCeEEecCCCCCcCCeeECCCCCEEEEEEeCCCCeEEEEEECCCCC-eEECc
Confidence            366689999997643   3699999987 3222  2344432                      7777887765 45555


Q ss_pred             CCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEe
Q 001070          204 PHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVV  283 (1165)
Q Consensus       204 phdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~  283 (1165)
                      .+. ..+.+.+|  +||+   ++++.+...+....||......|          + ...|.+..      +.  ....+.
T Consensus       303 ~~~-~~~~~p~w--SpDG---~~I~f~s~~~g~~~Iy~~dl~~g----------~-~~~Lt~~g------~~--~~~~~~  357 (448)
T PRK04792        303 RHR-AIDTEPSW--HPDG---KSLIFTSERGGKPQIYRVNLASG----------K-VSRLTFEG------EQ--NLGGSI  357 (448)
T ss_pred             cCC-CCccceEE--CCCC---CEEEEEECCCCCceEEEEECCCC----------C-EEEEecCC------CC--CcCeeE
Confidence            443 25677888  4655   33444443333444554332211          2 23333311      11  124577


Q ss_pred             ecCCcEEEEeccCCC--cEEEEEee
Q 001070          284 LSQAGLLLFANAKKN--AIYSVHLG  306 (1165)
Q Consensus       284 ~p~a~~ilLan~~r~--aIYalhl~  306 (1165)
                      +|++.+|++++....  .||.+-++
T Consensus       358 SpDG~~l~~~~~~~g~~~I~~~dl~  382 (448)
T PRK04792        358 TPDGRSMIMVNRTNGKFNIARQDLE  382 (448)
T ss_pred             CCCCCEEEEEEecCCceEEEEEECC
Confidence            999999988876544  56665544


No 198
>KOG0650 consensus WD40 repeat nucleolar protein Bop1, involved in ribosome biogenesis [Translation, ribosomal structure and biogenesis]
Probab=95.47  E-value=0.041  Score=66.68  Aligned_cols=82  Identities=21%  Similarity=0.397  Sum_probs=62.7

Q ss_pred             eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccE
Q 001070          199 LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFF  278 (1165)
Q Consensus       199 l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff  278 (1165)
                      --++++|.| -|.++.-  .|.| .   .|++|+-|++++||+++++            +|+.|+.|         +..+
T Consensus       393 ~lvyrGHtg-~Vr~iSv--dp~G-~---wlasGsdDGtvriWEi~Tg------------Rcvr~~~~---------d~~I  444 (733)
T KOG0650|consen  393 ALVYRGHTG-LVRSISV--DPSG-E---WLASGSDDGTVRIWEIATG------------RCVRTVQF---------DSEI  444 (733)
T ss_pred             eeeEeccCC-eEEEEEe--cCCc-c---eeeecCCCCcEEEEEeecc------------eEEEEEee---------ccee
Confidence            556777776 5666555  3422 2   4668999999999999776            99999998         4577


Q ss_pred             EEEEeecCCcEEEEeccCCCcEEEEEeecC
Q 001070          279 NQVVVLSQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       279 ~sV~~~p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      -+|+..|.+.+-|||-|....+..+--.+|
T Consensus       445 ~~vaw~P~~~~~vLAvA~~~~~~ivnp~~G  474 (733)
T KOG0650|consen  445 RSVAWNPLSDLCVLAVAVGECVLIVNPIFG  474 (733)
T ss_pred             EEEEecCCCCceeEEEEecCceEEeCcccc
Confidence            799999999988888777777666666665


No 199
>PRK03629 tolB translocation protein TolB; Provisional
Probab=95.39  E-value=0.16  Score=60.02  Aligned_cols=113  Identities=13%  Similarity=0.085  Sum_probs=67.9

Q ss_pred             CcEEEEeCcc-hhhHhhcCCcc------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCC
Q 001070          167 GNVRVLNLNT-ATRSLLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQ  221 (1165)
Q Consensus       167 g~IRVwdi~t-~ir~llrGH~q------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~  221 (1165)
                      ..|.|||... ..+.+.+|...                        |++||..+|.. ..+..+.| .+.+++|  +|||
T Consensus       179 ~~l~~~d~dg~~~~~lt~~~~~~~~p~wSPDG~~la~~s~~~g~~~i~i~dl~~G~~-~~l~~~~~-~~~~~~~--SPDG  254 (429)
T PRK03629        179 YELRVSDYDGYNQFVVHRSPQPLMSPAWSPDGSKLAYVTFESGRSALVIQTLANGAV-RQVASFPR-HNGAPAF--SPDG  254 (429)
T ss_pred             eeEEEEcCCCCCCEEeecCCCceeeeEEcCCCCEEEEEEecCCCcEEEEEECCCCCe-EEccCCCC-CcCCeEE--CCCC
Confidence            4799999987 55555554422                        78888887753 22222223 2557889  5666


Q ss_pred             CCceEEEee--cCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE-EeccC-C
Q 001070          222 AGHIILVTA--GPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL-FANAK-K  297 (1165)
Q Consensus       222 ~d~~~lvts--GslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il-Lan~~-r  297 (1165)
                      ..   |+.+  ...+..|.+||+.++            ++.+-...         ...+.....+|++++|+ .++.. .
T Consensus       255 ~~---La~~~~~~g~~~I~~~d~~tg------------~~~~lt~~---------~~~~~~~~wSPDG~~I~f~s~~~g~  310 (429)
T PRK03629        255 SK---LAFALSKTGSLNLYVMDLASG------------QIRQVTDG---------RSNNTEPTWFPDSQNLAYTSDQAGR  310 (429)
T ss_pred             CE---EEEEEcCCCCcEEEEEECCCC------------CEEEccCC---------CCCcCceEECCCCCEEEEEeCCCCC
Confidence            43   4433  334457888998554            45443322         12234678899999765 44432 4


Q ss_pred             CcEEEEEeec
Q 001070          298 NAIYSVHLGY  307 (1165)
Q Consensus       298 ~aIYalhl~~  307 (1165)
                      ..||.+.+.-
T Consensus       311 ~~Iy~~d~~~  320 (429)
T PRK03629        311 PQVYKVNING  320 (429)
T ss_pred             ceEEEEECCC
Confidence            6899887764


No 200
>KOG2919 consensus Guanine nucleotide-binding protein [General function prediction only]
Probab=95.14  E-value=0.056  Score=61.86  Aligned_cols=166  Identities=20%  Similarity=0.260  Sum_probs=111.4

Q ss_pred             Cceee-cCCc-eEEecccCCCCCCCCCCcccccccccCCCccccccc-----Eeeec---CceEEEeecCCcEEEEeCcc
Q 001070          107 YGKRV-FGDY-VAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGR-----QIAVN---KHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       107 ~Gr~l-~g~~-~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR-----~IAVn---~~yIayG~kdg~IRVwdi~t  176 (1165)
                      +|..| -|.. -+.--|+..||..- |   |     |.+.-+--.|.     .||.+   -+-++-|.-..++-|++-..
T Consensus       169 DGeqlfaGykrcirvFdt~RpGr~c-~---v-----y~t~~~~k~gq~giisc~a~sP~~~~~~a~gsY~q~~giy~~~~  239 (406)
T KOG2919|consen  169 DGEQLFAGYKRCIRVFDTSRPGRDC-P---V-----YTTVTKGKFGQKGIISCFAFSPMDSKTLAVGSYGQRVGIYNDDG  239 (406)
T ss_pred             CCCeEeecccceEEEeeccCCCCCC-c---c-----hhhhhcccccccceeeeeeccCCCCcceeeecccceeeeEecCC
Confidence            78888 6733 33334666788765 2   2     22222211122     25553   55677777777777776666


Q ss_pred             -hhhHhhcCCcc-----------------------EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeec
Q 001070          177 -ATRSLLRGHTK-----------------------IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAG  231 (1165)
Q Consensus       177 -~ir~llrGH~q-----------------------VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsG  231 (1165)
                       .-..||-||..                       |-.||+|. +.||-.|+.|-|+-=..+.|=..|.+   .+|+ ||
T Consensus       240 ~~pl~llggh~gGvThL~~~edGn~lfsGaRk~dkIl~WDiR~~~~pv~~L~rhv~~TNQRI~FDld~~~---~~La-sG  315 (406)
T KOG2919|consen  240 RRPLQLLGGHGGGVTHLQWCEDGNKLFSGARKDDKILCWDIRYSRDPVYALERHVGDTNQRILFDLDPKG---EILA-SG  315 (406)
T ss_pred             CCceeeecccCCCeeeEEeccCcCeecccccCCCeEEEEeehhccchhhhhhhhccCccceEEEecCCCC---ceee-cc
Confidence             66678889987                       88999996 67999999998877788889435554   4355 79


Q ss_pred             CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          232 PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       232 slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      +.+.-|.+||+..-..|                 .+...  .+++-+|-|+++|-  +=+||-...+-||...-+
T Consensus       316 ~tdG~V~vwdlk~~gn~-----------------~sv~~--~~sd~vNgvslnP~--mpilatssGqr~f~~~~d  369 (406)
T KOG2919|consen  316 DTDGSVRVWDLKDLGNE-----------------VSVTG--NYSDTVNGVSLNPI--MPILATSSGQRIFKYPKD  369 (406)
T ss_pred             CCCccEEEEecCCCCCc-----------------ccccc--cccccccceecCcc--cceeeeccCceeecCCCc
Confidence            99999999999664222                 11111  36788999999998  667777777777765444


No 201
>TIGR02800 propeller_TolB tol-pal system beta propeller repeat protein TolB. The Tol-PAL system is required for bacterial outer membrane integrity. E. coli TolB is involved in the tonB-independent uptake of group A colicins (colicins A, E1, E2, E3 and K), and is necessary for the colicins to reach their respective targets after initial binding to the bacteria. It is also involved in uptake of filamentous DNA. Study of its structure suggest that the TolB protein might be involved in the recycling of peptidoglycan or in its covalent linking with lipoproteins. The Tol-Pal system is also implicated in pathogenesis of E. coli, Haemophilus ducreyi, Salmonella enterica and Vibrio cholerae, but the mechanism(s) is unclear.
Probab=95.08  E-value=0.22  Score=57.21  Aligned_cols=114  Identities=10%  Similarity=0.103  Sum_probs=66.6

Q ss_pred             CCcEEEEeCcc-hhhHhhcCC------------------------ccEEEeecCCCceeEEecCCCCCCcceeEeecCCC
Q 001070          166 GGNVRVLNLNT-ATRSLLRGH------------------------TKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPN  220 (1165)
Q Consensus       166 dg~IRVwdi~t-~ir~llrGH------------------------~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~  220 (1165)
                      .+.|.+||... ..|.|+..+                        .+|++||..+|.. ..+..++| .+++++|  +|+
T Consensus       169 ~~~l~~~d~~g~~~~~l~~~~~~~~~p~~Spdg~~la~~~~~~~~~~i~v~d~~~g~~-~~~~~~~~-~~~~~~~--spD  244 (417)
T TIGR02800       169 RYELQVADYDGANPQTITRSREPILSPAWSPDGQKLAYVSFESGKPEIYVQDLATGQR-EKVASFPG-MNGAPAF--SPD  244 (417)
T ss_pred             cceEEEEcCCCCCCEEeecCCCceecccCCCCCCEEEEEEcCCCCcEEEEEECCCCCE-EEeecCCC-CccceEE--CCC
Confidence            34688888876 556555433                        2389999988863 33444444 5778899  566


Q ss_pred             CCCceEEEeec--CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEecc--C
Q 001070          221 QAGHIILVTAG--PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANA--K  296 (1165)
Q Consensus       221 ~~d~~~lvtsG--slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~--~  296 (1165)
                      +..   |+.+.  ..+.+|.+|++.++            .. +.+..        +.....+...+|++++|+++..  .
T Consensus       245 g~~---l~~~~~~~~~~~i~~~d~~~~------------~~-~~l~~--------~~~~~~~~~~s~dg~~l~~~s~~~g  300 (417)
T TIGR02800       245 GSK---LAVSLSKDGNPDIYVMDLDGK------------QL-TRLTN--------GPGIDTEPSWSPDGKSIAFTSDRGG  300 (417)
T ss_pred             CCE---EEEEECCCCCccEEEEECCCC------------CE-EECCC--------CCCCCCCEEECCCCCEEEEEECCCC
Confidence            533   43333  34456888887543            22 22221        1111223456799998765432  2


Q ss_pred             CCcEEEEEeec
Q 001070          297 KNAIYSVHLGY  307 (1165)
Q Consensus       297 r~aIYalhl~~  307 (1165)
                      ...||.+.+.-
T Consensus       301 ~~~iy~~d~~~  311 (417)
T TIGR02800       301 SPQIYMMDADG  311 (417)
T ss_pred             CceEEEEECCC
Confidence            45899988763


No 202
>KOG2110 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=94.99  E-value=0.055  Score=62.68  Aligned_cols=83  Identities=17%  Similarity=0.361  Sum_probs=66.1

Q ss_pred             cCceEEE-eec-CCcEEEEeCcc-hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCCC-
Q 001070          156 NKHYVCY-GLK-GGNVRVLNLNT-ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGGQ-  208 (1165)
Q Consensus       156 n~~yIay-G~k-dg~IRVwdi~t-~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG~-  208 (1165)
                      ++.|||| |.. .|.|+|||..+ .--.++.-|+.                       |||+.+.+|.-+-.|+  .|- 
T Consensus       140 ~n~ylAyp~s~t~GdV~l~d~~nl~~v~~I~aH~~~lAalafs~~G~llATASeKGTVIRVf~v~~G~kl~eFR--RG~~  217 (391)
T KOG2110|consen  140 ANCYLAYPGSTTSGDVVLFDTINLQPVNTINAHKGPLAALAFSPDGTLLATASEKGTVIRVFSVPEGQKLYEFR--RGTY  217 (391)
T ss_pred             CCceEEecCCCCCceEEEEEcccceeeeEEEecCCceeEEEECCCCCEEEEeccCceEEEEEEcCCccEeeeee--CCce
Confidence            4679999 333 59999999998 66668889998                       9999999999888887  354 


Q ss_pred             --CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcC
Q 001070          209 --PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE  246 (1165)
Q Consensus       209 --sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~  246 (1165)
                        .+||++|  .|+   .+||. +.+...||-|+-++...
T Consensus       218 ~~~IySL~F--s~d---s~~L~-~sS~TeTVHiFKL~~~~  251 (391)
T KOG2110|consen  218 PVSIYSLSF--SPD---SQFLA-ASSNTETVHIFKLEKVS  251 (391)
T ss_pred             eeEEEEEEE--CCC---CCeEE-EecCCCeEEEEEecccc
Confidence              8999999  344   45455 57789999999996653


No 203
>KOG1407 consensus WD40 repeat protein [Function unknown]
Probab=94.94  E-value=0.098  Score=58.63  Aligned_cols=86  Identities=16%  Similarity=0.316  Sum_probs=63.2

Q ss_pred             EEEeecCCCceeEEecCCC-CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          188 IKIWEDSKVAPLIILKPHG-GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephd-G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      |+||.+..+..+-.|.... |.+|.-+++  .|-+++   ++.+++.||+|++||.-            ..+|+++++-+
T Consensus        44 v~v~n~e~~r~~~~~~~~gh~~svdql~w--~~~~~d---~~atas~dk~ir~wd~r------------~~k~~~~i~~~  106 (313)
T KOG1407|consen   44 VSVWNLERDRFRKELVYRGHTDSVDQLCW--DPKHPD---LFATASGDKTIRIWDIR------------SGKCTARIETK  106 (313)
T ss_pred             eEEEEecchhhhhhhcccCCCcchhhhee--CCCCCc---ceEEecCCceEEEEEec------------cCcEEEEeecc
Confidence            9999988764433333221 339999999  688888   77789999999999984            44999999952


Q ss_pred             CCCCCccccccEEEEEeecCCcEEEEeccCCCc
Q 001070          267 SSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNA  299 (1165)
Q Consensus       267 ~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~a  299 (1165)
                            + +.++  +...|+++++.+.|.+...
T Consensus       107 ------~-eni~--i~wsp~g~~~~~~~kdD~i  130 (313)
T KOG1407|consen  107 ------G-ENIN--ITWSPDGEYIAVGNKDDRI  130 (313)
T ss_pred             ------C-cceE--EEEcCCCCEEEEecCcccE
Confidence                  2 3454  5678999999888866443


No 204
>KOG2314 consensus Translation initiation factor 3, subunit b (eIF-3b) [Translation, ribosomal structure and biogenesis]
Probab=94.88  E-value=0.17  Score=61.32  Aligned_cols=113  Identities=15%  Similarity=0.247  Sum_probs=76.1

Q ss_pred             CCCCCCceEEEeecC-CCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          218 APNQAGHIILVTAGP-LNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       218 aP~~~d~~~lvtsGs-lnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      -|+| + +|.|.+|- .-.++..+.....        ...|+.+.+|.          +.+||.|-..|.|+|+++|+..
T Consensus       454 EP~g-d-kF~vi~g~~~k~tvsfY~~e~~--------~~~~~lVk~~d----------k~~~N~vfwsPkG~fvvva~l~  513 (698)
T KOG2314|consen  454 EPHG-D-KFAVISGNTVKNTVSFYAVETN--------IKKPSLVKELD----------KKFANTVFWSPKGRFVVVAALV  513 (698)
T ss_pred             ccCC-C-eEEEEEccccccceeEEEeecC--------CCchhhhhhhc----------ccccceEEEcCCCcEEEEEEec
Confidence            3655 3 56666665 4457888877532        24577777776          6899999999999999999988


Q ss_pred             --CCcEEEEEeecCCCccccccccccccccccceeeeeeccCCCCc--------------ceEEEEEeehhhhhhhccc
Q 001070          297 --KNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPSE--------------HIIKLYCVQTQAIQQYSLN  359 (1165)
Q Consensus       297 --r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~ge--------------~~vq~yCvQtqAIQqy~l~  359 (1165)
                        +-.+|++-.+|   ....++..+..|..+      .+.+||.|.              ..-+||-.|-.=|++--|+
T Consensus       514 s~~g~l~F~D~~~---a~~k~~~~~eh~~at------~veWDPtGRYvvT~ss~wrhk~d~GYri~tfqGrll~~~~i~  583 (698)
T KOG2314|consen  514 SRRGDLEFYDTDY---ADLKDTASPEHFAAT------EVEWDPTGRYVVTSSSSWRHKVDNGYRIFTFQGRLLKEDIID  583 (698)
T ss_pred             ccccceEEEecch---hhhhhccCccccccc------cceECCCCCEEEEeeehhhhccccceEEEEeecHHHHHHHHH
Confidence              77888877776   112333333333322      345677443              3478888888888877665


No 205
>PRK05137 tolB translocation protein TolB; Provisional
Probab=94.65  E-value=0.22  Score=58.72  Aligned_cols=111  Identities=10%  Similarity=0.148  Sum_probs=67.1

Q ss_pred             CcEEEEeCcc-hhhHhhcCCcc-------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCC
Q 001070          167 GNVRVLNLNT-ATRSLLRGHTK-------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPN  220 (1165)
Q Consensus       167 g~IRVwdi~t-~ir~llrGH~q-------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~  220 (1165)
                      ++|.|||... ..+.+. +|..                         |++||..+|.. .++..+.| .+++.+|  +||
T Consensus       182 ~~l~~~d~dg~~~~~lt-~~~~~v~~p~wSpDG~~lay~s~~~g~~~i~~~dl~~g~~-~~l~~~~g-~~~~~~~--SPD  256 (435)
T PRK05137        182 KRLAIMDQDGANVRYLT-DGSSLVLTPRFSPNRQEITYMSYANGRPRVYLLDLETGQR-ELVGNFPG-MTFAPRF--SPD  256 (435)
T ss_pred             eEEEEECCCCCCcEEEe-cCCCCeEeeEECCCCCEEEEEEecCCCCEEEEEECCCCcE-EEeecCCC-cccCcEE--CCC
Confidence            4899999987 444443 4432                         88999988864 44555544 6778889  566


Q ss_pred             CCCceEEEeecCCCc--eEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC--
Q 001070          221 QAGHIILVTAGPLNR--EVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK--  296 (1165)
Q Consensus       221 ~~d~~~lvtsGslnr--tIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~--  296 (1165)
                      |..   |+.+.+.+.  .|-+|+++++            .+.+ |..        +.........+||+++|+.+..+  
T Consensus       257 G~~---la~~~~~~g~~~Iy~~d~~~~------------~~~~-Lt~--------~~~~~~~~~~spDG~~i~f~s~~~g  312 (435)
T PRK05137        257 GRK---VVMSLSQGGNTDIYTMDLRSG------------TTTR-LTD--------SPAIDTSPSYSPDGSQIVFESDRSG  312 (435)
T ss_pred             CCE---EEEEEecCCCceEEEEECCCC------------ceEE-ccC--------CCCccCceeEcCCCCEEEEEECCCC
Confidence            533   544444444  4555566443            3432 332        12222346779999977765433  


Q ss_pred             CCcEEEEEee
Q 001070          297 KNAIYSVHLG  306 (1165)
Q Consensus       297 r~aIYalhl~  306 (1165)
                      ...||.+.++
T Consensus       313 ~~~Iy~~d~~  322 (435)
T PRK05137        313 SPQLYVMNAD  322 (435)
T ss_pred             CCeEEEEECC
Confidence            3579988765


No 206
>KOG0644 consensus Uncharacterized conserved protein, contains WD40 repeat and BROMO domains [General function prediction only]
Probab=94.61  E-value=0.069  Score=66.77  Aligned_cols=42  Identities=36%  Similarity=0.582  Sum_probs=37.5

Q ss_pred             eee--cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc------------------EEEeecC
Q 001070          153 IAV--NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK------------------IKIWEDS  194 (1165)
Q Consensus       153 IAV--n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q------------------VriWD~~  194 (1165)
                      .||  |..+||.++-|..||||-..+ .--++|+||++                  +||||.+
T Consensus       238 lavs~~n~~iaaaS~D~vIrvWrl~~~~pvsvLrghtgavtaiafsP~~sss~dgt~~~wd~r  300 (1113)
T KOG0644|consen  238 LAVSSNNTMIAAASNDKVIRVWRLPDGAPVSVLRGHTGAVTAIAFSPRASSSDDGTCRIWDAR  300 (1113)
T ss_pred             hccchhhhhhhhcccCceEEEEecCCCchHHHHhccccceeeeccCccccCCCCCceEecccc
Confidence            667  478899999999999999999 88899999995                  8999876


No 207
>PF10282 Lactonase:  Lactonase, 7-bladed beta-propeller;  InterPro: IPR019405  6-phosphogluconolactonases (6PGL) 3.1.1.31 from EC, which hydrolyses 6-phosphogluconolactone to 6-phosphogluconate is opne of the enzymes in the pentose phosphate pathway. Two families of structurally dissimilar 6PGLs are known to exist: the Escherichia coli (strain K12) YbhE IPR022528 from INTERPRO [] and the Pseudomonas aeruginosa DevB IPR005900 from INTERPRO [] types.  This entry contains bacterial 6-phosphogluconolactonases (6PGL) YbhE-type 3.1.1.31 from EC which hydrolyse 6-phosphogluconolactone to 6-phosphogluconate. The entry also contains the fungal muconate lactonizing enzyme carboxy-cis,cis-muconate cyclase 5.5.1.5 from EC and muconate cycloisomerase 5.5.1.1 from EC, which convert cis,cis-muconates to muconolactones and vice versa as part of the microbial beta-ketoadipate pathway. Structures have been reported for the E. coli 6-phosphogluconolactonase and Neurospora crassa muconate cycloisomerase. Structures of proteins in this family have revealed a 7-bladed beta-propeller fold [].; PDB: 3SCY_A 1L0Q_A 3HFQ_B 3FGB_A 1RI6_A 3U4Y_A 3BWS_A 1JOF_H.
Probab=94.56  E-value=0.84  Score=52.37  Aligned_cols=150  Identities=12%  Similarity=0.203  Sum_probs=89.6

Q ss_pred             eecCceEEE-eecCCcEEEEeCcchhhHh-----hcCCcc------------------------EEEeecC--CCc--ee
Q 001070          154 AVNKHYVCY-GLKGGNVRVLNLNTATRSL-----LRGHTK------------------------IKIWEDS--KVA--PL  199 (1165)
Q Consensus       154 AVn~~yIay-G~kdg~IRVwdi~t~ir~l-----lrGH~q------------------------VriWD~~--~g~--pl  199 (1165)
                      .-||+|+.. -+....|++|+++..-..|     +.-...                        |-+|+..  +|.  .+
T Consensus       152 ~pdg~~v~v~dlG~D~v~~~~~~~~~~~l~~~~~~~~~~G~GPRh~~f~pdg~~~Yv~~e~s~~v~v~~~~~~~g~~~~~  231 (345)
T PF10282_consen  152 SPDGRFVYVPDLGADRVYVYDIDDDTGKLTPVDSIKVPPGSGPRHLAFSPDGKYAYVVNELSNTVSVFDYDPSDGSLTEI  231 (345)
T ss_dssp             -TTSSEEEEEETTTTEEEEEEE-TTS-TEEEEEEEECSTTSSEEEEEE-TTSSEEEEEETTTTEEEEEEEETTTTEEEEE
T ss_pred             CCCCCEEEEEecCCCEEEEEEEeCCCceEEEeeccccccCCCCcEEEEcCCcCEEEEecCCCCcEEEEeecccCCceeEE
Confidence            335777654 5556789999998632111     111111                        5566555  442  22


Q ss_pred             EEecC----CCCC-CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          200 IILKP----HGGQ-PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       200 ~~lep----hdG~-sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      +++..    ..|. ....+++.     +|++||.++.-.+.+|-+|+++...|.        .+-++++..        .
T Consensus       232 ~~~~~~~~~~~~~~~~~~i~is-----pdg~~lyvsnr~~~sI~vf~~d~~~g~--------l~~~~~~~~--------~  290 (345)
T PF10282_consen  232 QTISTLPEGFTGENAPAEIAIS-----PDGRFLYVSNRGSNSISVFDLDPATGT--------LTLVQTVPT--------G  290 (345)
T ss_dssp             EEEESCETTSCSSSSEEEEEE------TTSSEEEEEECTTTEEEEEEECTTTTT--------EEEEEEEEE--------S
T ss_pred             EEeeeccccccccCCceeEEEe-----cCCCEEEEEeccCCEEEEEEEecCCCc--------eEEEEEEeC--------C
Confidence            22222    2233 56667773     555779999999999999999554331        233334332        2


Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccc-cccccce
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAE-FTVTMPV  328 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiae-F~v~~PI  328 (1165)
                      ..+-..++++|+++||++||...+.|.++.++....    ++.++.. ..+..|.
T Consensus       291 G~~Pr~~~~s~~g~~l~Va~~~s~~v~vf~~d~~tG----~l~~~~~~~~~~~p~  341 (345)
T PF10282_consen  291 GKFPRHFAFSPDGRYLYVANQDSNTVSVFDIDPDTG----KLTPVGSSVPIPSPV  341 (345)
T ss_dssp             SSSEEEEEE-TTSSEEEEEETTTTEEEEEEEETTTT----EEEEEEEEEESSSEE
T ss_pred             CCCccEEEEeCCCCEEEEEecCCCeEEEEEEeCCCC----cEEEecccccCCCCE
Confidence            345567889999999999999999999999975443    4444443 4555543


No 208
>KOG0642 consensus Cell-cycle nuclear protein, contains WD-40 repeats [Cell cycle control, cell division, chromosome partitioning]
Probab=94.52  E-value=0.029  Score=67.47  Aligned_cols=81  Identities=17%  Similarity=0.296  Sum_probs=60.1

Q ss_pred             ceEEEeecCCcEEEEeCcc--------hhh-HhhcCCcc----------------------EEEe------ecCCC----
Q 001070          158 HYVCYGLKGGNVRVLNLNT--------ATR-SLLRGHTK----------------------IKIW------EDSKV----  196 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t--------~ir-~llrGH~q----------------------VriW------D~~~g----  196 (1165)
                      --|+++.+||.|.+|+++.        ..+ ..||||+.                      ||-|      |....    
T Consensus       307 p~lit~sed~~lk~WnLqk~~~s~~~~~epi~tfraH~gPVl~v~v~~n~~~~ysgg~Dg~I~~w~~p~n~dp~ds~dp~  386 (577)
T KOG0642|consen  307 PVLITASEDGTLKLWNLQKAKKSAEKDVEPILTFRAHEGPVLCVVVPSNGEHCYSGGIDGTIRCWNLPPNQDPDDSYDPS  386 (577)
T ss_pred             CeEEEeccccchhhhhhcccCCccccceeeeEEEecccCceEEEEecCCceEEEeeccCceeeeeccCCCCCcccccCcc
Confidence            3567899999999999931        122 38999999                      9999      43333    


Q ss_pred             ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          197 APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       197 ~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      .....|.|| ++.|..++|...+++      +++.|.|.|+++|+...+
T Consensus       387 vl~~~l~Gh-tdavw~l~~s~~~~~------Llscs~DgTvr~w~~~~~  428 (577)
T KOG0642|consen  387 VLSGTLLGH-TDAVWLLALSSTKDR------LLSCSSDGTVRLWEPTEE  428 (577)
T ss_pred             hhccceecc-ccceeeeeecccccc------eeeecCCceEEeeccCCc
Confidence            246778888 459999999533433      447999999999997544


No 209
>PRK00178 tolB translocation protein TolB; Provisional
Probab=94.51  E-value=0.84  Score=53.41  Aligned_cols=127  Identities=9%  Similarity=0.089  Sum_probs=72.2

Q ss_pred             eeecCceEEEeecC---CcEEEEeCcc-hhhHh--hcCCcc----------------------EEEeecCCCceeEEecC
Q 001070          153 IAVNKHYVCYGLKG---GNVRVLNLNT-ATRSL--LRGHTK----------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       153 IAVn~~yIayG~kd---g~IRVwdi~t-~ir~l--lrGH~q----------------------VriWD~~~g~pl~~lep  204 (1165)
                      .+-||++|+|...+   .+|.+||+.+ ..+.+  +.|+..                      |++||..++. +.++..
T Consensus       206 wSpDG~~la~~s~~~~~~~l~~~~l~~g~~~~l~~~~g~~~~~~~SpDG~~la~~~~~~g~~~Iy~~d~~~~~-~~~lt~  284 (430)
T PRK00178        206 WSPDGKRIAYVSFEQKRPRIFVQNLDTGRREQITNFEGLNGAPAWSPDGSKLAFVLSKDGNPEIYVMDLASRQ-LSRVTN  284 (430)
T ss_pred             ECCCCCEEEEEEcCCCCCEEEEEECCCCCEEEccCCCCCcCCeEECCCCCEEEEEEccCCCceEEEEECCCCC-eEEccc
Confidence            55678888886543   4799999987 33332  234332                      7777888775 455554


Q ss_pred             CCCCCcceeEeecCCCCCCceEEEeecCC--CceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEE
Q 001070          205 HGGQPVNSAQYLTAPNQAGHIILVTAGPL--NREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVV  282 (1165)
Q Consensus       205 hdG~sV~SVaFl~aP~~~d~~~lvtsGsl--nrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~  282 (1165)
                      +.+ -+.+..|  +||+..   ++.+...  +..|-+|++.++            .+ +.+.+.        ..+.....
T Consensus       285 ~~~-~~~~~~~--spDg~~---i~f~s~~~g~~~iy~~d~~~g------------~~-~~lt~~--------~~~~~~~~  337 (430)
T PRK00178        285 HPA-IDTEPFW--GKDGRT---LYFTSDRGGKPQIYKVNVNGG------------RA-ERVTFV--------GNYNARPR  337 (430)
T ss_pred             CCC-CcCCeEE--CCCCCE---EEEEECCCCCceEEEEECCCC------------CE-EEeecC--------CCCccceE
Confidence            433 4567788  466532   3333322  335666665433            22 222221        11222457


Q ss_pred             eecCCcEEEEeccCC--CcEEEEEeec
Q 001070          283 VLSQAGLLLFANAKK--NAIYSVHLGY  307 (1165)
Q Consensus       283 ~~p~a~~ilLan~~r--~aIYalhl~~  307 (1165)
                      ++|++++|++.....  ..||.+-+.-
T Consensus       338 ~Spdg~~i~~~~~~~~~~~l~~~dl~t  364 (430)
T PRK00178        338 LSADGKTLVMVHRQDGNFHVAAQDLQR  364 (430)
T ss_pred             ECCCCCEEEEEEccCCceEEEEEECCC
Confidence            899999998887543  3466666553


No 210
>KOG1188 consensus WD40 repeat protein [General function prediction only]
Probab=94.33  E-value=0.21  Score=57.74  Aligned_cols=140  Identities=16%  Similarity=0.229  Sum_probs=87.3

Q ss_pred             CcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc-----------------------
Q 001070          132 QLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK-----------------------  187 (1165)
Q Consensus       132 qlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q-----------------------  187 (1165)
                      .|...+++-|...      ++     .-+|.|+.+|.||++|-.| ..-.-|+||..                       
T Consensus        26 ~Lk~~~q~~~~~~------~e-----~~vav~lSngsv~lyd~~tg~~l~~fk~~~~~~N~vrf~~~ds~h~v~s~ssDG   94 (376)
T KOG1188|consen   26 CLKYDIQEQVKDG------FE-----TAVAVSLSNGSVRLYDKGTGQLLEEFKGPPATTNGVRFISCDSPHGVISCSSDG   94 (376)
T ss_pred             eeeccchhhhccC------cc-----eeEEEEecCCeEEEEeccchhhhheecCCCCcccceEEecCCCCCeeEEeccCC
Confidence            4555555555544      44     4457999999999999999 55668888887                       


Q ss_pred             -EEEeecCCC--ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecC----CCceEEEeEccCcCCCCCCCCCCCcceE
Q 001070          188 -IKIWEDSKV--APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGP----LNREVKLWASASEEGWSLPTHAESWKCT  260 (1165)
Q Consensus       188 -VriWD~~~g--~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGs----lnrtIKLW~~a~~~~~~~~~~~~~w~C~  260 (1165)
                       ||+||+|..  .++..|+.|-|.+-.|++-    +-.++  ++..|.    -|--|.|||.-.               -
T Consensus        95 ~Vr~wD~Rs~~e~a~~~~~~~~~~~f~~ld~----nck~~--ii~~GtE~~~s~A~v~lwDvR~---------------~  153 (376)
T KOG1188|consen   95 TVRLWDIRSQAESARISWTQQSGTPFICLDL----NCKKN--IIACGTELTRSDASVVLWDVRS---------------E  153 (376)
T ss_pred             eEEEEEeecchhhhheeccCCCCCcceEeec----cCcCC--eEEeccccccCceEEEEEEecc---------------c
Confidence             999999985  4677777665555444443    21232  344554    466789999622               2


Q ss_pred             EEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          261 QTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       261 QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      |++-. .-.+  .|.|=+-+|.++|+--=+||+-..--.|-.+-+.
T Consensus       154 qq~l~-~~~e--SH~DDVT~lrFHP~~pnlLlSGSvDGLvnlfD~~  196 (376)
T KOG1188|consen  154 QQLLR-QLNE--SHNDDVTQLRFHPSDPNLLLSGSVDGLVNLFDTK  196 (376)
T ss_pred             cchhh-hhhh--hccCcceeEEecCCCCCeEEeecccceEEeeecC
Confidence            22110 0011  2555566888888887777776555444444443


No 211
>KOG1923 consensus Rac1 GTPase effector FRL [Signal transduction mechanisms; Cytoskeleton]
Probab=94.32  E-value=0.074  Score=66.14  Aligned_cols=16  Identities=19%  Similarity=0.264  Sum_probs=7.1

Q ss_pred             ehhhhhhhcccccccc
Q 001070          349 QTQAIQQYSLNLFQCL  364 (1165)
Q Consensus       349 QtqAIQqy~l~~~~c~  364 (1165)
                      |+-+|+...+++-.|+
T Consensus       466 h~~dLk~L~~~~ve~L  481 (830)
T KOG1923|consen  466 HPLDLKALSLEPVELL  481 (830)
T ss_pred             hhccccccCCcHHHHH
Confidence            3334444444444443


No 212
>KOG2919 consensus Guanine nucleotide-binding protein [General function prediction only]
Probab=94.26  E-value=0.29  Score=56.37  Aligned_cols=90  Identities=13%  Similarity=0.205  Sum_probs=64.5

Q ss_pred             cccEeeecCceEEEeecCCcEEEEeCcc-------hhhHhhcCCcc----------------------------------
Q 001070          149 IGRQIAVNKHYVCYGLKGGNVRVLNLNT-------ATRSLLRGHTK----------------------------------  187 (1165)
Q Consensus       149 ~GR~IAVn~~yIayG~kdg~IRVwdi~t-------~ir~llrGH~q----------------------------------  187 (1165)
                      -|=.-+.||+-|.+-.+|...+||++-.       ..+..+.-|.-                                  
T Consensus        53 kgckWSPDGSciL~~sedn~l~~~nlP~dlys~~~~~~~~~~~~~~~r~~eg~tvydy~wYs~M~s~qP~t~l~a~ssr~  132 (406)
T KOG2919|consen   53 KGCKWSPDGSCILSLSEDNCLNCWNLPFDLYSKKADGPLNFSKHLSYRYQEGETVYDYCWYSRMKSDQPSTNLFAVSSRD  132 (406)
T ss_pred             ccceeCCCCceEEeecccCeeeEEecChhhcccCCCCccccccceeEEeccCCEEEEEEeeeccccCCCccceeeecccc
Confidence            3555677899999999999999999863       34556666665                                  


Q ss_pred             --EEEeecCCCceeEEecCCCC----CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          188 --IKIWEDSKVAPLIILKPHGG----QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       188 --VriWD~~~g~pl~~lephdG----~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                        |++||.-+|..-..++.+|-    ..-.|++|  +|||..   |++ | -+|+||++|++-+
T Consensus       133 ~PIh~wdaftG~lraSy~~ydh~de~taAhsL~F--s~DGeq---lfa-G-ykrcirvFdt~Rp  189 (406)
T KOG2919|consen  133 QPIHLWDAFTGKLRASYRAYDHQDEYTAAHSLQF--SPDGEQ---LFA-G-YKRCIRVFDTSRP  189 (406)
T ss_pred             CceeeeeccccccccchhhhhhHHhhhhheeEEe--cCCCCe---Eee-c-ccceEEEeeccCC
Confidence              66677666665555555542    16679999  566654   663 4 8999999998544


No 213
>KOG2445 consensus Nuclear pore complex component (sc Seh1) [Nuclear structure; Intracellular trafficking, secretion, and vesicular transport]
Probab=94.24  E-value=0.12  Score=59.08  Aligned_cols=109  Identities=21%  Similarity=0.356  Sum_probs=67.6

Q ss_pred             cccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCC--CcceeE
Q 001070          137 PITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQ--PVNSAQ  214 (1165)
Q Consensus       137 pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~--sV~SVa  214 (1165)
                      ||+..-|-|  -.||-.    ..||++.+|| ||||++....-.++..-.-  ==+.-+-.+|+...-||+|  .|.+|.
T Consensus       225 pI~di~wAP--n~Gr~y----~~lAvA~kDg-v~I~~v~~~~s~i~~ee~~--~~~~~~~l~v~~vs~~~~H~~~VWrv~  295 (361)
T KOG2445|consen  225 PIRDISWAP--NIGRSY----HLLAVATKDG-VRIFKVKVARSAIEEEEVL--APDLMTDLPVEKVSELDDHNGEVWRVR  295 (361)
T ss_pred             cceeeeecc--ccCCce----eeEEEeecCc-EEEEEEeeccchhhhhccc--CCCCccccceEEeeeccCCCCceEEEE
Confidence            555555555  235543    3478899999 9999999744434321110  0000011345555545554  799999


Q ss_pred             eecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCC
Q 001070          215 YLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSA  269 (1165)
Q Consensus       215 Fl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~  269 (1165)
                      |     ..-+- +++|...|.++|||-....         ..|+|+--|+...+.
T Consensus       296 w-----NmtGt-iLsStGdDG~VRLWkany~---------n~~kC~sv~~~e~~~  335 (361)
T KOG2445|consen  296 W-----NMTGT-ILSSTGDDGCVRLWKANYN---------NLWKCTSVLKAEGSV  335 (361)
T ss_pred             E-----eeeee-EEeecCCCceeeehhhhhh---------hhheeeeEEeccCCC
Confidence            9     23345 3556779999999997444         468999999986664


No 214
>KOG1009 consensus Chromatin assembly complex 1 subunit B/CAC2 (contains WD40 repeats) [Chromatin structure and dynamics; Replication, recombination and repair]
Probab=94.17  E-value=0.082  Score=61.89  Aligned_cols=156  Identities=19%  Similarity=0.264  Sum_probs=97.7

Q ss_pred             ceEEecccCCCCCCCCCCcccccccccCCCccccc----ccEeeecCceEEEeecCCcEEEEeCc--------c------
Q 001070          115 YVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLI----GRQIAVNKHYVCYGLKGGNVRVLNLN--------T------  176 (1165)
Q Consensus       115 ~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~----GR~IAVn~~yIayG~kdg~IRVwdi~--------t------  176 (1165)
                      -+++-|++..+|+.-       ...+|-+.-....    +=.+.-+|..||+|.-+|.|-+|=.+        +      
T Consensus        38 iriW~v~r~~~~~~~-------~~V~y~s~Ls~H~~aVN~vRf~p~gelLASg~D~g~v~lWk~~~~~~~~~d~e~~~~k  110 (434)
T KOG1009|consen   38 IRIWKVNRSEPGGGD-------MKVEYLSSLSRHTRAVNVVRFSPDGELLASGGDGGEVFLWKQGDVRIFDADTEADLNK  110 (434)
T ss_pred             eeeeeeeecCCCCCc-------eeEEEeecccCCcceeEEEEEcCCcCeeeecCCCceEEEEEecCcCCccccchhhhCc
Confidence            345778888887753       3444544431111    11122347899999999999999776        2      


Q ss_pred             ---hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeec
Q 001070          177 ---ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAG  231 (1165)
Q Consensus       177 ---~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsG  231 (1165)
                         .++..++||-.                      +++||+++|..+..+..| ++-|.-|||  .|.+..    |.+-
T Consensus       111 e~w~v~k~lr~h~~diydL~Ws~d~~~l~s~s~dns~~l~Dv~~G~l~~~~~dh-~~yvqgvaw--Dpl~qy----v~s~  183 (434)
T KOG1009|consen  111 EKWVVKKVLRGHRDDIYDLAWSPDSNFLVSGSVDNSVRLWDVHAGQLLAILDDH-EHYVQGVAW--DPLNQY----VASK  183 (434)
T ss_pred             cceEEEEEecccccchhhhhccCCCceeeeeeccceEEEEEeccceeEeecccc-ccccceeec--chhhhh----hhhh
Confidence               34558999988                      999999999999999887 568999999  555433    3356


Q ss_pred             CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCC------------CCccccccEEEEEeecCCcEEEEe
Q 001070          232 PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSA------------KPRVEEAFFNQVVVLSQAGLLLFA  293 (1165)
Q Consensus       232 slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~------------~~~~~~aff~sV~~~p~a~~ilLa  293 (1165)
                      +-||..+...+...         ....|+++-...+..            .-..-+.||--..++|+|.++|--
T Consensus       184 s~dr~~~~~~~~~~---------~~~~~~~~~~m~~~~~~~~e~~s~rLfhDeTlksFFrRlsfTPdG~llvtP  248 (434)
T KOG1009|consen  184 SSDRHPEGFSAKLK---------QVIKRHGLDIMPAKAFNEREGKSTRLFHDETLKSFFRRLSFTPDGSLLVTP  248 (434)
T ss_pred             ccCcccceeeeeee---------eeeeeeeeeEeeecccCCCCcceeeeeecCchhhhhhhcccCCCCcEEEcc
Confidence            66664444443222         112333321111110            001235688889999999988753


No 215
>PRK02889 tolB translocation protein TolB; Provisional
Probab=94.12  E-value=0.31  Score=57.49  Aligned_cols=122  Identities=10%  Similarity=0.180  Sum_probs=70.5

Q ss_pred             EEEeec---CCcEEEEeCcc-hhhHhhcCCcc------------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          160 VCYGLK---GGNVRVLNLNT-ATRSLLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       160 IayG~k---dg~IRVwdi~t-~ir~llrGH~q------------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      |+|-.+   ...|.+||... ..|.++.+.+-                        |++||..+|.. .++....| .+.
T Consensus       166 iayv~~~~~~~~L~~~D~dG~~~~~l~~~~~~v~~p~wSPDG~~la~~s~~~~~~~I~~~dl~~g~~-~~l~~~~g-~~~  243 (427)
T PRK02889        166 IAYVIKTGNRYQLQISDADGQNAQSALSSPEPIISPAWSPDGTKLAYVSFESKKPVVYVHDLATGRR-RVVANFKG-SNS  243 (427)
T ss_pred             EEEEEccCCccEEEEECCCCCCceEeccCCCCcccceEcCCCCEEEEEEccCCCcEEEEEECCCCCE-EEeecCCC-Ccc
Confidence            445443   34788888876 44444433222                        88999988864 33443434 456


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      +++|  +|||.   .|+.+.+.+....||.+....+          . .+.|..        +.....+...+||+++|+
T Consensus       244 ~~~~--SPDG~---~la~~~~~~g~~~Iy~~d~~~~----------~-~~~lt~--------~~~~~~~~~wSpDG~~l~  299 (427)
T PRK02889        244 APAW--SPDGR---TLAVALSRDGNSQIYTVNADGS----------G-LRRLTQ--------SSGIDTEPFFSPDGRSIY  299 (427)
T ss_pred             ceEE--CCCCC---EEEEEEccCCCceEEEEECCCC----------C-cEECCC--------CCCCCcCeEEcCCCCEEE
Confidence            7889  46653   3554556666777777644311          1 233332        112233456899999776


Q ss_pred             E-ecc-CCCcEEEEEeec
Q 001070          292 F-ANA-KKNAIYSVHLGY  307 (1165)
Q Consensus       292 L-an~-~r~aIYalhl~~  307 (1165)
                      . +|. ....||.+.++-
T Consensus       300 f~s~~~g~~~Iy~~~~~~  317 (427)
T PRK02889        300 FTSDRGGAPQIYRMPASG  317 (427)
T ss_pred             EEecCCCCcEEEEEECCC
Confidence            5 443 356899987653


No 216
>KOG0309 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=94.08  E-value=0.03  Score=69.08  Aligned_cols=64  Identities=27%  Similarity=0.358  Sum_probs=47.3

Q ss_pred             EEEeecCCC-ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          188 IKIWEDSKV-APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       188 VriWD~~~g-~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      |+|||++.| .|+..+++|- -.||+++|.-.-++     ++-+.+.|+|+|.|+.+..        .+-|+-++|-.|
T Consensus       182 i~vwd~r~gs~pl~s~K~~v-s~vn~~~fnr~~~s-----~~~s~~~d~tvkfw~y~kS--------t~e~~~~vtt~~  246 (1081)
T KOG0309|consen  182 IFVWDLRKGSTPLCSLKGHV-SSVNSIDFNRFKYS-----EIMSSSNDGTVKFWDYSKS--------TTESKRTVTTNF  246 (1081)
T ss_pred             eEEEeccCCCcceEEecccc-eeeehHHHhhhhhh-----hhcccCCCCceeeeccccc--------ccccceeccccC
Confidence            999999986 6899999763 49999999633333     2336889999999997543        234666666665


No 217
>PF02239 Cytochrom_D1:  Cytochrome D1 heme domain; PDB: 1NNO_B 1HZU_A 1N15_B 1N50_A 1GJQ_A 1BL9_B 1NIR_B 1N90_B 1HZV_A 1AOQ_A ....
Probab=94.01  E-value=0.6  Score=54.69  Aligned_cols=135  Identities=15%  Similarity=0.243  Sum_probs=75.8

Q ss_pred             ccccEeeecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc---------------------EEEeecCCCceeEEecC
Q 001070          148 LIGRQIAVNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK---------------------IKIWEDSKVAPLIILKP  204 (1165)
Q Consensus       148 ~~GR~IAVn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q---------------------VriWD~~~g~pl~~lep  204 (1165)
                      ..+.-++-||+|+....+||.|.|||+.+  .++.+-.|-..                     |.|||.++..++.+..-
T Consensus        39 h~~~~~s~Dgr~~yv~~rdg~vsviD~~~~~~v~~i~~G~~~~~i~~s~DG~~~~v~n~~~~~v~v~D~~tle~v~~I~~  118 (369)
T PF02239_consen   39 HAGLKFSPDGRYLYVANRDGTVSVIDLATGKVVATIKVGGNPRGIAVSPDGKYVYVANYEPGTVSVIDAETLEPVKTIPT  118 (369)
T ss_dssp             EEEEE-TT-SSEEEEEETTSEEEEEETTSSSEEEEEE-SSEEEEEEE--TTTEEEEEEEETTEEEEEETTT--EEEEEE-
T ss_pred             eeEEEecCCCCEEEEEcCCCeEEEEECCcccEEEEEecCCCcceEEEcCCCCEEEEEecCCCceeEeccccccceeeccc
Confidence            34455677899888888999999999998  45555555544                     88999999888887753


Q ss_pred             C----CCC--CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccE
Q 001070          205 H----GGQ--PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFF  278 (1165)
Q Consensus       205 h----dG~--sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff  278 (1165)
                      .    ++.  .|..+..  +|+++.+  +++-- -..  +||-++...       . ...-+.+++-         ..|.
T Consensus       119 ~~~~~~~~~~Rv~aIv~--s~~~~~f--Vv~lk-d~~--~I~vVdy~d-------~-~~~~~~~i~~---------g~~~  174 (369)
T PF02239_consen  119 GGMPVDGPESRVAAIVA--SPGRPEF--VVNLK-DTG--EIWVVDYSD-------P-KNLKVTTIKV---------GRFP  174 (369)
T ss_dssp             -EE-TTTS---EEEEEE---SSSSEE--EEEET-TTT--EEEEEETTT-------S-SCEEEEEEE-----------TTE
T ss_pred             ccccccccCCCceeEEe--cCCCCEE--EEEEc-cCC--eEEEEEecc-------c-cccceeeecc---------cccc
Confidence            3    111  2333433  6776653  33312 222  455443221       0 1122234431         2344


Q ss_pred             EEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          279 NQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       279 ~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      .-..++|+++|+++|.-..|.|-++...
T Consensus       175 ~D~~~dpdgry~~va~~~sn~i~viD~~  202 (369)
T PF02239_consen  175 HDGGFDPDGRYFLVAANGSNKIAVIDTK  202 (369)
T ss_dssp             EEEEE-TTSSEEEEEEGGGTEEEEEETT
T ss_pred             cccccCcccceeeecccccceeEEEeec
Confidence            5677899999999987667766666544


No 218
>PLN02919 haloacid dehalogenase-like hydrolase family protein
Probab=93.89  E-value=0.65  Score=61.33  Aligned_cols=78  Identities=17%  Similarity=0.127  Sum_probs=48.2

Q ss_pred             cceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCC------CCccccccEEEEEe
Q 001070          210 VNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSA------KPRVEEAFFNQVVV  283 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~------~~~~~~aff~sV~~  283 (1165)
                      .+.|+|  .+   ++. +.++...|++|++||.+++            .|. |+-+....      ...++-.....|++
T Consensus       806 P~Gvav--d~---dG~-LYVADs~N~rIrviD~~tg------------~v~-tiaG~G~~G~~dG~~~~a~l~~P~GIav  866 (1057)
T PLN02919        806 PLGVLC--AK---DGQ-IYVADSYNHKIKKLDPATK------------RVT-TLAGTGKAGFKDGKALKAQLSEPAGLAL  866 (1057)
T ss_pred             CceeeE--eC---CCc-EEEEECCCCEEEEEECCCC------------eEE-EEeccCCcCCCCCcccccccCCceEEEE
Confidence            455666  23   344 3445788999999998654            333 22221110      00011123457899


Q ss_pred             ecCCcEEEEeccCCCcEEEEEeec
Q 001070          284 LSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       284 ~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ++++. |++||...|.|..+.+..
T Consensus       867 d~dG~-lyVaDt~Nn~Irvid~~~  889 (1057)
T PLN02919        867 GENGR-LFVADTNNSLIRYLDLNK  889 (1057)
T ss_pred             eCCCC-EEEEECCCCEEEEEECCC
Confidence            99987 788999999999888764


No 219
>KOG1517 consensus Guanine nucleotide binding protein MIP1 [Cell cycle control, cell division, chromosome partitioning]
Probab=93.83  E-value=0.11  Score=66.55  Aligned_cols=82  Identities=20%  Similarity=0.347  Sum_probs=50.9

Q ss_pred             CceEEEeecCCcEEEEeCcchhh----HhhcCCcc-------------------------EEEeecCCC---ceeEEecC
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATR----SLLRGHTK-------------------------IKIWEDSKV---APLIILKP  204 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir----~llrGH~q-------------------------VriWD~~~g---~pl~~lep  204 (1165)
                      |.-|+.|.-||.|||+|....-+    ..-|-|..                         |++||.|.-   ..+.+-.+
T Consensus      1221 gn~i~AGfaDGsvRvyD~R~a~~ds~v~~~R~h~~~~~Iv~~slq~~G~~elvSgs~~G~I~~~DlR~~~~e~~~~iv~~ 1300 (1387)
T KOG1517|consen 1221 GNIIAAGFADGSVRVYDRRMAPPDSLVCVYREHNDVEPIVHLSLQRQGLGELVSGSQDGDIQLLDLRMSSKETFLTIVAH 1300 (1387)
T ss_pred             CceEEEeecCCceEEeecccCCccccceeecccCCcccceeEEeecCCCcceeeeccCCeEEEEecccCcccccceeeec
Confidence            67777999999999999987222    23455554                         999999863   11111111


Q ss_pred             C-CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          205 H-GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       205 h-dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      - -|-.+.++.-   ....+   +|++|+. +.||||++++.
T Consensus      1301 ~~yGs~lTal~V---H~hap---iiAsGs~-q~ikIy~~~G~ 1335 (1387)
T KOG1517|consen 1301 WEYGSALTALTV---HEHAP---IIASGSA-QLIKIYSLSGE 1335 (1387)
T ss_pred             cccCccceeeee---ccCCC---eeeecCc-ceEEEEecChh
Confidence            1 0322333322   22223   5888988 99999999765


No 220
>PRK01029 tolB translocation protein TolB; Provisional
Probab=93.64  E-value=1.6  Score=51.94  Aligned_cols=83  Identities=10%  Similarity=0.059  Sum_probs=47.0

Q ss_pred             eEEecCCCCCCcceeEeecCCCCCCceEEEe-ecC-CCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccc
Q 001070          199 LIILKPHGGQPVNSAQYLTAPNQAGHIILVT-AGP-LNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEA  276 (1165)
Q Consensus       199 l~~lephdG~sV~SVaFl~aP~~~d~~~lvt-sGs-lnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~a  276 (1165)
                      ..++..+ +..+.+.+|  +|||..   |+. +.. ....|.+||++++            ++.+-...         ..
T Consensus       319 ~~~lt~~-~~~~~~p~w--SPDG~~---Laf~~~~~g~~~I~v~dl~~g------------~~~~Lt~~---------~~  371 (428)
T PRK01029        319 PRLLTKK-YRNSSCPAW--SPDGKK---IAFCSVIKGVRQICVYDLATG------------RDYQLTTS---------PE  371 (428)
T ss_pred             eEEeccC-CCCccceeE--CCCCCE---EEEEEcCCCCcEEEEEECCCC------------CeEEccCC---------CC
Confidence            3444433 235677788  566532   332 222 2457999998654            44322211         11


Q ss_pred             cEEEEEeecCCcEEEEecc--CCCcEEEEEeecC
Q 001070          277 FFNQVVVLSQAGLLLFANA--KKNAIYSVHLGYG  308 (1165)
Q Consensus       277 ff~sV~~~p~a~~ilLan~--~r~aIYalhl~~g  308 (1165)
                      .+.....+|++++|+.+..  .+..||.+.+.-+
T Consensus       372 ~~~~p~wSpDG~~L~f~~~~~g~~~L~~vdl~~g  405 (428)
T PRK01029        372 NKESPSWAIDSLHLVYSAGNSNESELYLISLITK  405 (428)
T ss_pred             CccceEECCCCCEEEEEECCCCCceEEEEECCCC
Confidence            2234677899998886543  3467998888643


No 221
>PF06705 SF-assemblin:  SF-assemblin/beta giardin
Probab=93.63  E-value=10  Score=42.20  Aligned_cols=76  Identities=22%  Similarity=0.337  Sum_probs=44.6

Q ss_pred             HHHHHHH-HHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHH----------HHHHHhHHHHHHHHHHHHHhHH
Q 001070          740 QVIAMQD-MLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIE----------KAVKASTDALWARFHEENARNE  808 (1165)
Q Consensus       740 q~~~mq~-~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ie----------K~lk~eld~L~~R~dEerr~rE  808 (1165)
                      ++..|++ .-+++..+...+++.+..     +.+.+..||..|..+..          ..|.++|..|..-|+.++..|.
T Consensus        71 ~i~~~~~~v~~~~~~~~~~~~~~l~~-----L~~ri~~L~~~i~ee~~~r~~~ie~~~~~l~~~l~~l~~~~~~Er~~R~  145 (247)
T PF06705_consen   71 QINNMQERVENQISEKQEQLQSRLDS-----LNDRIEALEEEIQEEKEERPQDIEELNQELVRELNELQEAFENERNERE  145 (247)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            4445555 334444445555555544     56667777666554433          3567777888888888887775


Q ss_pred             HHHHHHHHHHHHHHHH
Q 001070          809 KLLRDRTQQITGLITN  824 (1165)
Q Consensus       809 aa~~~RQ~qLL~LVS~  824 (1165)
                          +|...|++.+.+
T Consensus       146 ----erE~~i~krl~e  157 (247)
T PF06705_consen  146 ----EREENILKRLEE  157 (247)
T ss_pred             ----HHHHHHHHHHHH
Confidence                344455555555


No 222
>PF02239 Cytochrom_D1:  Cytochrome D1 heme domain; PDB: 1NNO_B 1HZU_A 1N15_B 1N50_A 1GJQ_A 1BL9_B 1NIR_B 1N90_B 1HZV_A 1AOQ_A ....
Probab=93.56  E-value=0.4  Score=56.12  Aligned_cols=96  Identities=15%  Similarity=0.216  Sum_probs=64.0

Q ss_pred             hcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE
Q 001070          182 LRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ  261 (1165)
Q Consensus       182 lrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q  261 (1165)
                      .+|...|.|.|..+...+.+++.. |..-.+++|  +|||   +++.+++ .|.+|-+||+.+.            +++.
T Consensus        12 ~~~~~~v~viD~~t~~~~~~i~~~-~~~h~~~~~--s~Dg---r~~yv~~-rdg~vsviD~~~~------------~~v~   72 (369)
T PF02239_consen   12 ERGSGSVAVIDGATNKVVARIPTG-GAPHAGLKF--SPDG---RYLYVAN-RDGTVSVIDLATG------------KVVA   72 (369)
T ss_dssp             EGGGTEEEEEETTT-SEEEEEE-S-TTEEEEEE---TT-S---SEEEEEE-TTSEEEEEETTSS------------SEEE
T ss_pred             ecCCCEEEEEECCCCeEEEEEcCC-CCceeEEEe--cCCC---CEEEEEc-CCCeEEEEECCcc------------cEEE
Confidence            345555777777777778888743 333345677  4544   5566554 5789999999555            8999


Q ss_pred             EEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEe
Q 001070          262 TLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       262 TLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl  305 (1165)
                      ++..       +..  -..+++++|++||+++|...+.|.++-.
T Consensus        73 ~i~~-------G~~--~~~i~~s~DG~~~~v~n~~~~~v~v~D~  107 (369)
T PF02239_consen   73 TIKV-------GGN--PRGIAVSPDGKYVYVANYEPGTVSVIDA  107 (369)
T ss_dssp             EEE--------SSE--EEEEEE--TTTEEEEEEEETTEEEEEET
T ss_pred             EEec-------CCC--cceEEEcCCCCEEEEEecCCCceeEecc
Confidence            9985       222  3478999999999999999999888754


No 223
>KOG2695 consensus WD40 repeat protein [General function prediction only]
Probab=93.47  E-value=0.22  Score=57.61  Aligned_cols=132  Identities=23%  Similarity=0.311  Sum_probs=84.5

Q ss_pred             ccccEeeecCceEEEeecCCcEEEEeCcch----------------hhH--hhcCCcc----------EEEeecCCCce-
Q 001070          148 LIGRQIAVNKHYVCYGLKGGNVRVLNLNTA----------------TRS--LLRGHTK----------IKIWEDSKVAP-  198 (1165)
Q Consensus       148 ~~GR~IAVn~~yIayG~kdg~IRVwdi~t~----------------ir~--llrGH~q----------VriWD~~~g~p-  198 (1165)
                      ++-.|+|.-+..+.-|.++|.|-++|+..+                +..  +|.--.|          |++||.|--.+ 
T Consensus       255 VfAlQf~~s~nLv~~GcRngeI~~iDLR~rnqG~~~~a~rlyh~Ssvtslq~Lq~s~q~LmaS~M~gkikLyD~R~~K~~  334 (425)
T KOG2695|consen  255 VFALQFAGSDNLVFNGCRNGEIFVIDLRCRNQGNGWCAQRLYHDSSVTSLQILQFSQQKLMASDMTGKIKLYDLRATKCK  334 (425)
T ss_pred             HHHHHhcccCCeeEecccCCcEEEEEeeecccCCCcceEEEEcCcchhhhhhhccccceEeeccCcCceeEeeehhhhcc
Confidence            455678887888889999999999998764                111  1221111          99999886544 


Q ss_pred             --eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccc
Q 001070          199 --LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEA  276 (1165)
Q Consensus       199 --l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~a  276 (1165)
                        |..+|+|    |++-+++..-=.+.-.+++ ++..|--.+||.+..+            .-+-|+.|+-+.-    +.
T Consensus       335 ~~V~qYeGH----vN~~a~l~~~v~~eeg~I~-s~GdDcytRiWsl~~g------------hLl~tipf~~s~~----e~  393 (425)
T KOG2695|consen  335 KSVMQYEGH----VNLSAYLPAHVKEEEGSIF-SVGDDCYTRIWSLDSG------------HLLCTIPFPYSAS----EV  393 (425)
T ss_pred             cceeeeecc----cccccccccccccccceEE-EccCeeEEEEEecccC------------ceeeccCCCCccc----cc
Confidence              9999988    7777776432122223344 5779999999998554            7777888855442    22


Q ss_pred             cEEEEEeecC-------CcEEEEeccCCCcEEEE
Q 001070          277 FFNQVVVLSQ-------AGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       277 ff~sV~~~p~-------a~~ilLan~~r~aIYal  303 (1165)
                      -+-+|+.+.+       .||+|   +.|.+||++
T Consensus       394 d~~sv~~~sr~~k~~~g~G~ll---~~re~Ly~f  424 (425)
T KOG2695|consen  394 DIPSVAFDSRLGKARGGPGLLL---AVREDLYCF  424 (425)
T ss_pred             cccceehhcccccccCCCeeEe---eeccceecc
Confidence            3335554332       23444   356677764


No 224
>KOG4378 consensus Nuclear protein COP1 [Signal transduction mechanisms]
Probab=93.30  E-value=0.19  Score=60.22  Aligned_cols=76  Identities=17%  Similarity=0.219  Sum_probs=52.6

Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      |++|.-+-|     .+..+||+..++-|.++-|||..+.+-.                |+-+.   .|.|-+--|+..|.
T Consensus       164 gqsvRll~y-----s~skr~lL~~asd~G~VtlwDv~g~sp~----------------~~~~~---~HsAP~~gicfsps  219 (673)
T KOG4378|consen  164 GQSVRLLRY-----SPSKRFLLSIASDKGAVTLWDVQGMSPI----------------FHASE---AHSAPCRGICFSPS  219 (673)
T ss_pred             CCeEEEeec-----ccccceeeEeeccCCeEEEEeccCCCcc----------------cchhh---hccCCcCcceecCC
Confidence            344544444     2566889999999999999998665311                11111   47777778888899


Q ss_pred             CcEEEEeccCCCcEEEEEee
Q 001070          287 AGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       287 a~~ilLan~~r~aIYalhl~  306 (1165)
                      ...||++=-.-.-||..-+.
T Consensus       220 ne~l~vsVG~Dkki~~yD~~  239 (673)
T KOG4378|consen  220 NEALLVSVGYDKKINIYDIR  239 (673)
T ss_pred             ccceEEEecccceEEEeecc
Confidence            99888887777777766555


No 225
>KOG1007 consensus WD repeat protein TSSC1, WD repeat superfamily [Function unknown]
Probab=93.01  E-value=0.48  Score=53.97  Aligned_cols=96  Identities=18%  Similarity=0.289  Sum_probs=61.7

Q ss_pred             CCcccccccEeee----cCceEEEeecCCcEEEEeCcc--hhhH-hh----cCCcc-----------------------E
Q 001070          143 SDPELLIGRQIAV----NKHYVCYGLKGGNVRVLNLNT--ATRS-LL----RGHTK-----------------------I  188 (1165)
Q Consensus       143 sd~~~~~GR~IAV----n~~yIayG~kdg~IRVwdi~t--~ir~-ll----rGH~q-----------------------V  188 (1165)
                      ..+-..+||.--|    |+.-|+.-. |..|-+||++.  .+.. ++    .+|++                       +
T Consensus       117 ~Ldteavg~i~cvew~Pns~klasm~-dn~i~l~~l~ess~~vaev~ss~s~e~~~~ftsg~WspHHdgnqv~tt~d~tl  195 (370)
T KOG1007|consen  117 SLDTEAVGKINCVEWEPNSDKLASMD-DNNIVLWSLDESSKIVAEVLSSESAEMRHSFTSGAWSPHHDGNQVATTSDSTL  195 (370)
T ss_pred             cCCHHHhCceeeEEEcCCCCeeEEec-cCceEEEEcccCcchheeecccccccccceecccccCCCCccceEEEeCCCcE
Confidence            3344456654222    554444333 88999999986  3221 22    23333                       9


Q ss_pred             EEeecCCCce-eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          189 KIWEDSKVAP-LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       189 riWD~~~g~p-l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                      +.||.|+-.. ..+-..| |+-|.++-|  .|+.   ++.++++.-|.-|||||+-..
T Consensus       196 ~~~D~RT~~~~~sI~dAH-gq~vrdlDf--Npnk---q~~lvt~gDdgyvriWD~R~t  247 (370)
T KOG1007|consen  196 QFWDLRTMKKNNSIEDAH-GQRVRDLDF--NPNK---QHILVTCGDDGYVRIWDTRKT  247 (370)
T ss_pred             EEEEccchhhhcchhhhh-cceeeeccC--CCCc---eEEEEEcCCCccEEEEeccCC
Confidence            9999998543 3344445 899999999  5655   445666778999999998544


No 226
>KOG0290 consensus Conserved WD40 repeat-containing protein AN11 [Function unknown]
Probab=92.93  E-value=0.93  Score=51.81  Aligned_cols=173  Identities=18%  Similarity=0.240  Sum_probs=104.5

Q ss_pred             cccccccCCCccc--ccccEeeecCceEEEeecCCcEEEEeCcc-----hhhHhhcCCcc--------------------
Q 001070          135 VNPITKYGSDPEL--LIGRQIAVNKHYVCYGLKGGNVRVLNLNT-----ATRSLLRGHTK--------------------  187 (1165)
Q Consensus       135 v~pIt~Y~sd~~~--~~GR~IAVn~~yIayG~kdg~IRVwdi~t-----~ir~llrGH~q--------------------  187 (1165)
                      .-|.||..|-|..  ..-+++|-         .+...|+|-+..     ....+|..|..                    
T Consensus        96 ~YP~tK~~wiPd~~g~~pdlLAT---------s~D~LRlWri~~ee~~~~~~~~L~~~kns~~~aPlTSFDWne~dp~~i  166 (364)
T KOG0290|consen   96 PYPVTKLMWIPDSKGVYPDLLAT---------SSDFLRLWRIGDEESRVELQSVLNNNKNSEFCAPLTSFDWNEVDPNLI  166 (364)
T ss_pred             CCCccceEecCCccccCcchhhc---------ccCeEEEEeccCcCCceehhhhhccCcccccCCcccccccccCCccee
Confidence            3467777776633  12233443         345679998883     45557777776                    


Q ss_pred             --------EEEeecCCCce---eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCC-C-CC--CC
Q 001070          188 --------IKIWEDSKVAP---LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEG-W-SL--PT  252 (1165)
Q Consensus       188 --------VriWD~~~g~p---l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~-~-~~--~~  252 (1165)
                              --|||+.+|..   --.|-.|| +.||.|+|+     .+++-+.+|-..|..++|+||-.-+- . .+  |+
T Consensus       167 gtSSiDTTCTiWdie~~~~~~vkTQLIAHD-KEV~DIaf~-----~~s~~~FASvgaDGSvRmFDLR~leHSTIIYE~p~  240 (364)
T KOG0290|consen  167 GTSSIDTTCTIWDIETGVSGTVKTQLIAHD-KEVYDIAFL-----KGSRDVFASVGADGSVRMFDLRSLEHSTIIYEDPS  240 (364)
T ss_pred             EeecccCeEEEEEEeeccccceeeEEEecC-cceeEEEec-----cCccceEEEecCCCcEEEEEecccccceEEecCCC
Confidence                    66999999854   34566786 699999997     34455788888999999999943211 0 00  11


Q ss_pred             CC-C----Cc---------------ceEEEEeccCC----CCCccccccEEEEEeecCCcEEEEeccC--CCcEEEEEee
Q 001070          253 HA-E----SW---------------KCTQTLDLKSS----AKPRVEEAFFNQVVVLSQAGLLLFANAK--KNAIYSVHLG  306 (1165)
Q Consensus       253 ~~-~----~w---------------~C~QTLe~~~s----~~~~~~~aff~sV~~~p~a~~ilLan~~--r~aIYalhl~  306 (1165)
                      .. .    .|               .=++-|.....    .+.++|++-+|-++-.|..+-.+.+...  -..|+-|+--
T Consensus       241 ~~~pLlRLswnkqDpnymATf~~dS~~V~iLDiR~P~tpva~L~~H~a~VNgIaWaPhS~~hictaGDD~qaliWDl~q~  320 (364)
T KOG0290|consen  241 PSTPLLRLSWNKQDPNYMATFAMDSNKVVILDIRVPCTPVARLRNHQASVNGIAWAPHSSSHICTAGDDCQALIWDLQQM  320 (364)
T ss_pred             CCCcceeeccCcCCchHHhhhhcCCceEEEEEecCCCcceehhhcCcccccceEecCCCCceeeecCCcceEEEEecccc
Confidence            00 0    01               11222222211    2557899999999999998855554433  3344444444


Q ss_pred             cCCCccccccccccccccccceeeeeecc
Q 001070          307 YGNNSAATRIDYIAEFTVTMPVLSFTGTI  335 (1165)
Q Consensus       307 ~g~~~~~~r~dyiaeF~v~~PILSft~~~  335 (1165)
                      ..             =.+--|||..+...
T Consensus       321 ~~-------------~~~~dPilay~a~~  336 (364)
T KOG0290|consen  321 PR-------------ENGEDPILAYTAGG  336 (364)
T ss_pred             cc-------------cCCCCchhhhhccc
Confidence            32             23456888877654


No 227
>KOG1539 consensus WD repeat protein [General function prediction only]
Probab=92.92  E-value=0.23  Score=62.36  Aligned_cols=81  Identities=17%  Similarity=0.281  Sum_probs=65.9

Q ss_pred             EEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCcceeEee
Q 001070          160 VCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYL  216 (1165)
Q Consensus       160 IayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV~SVaFl  216 (1165)
                      |.-|+++|...+||+.| .+-+.|++|..                      |-|+.++.+.=+..|+--.| .|.++.| 
T Consensus       175 IvvGs~~G~lql~Nvrt~K~v~~f~~~~s~IT~ieqsPaLDVVaiG~~~G~ViifNlK~dkil~sFk~d~g-~VtslSF-  252 (910)
T KOG1539|consen  175 IVVGSSQGRLQLWNVRTGKVVYTFQEFFSRITAIEQSPALDVVAIGLENGTVIIFNLKFDKILMSFKQDWG-RVTSLSF-  252 (910)
T ss_pred             EEEeecCCcEEEEEeccCcEEEEecccccceeEeccCCcceEEEEeccCceEEEEEcccCcEEEEEEcccc-ceeEEEe-
Confidence            45699999999999999 88889999976                      77788887777888874335 8999999 


Q ss_pred             cCCCCCCceEEEeecCCCceEEEeEccCcC
Q 001070          217 TAPNQAGHIILVTAGPLNREVKLWASASEE  246 (1165)
Q Consensus       217 ~aP~~~d~~~lvtsGslnrtIKLW~~a~~~  246 (1165)
                       +-||   ..++++|.-+..+-+|||+...
T Consensus       253 -rtDG---~p~las~~~~G~m~~wDLe~kk  278 (910)
T KOG1539|consen  253 -RTDG---NPLLASGRSNGDMAFWDLEKKK  278 (910)
T ss_pred             -ccCC---CeeEEeccCCceEEEEEcCCCe
Confidence             4444   4488889999999999997653


No 228
>KOG1310 consensus WD40 repeat protein [General function prediction only]
Probab=92.71  E-value=0.64  Score=56.49  Aligned_cols=32  Identities=16%  Similarity=0.170  Sum_probs=27.9

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhH-hhcCCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRS-LLRGHTK  187 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~-llrGH~q  187 (1165)
                      ||.+|++|+.|-+|-|||--. +.++ +-.||++
T Consensus        61 dG~lL~SGSDD~r~ivWd~~~~KllhsI~TgHta   94 (758)
T KOG1310|consen   61 DGELLASGSDDTRLIVWDPFEYKLLHSISTGHTA   94 (758)
T ss_pred             CCCEEeecCCcceEEeecchhcceeeeeeccccc
Confidence            599999999999999999987 5555 6789999


No 229
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=92.35  E-value=0.45  Score=56.74  Aligned_cols=119  Identities=18%  Similarity=0.249  Sum_probs=72.1

Q ss_pred             Cceee---cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEee--ecCceEEEeecCCcEEEEeCcc-----
Q 001070          107 YGKRV---FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIA--VNKHYVCYGLKGGNVRVLNLNT-----  176 (1165)
Q Consensus       107 ~Gr~l---~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IA--Vn~~yIayG~kdg~IRVwdi~t-----  176 (1165)
                      +|++|   .|.-.||--|.+.+ .++         -.+ -|-+.+.|..|+  -||.|+|+|++-|.+-|+|.++     
T Consensus       355 dsk~l~~~~~~GeV~v~nl~~~-~~~---------~rf-~D~G~v~gts~~~S~ng~ylA~GS~~GiVNIYd~~s~~~s~  423 (514)
T KOG2055|consen  355 DSKELLASGGTGEVYVWNLRQN-SCL---------HRF-VDDGSVHGTSLCISLNGSYLATGSDSGIVNIYDGNSCFAST  423 (514)
T ss_pred             CCcEEEEEcCCceEEEEecCCc-ceE---------EEE-eecCccceeeeeecCCCceEEeccCcceEEEeccchhhccC
Confidence            78888   34455655555555 333         122 233445688766  7999999999999999999664     


Q ss_pred             -------------hhhHhhcCCcc-------------EEEeecCCCceeEEecCCCCC--CcceeEeecCCCCCCceEEE
Q 001070          177 -------------ATRSLLRGHTK-------------IKIWEDSKVAPLIILKPHGGQ--PVNSAQYLTAPNQAGHIILV  228 (1165)
Q Consensus       177 -------------~ir~llrGH~q-------------VriWD~~~g~pl~~lephdG~--sV~SVaFl~aP~~~d~~~lv  228 (1165)
                                   +|-+|--.|.-             +|+--+-+..=..-|-+.++.  -|.||+|  +|+++.   |.
T Consensus       424 ~PkPik~~dNLtt~Itsl~Fn~d~qiLAiaS~~~knalrLVHvPS~TVFsNfP~~n~~vg~vtc~aF--SP~sG~---lA  498 (514)
T KOG2055|consen  424 NPKPIKTVDNLTTAITSLQFNHDAQILAIASRVKKNALRLVHVPSCTVFSNFPTSNTKVGHVTCMAF--SPNSGY---LA  498 (514)
T ss_pred             CCCchhhhhhhheeeeeeeeCcchhhhhhhhhccccceEEEeccceeeeccCCCCCCcccceEEEEe--cCCCce---EE
Confidence                         11111112221             343333322223344333332  7999999  687766   55


Q ss_pred             eecCCCceEEEeEc
Q 001070          229 TAGPLNREVKLWAS  242 (1165)
Q Consensus       229 tsGslnrtIKLW~~  242 (1165)
                      . |--.+.+.||.+
T Consensus       499 v-GNe~grv~l~kL  511 (514)
T KOG2055|consen  499 V-GNEAGRVHLFKL  511 (514)
T ss_pred             e-ecCCCceeeEee
Confidence            4 778888999987


No 230
>KOG1310 consensus WD40 repeat protein [General function prediction only]
Probab=92.28  E-value=0.24  Score=59.92  Aligned_cols=51  Identities=22%  Similarity=0.433  Sum_probs=40.8

Q ss_pred             EEEeecCCCceeEEecCCCCC--CcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQ--PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~--sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      +-|||.-.-.+|+...  .||  -|+||-|+  |+..+.+  |.+|..|+.|||+|+..
T Consensus        74 ~ivWd~~~~KllhsI~--TgHtaNIFsvKFv--P~tnnri--v~sgAgDk~i~lfdl~~  126 (758)
T KOG1310|consen   74 LIVWDPFEYKLLHSIS--TGHTANIFSVKFV--PYTNNRI--VLSGAGDKLIKLFDLDS  126 (758)
T ss_pred             EEeecchhcceeeeee--cccccceeEEeee--ccCCCeE--EEeccCcceEEEEeccc
Confidence            8899987666777664  355  89999997  8877744  55799999999999975


No 231
>KOG0307 consensus Vesicle coat complex COPII, subunit SEC31 [Intracellular trafficking, secretion, and vesicular transport]
Probab=92.21  E-value=0.35  Score=62.45  Aligned_cols=80  Identities=18%  Similarity=0.345  Sum_probs=54.8

Q ss_pred             eEEEeecCCcEEEEeCcc-------hhhHhhcCCcc-----------------------EEEeecCCCceeEEecCCCC-
Q 001070          159 YVCYGLKGGNVRVLNLNT-------ATRSLLRGHTK-----------------------IKIWEDSKVAPLIILKPHGG-  207 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~t-------~ir~llrGH~q-----------------------VriWD~~~g~pl~~lephdG-  207 (1165)
                      .||.|++||+|-+||-+.       .+-..++.|+.                       |-|||..+-.  .-+.+.+- 
T Consensus        82 lIaGG~edG~I~ly~p~~~~~~~~~~~la~~~~h~G~V~gLDfN~~q~nlLASGa~~geI~iWDlnn~~--tP~~~~~~~  159 (1049)
T KOG0307|consen   82 LIAGGLEDGNIVLYDPASIIANASEEVLATKSKHTGPVLGLDFNPFQGNLLASGADDGEILIWDLNKPE--TPFTPGSQA  159 (1049)
T ss_pred             eeeccccCCceEEecchhhccCcchHHHhhhcccCCceeeeeccccCCceeeccCCCCcEEEeccCCcC--CCCCCCCCC
Confidence            488999999999999774       44456777887                       9999998721  11222111 


Q ss_pred             --CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          208 --QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       208 --~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                        +-|.+|+|    |+.. .++++||+-+.++.|||+-..
T Consensus       160 ~~~eI~~lsW----Nrkv-qhILAS~s~sg~~~iWDlr~~  194 (1049)
T KOG0307|consen  160 PPSEIKCLSW----NRKV-SHILASGSPSGRAVIWDLRKK  194 (1049)
T ss_pred             CcccceEecc----chhh-hHHhhccCCCCCceeccccCC
Confidence              24566666    5544 234678989989999999554


No 232
>KOG1587 consensus Cytoplasmic dynein intermediate chain [Cytoskeleton]
Probab=92.06  E-value=0.38  Score=59.36  Aligned_cols=115  Identities=17%  Similarity=0.333  Sum_probs=80.7

Q ss_pred             eEEEeecCCcEEEEeCcc---hhhHhhcCCcc----------------------------EEEeecC-CCceeEEecCCC
Q 001070          159 YVCYGLKGGNVRVLNLNT---ATRSLLRGHTK----------------------------IKIWEDS-KVAPLIILKPHG  206 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~t---~ir~llrGH~q----------------------------VriWD~~-~g~pl~~lephd  206 (1165)
                      ||+ |.+.|.|-.-+++.   ..--+++||.+                            ||||... ...|+-.|+-+ 
T Consensus       363 FiV-GTe~G~v~~~~r~g~~~~~~~~~~~~~~~~~h~g~v~~v~~nPF~~k~fls~gDW~vriWs~~~~~~Pl~~~~~~-  440 (555)
T KOG1587|consen  363 FIV-GTEEGKVYKGCRKGYTPAPEVSYKGHSTFITHIGPVYAVSRNPFYPKNFLSVGDWTVRIWSEDVIASPLLSLDSS-  440 (555)
T ss_pred             EEE-EcCCcEEEEEeccCCcccccccccccccccccCcceEeeecCCCccceeeeeccceeEeccccCCCCcchhhhhc-
Confidence            443 88899888855553   33356677755                            9999887 67888777654 


Q ss_pred             CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC
Q 001070          207 GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ  286 (1165)
Q Consensus       207 G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~  286 (1165)
                      -..|++|+|  +|-+|.   ++..+..|..|-||||.-.        .....|.|-+.          ..+.+-|...+.
T Consensus       441 ~~~v~~vaW--Sptrpa---vF~~~d~~G~l~iWDLl~~--------~~~Pv~s~~~~----------~~~l~~~~~s~~  497 (555)
T KOG1587|consen  441 PDYVTDVAW--SPTRPA---VFATVDGDGNLDIWDLLQD--------DEEPVLSQKVC----------SPALTRVRWSPN  497 (555)
T ss_pred             cceeeeeEE--cCcCce---EEEEEcCCCceehhhhhcc--------ccCCccccccc----------ccccceeecCCC
Confidence            246999999  688888   6667899999999998432        12234444333          234445566777


Q ss_pred             CcEEEEeccCCC
Q 001070          287 AGLLLFANAKKN  298 (1165)
Q Consensus       287 a~~ilLan~~r~  298 (1165)
                      +.+|.++|+..+
T Consensus       498 g~~lavGd~~G~  509 (555)
T KOG1587|consen  498 GKLLAVGDANGT  509 (555)
T ss_pred             CcEEEEecCCCc
Confidence            999999998765


No 233
>PRK00178 tolB translocation protein TolB; Provisional
Probab=92.01  E-value=1.7  Score=50.87  Aligned_cols=112  Identities=15%  Similarity=0.139  Sum_probs=62.9

Q ss_pred             cEEEEeCcc-hhhHhhcCCcc------------------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCC
Q 001070          168 NVRVLNLNT-ATRSLLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQA  222 (1165)
Q Consensus       168 ~IRVwdi~t-~ir~llrGH~q------------------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~  222 (1165)
                      +|.|+|.+. ..+.++.+...                        |.+||..+|.. ..+....| .+.+.+|  +|||.
T Consensus       180 ~l~~~d~~g~~~~~l~~~~~~~~~p~wSpDG~~la~~s~~~~~~~l~~~~l~~g~~-~~l~~~~g-~~~~~~~--SpDG~  255 (430)
T PRK00178        180 TLQRSDYDGARAVTLLQSREPILSPRWSPDGKRIAYVSFEQKRPRIFVQNLDTGRR-EQITNFEG-LNGAPAW--SPDGS  255 (430)
T ss_pred             EEEEECCCCCCceEEecCCCceeeeeECCCCCEEEEEEcCCCCCEEEEEECCCCCE-EEccCCCC-CcCCeEE--CCCCC
Confidence            577888876 55555544433                        77788877753 33333333 3556888  56653


Q ss_pred             CceEEEeec--CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEe-ccC-CC
Q 001070          223 GHIILVTAG--PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFA-NAK-KN  298 (1165)
Q Consensus       223 d~~~lvtsG--slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLa-n~~-r~  298 (1165)
                      .   |+.+.  ..+..|.+||++++            .+.+ |..        +.........+|++++|+.+ +.. ..
T Consensus       256 ~---la~~~~~~g~~~Iy~~d~~~~------------~~~~-lt~--------~~~~~~~~~~spDg~~i~f~s~~~g~~  311 (430)
T PRK00178        256 K---LAFVLSKDGNPEIYVMDLASR------------QLSR-VTN--------HPAIDTEPFWGKDGRTLYFTSDRGGKP  311 (430)
T ss_pred             E---EEEEEccCCCceEEEEECCCC------------CeEE-ccc--------CCCCcCCeEECCCCCEEEEEECCCCCc
Confidence            3   43222  33457888887654            2221 221        11223345678999876554 432 45


Q ss_pred             cEEEEEeec
Q 001070          299 AIYSVHLGY  307 (1165)
Q Consensus       299 aIYalhl~~  307 (1165)
                      .||.+-+.-
T Consensus       312 ~iy~~d~~~  320 (430)
T PRK00178        312 QIYKVNVNG  320 (430)
T ss_pred             eEEEEECCC
Confidence            789887653


No 234
>PF00400 WD40:  WD domain, G-beta repeat;  InterPro: IPR019781 WD-40 repeats (also known as WD or beta-transducin repeats) are short ~40 amino acid motifs, often terminating in a Trp-Asp (W-D) dipeptide. WD40 repeats usually assume a 7-8 bladed beta-propeller fold, but proteins have been found with 4 to 16 repeated units, which also form a circularised beta-propeller structure. WD-repeat proteins are a large family found in all eukaryotes and are implicated in a variety of functions ranging from signal transduction and transcription regulation to cell cycle control and apoptosis. Repeated WD40 motifs act as a site for protein-protein interaction, and proteins containing WD40 repeats are known to serve as platforms for the assembly of protein complexes or mediators of transient interplay among other proteins. The specificity of the proteins is determined by the sequences outside the repeats themselves. Examples of such complexes are G proteins (beta subunit is a beta-propeller), TAFII transcription factor, and E3 ubiquitin ligase [, ]. In Arabidopsis spp., several WD40-containing proteins act as key regulators of plant-specific developmental events.; PDB: 2ZKQ_a 3CFV_B 3CFS_B 1PEV_A 1NR0_A 1VYH_T 3RFH_A 3O2Z_T 3FRX_C 3U5G_g ....
Probab=91.97  E-value=0.16  Score=39.34  Aligned_cols=18  Identities=22%  Similarity=0.599  Sum_probs=17.0

Q ss_pred             cCceEEEeecCCcEEEEe
Q 001070          156 NKHYVCYGLKGGNVRVLN  173 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwd  173 (1165)
                      ++.+|++|..||.|||||
T Consensus        22 ~~~~~~s~~~D~~i~vwd   39 (39)
T PF00400_consen   22 DGNFLASGSSDGTIRVWD   39 (39)
T ss_dssp             TSSEEEEEETTSEEEEEE
T ss_pred             ccccceeeCCCCEEEEEC
Confidence            589999999999999998


No 235
>COG5170 CDC55 Serine/threonine protein phosphatase 2A, regulatory subunit [Signal transduction mechanisms]
Probab=91.79  E-value=0.34  Score=55.48  Aligned_cols=135  Identities=16%  Similarity=0.252  Sum_probs=83.3

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHh-----hcCCcc----EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceE
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSL-----LRGHTK----IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHII  226 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~l-----lrGH~q----VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~  226 (1165)
                      |-||++|-|.|.+-.+-+.. .-+.-     |.||+-    .+--|+.             +.|+.+-|++ +-+.. .|
T Consensus        38 g~YlatGDkgGRVvlfer~~s~~ceykf~teFQshe~EFDYLkSleie-------------EKin~I~w~~-~t~r~-hF  102 (460)
T COG5170          38 GLYLATGDKGGRVVLFEREKSYGCEYKFFTEFQSHELEFDYLKSLEIE-------------EKINAIEWFD-DTGRN-HF  102 (460)
T ss_pred             cceEeecCCCceEEEeecccccccchhhhhhhcccccchhhhhhccHH-------------HHhhheeeec-CCCcc-eE
Confidence            88999999999999998876 43332     666664    2222221             3455555552 22333 34


Q ss_pred             EEeecCCCceEEEeEccC-----------cCCCCCCCCC--------CCcceEEEEeccCCCCC----ccccccEEEEEe
Q 001070          227 LVTAGPLNREVKLWASAS-----------EEGWSLPTHA--------ESWKCTQTLDLKSSAKP----RVEEAFFNQVVV  283 (1165)
Q Consensus       227 lvtsGslnrtIKLW~~a~-----------~~~~~~~~~~--------~~w~C~QTLe~~~s~~~----~~~~aff~sV~~  283 (1165)
                      |++ + .|||||||-+-.           .+|+..|-++        ..++|-+.-+.-...+.    +.|--..|++.+
T Consensus       103 Lls-t-NdktiKlWKiyeknlk~va~nnls~~~~~~~~g~~~s~~~l~lprls~hd~iiaa~p~rvyaNaH~yhiNSiS~  180 (460)
T COG5170         103 LLS-T-NDKTIKLWKIYEKNLKVVAENNLSDSFHSPMGGPLTSTKELLLPRLSEHDEIIAAKPCRVYANAHPYHINSISF  180 (460)
T ss_pred             EEe-c-CCceeeeeeeecccchhhhccccccccccccCCCcCCHHHhhcccccccceEEEeccceeccccceeEeeeeee
Confidence            663 3 899999999833           2233333221        12455444443222111    356667899999


Q ss_pred             ecCCcEEEEeccCCCcEEEEEeecC
Q 001070          284 LSQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       284 ~p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      ..|...+|-||.-|=.++-+.+--+
T Consensus       181 NsD~et~lSaDdLrINLWnl~i~D~  205 (460)
T COG5170         181 NSDKETLLSADDLRINLWNLEIIDG  205 (460)
T ss_pred             cCchheeeeccceeeeeccccccCC
Confidence            9999999999998888887766543


No 236
>KOG0322 consensus G-protein beta subunit-like protein GNB1L, contains WD repeats [General function prediction only]
Probab=91.78  E-value=0.39  Score=54.12  Aligned_cols=25  Identities=20%  Similarity=0.111  Sum_probs=19.5

Q ss_pred             CCccccccEEEEEeecCCcEEEEec
Q 001070          270 KPRVEEAFFNQVVVLSQAGLLLFAN  294 (1165)
Q Consensus       270 ~~~~~~aff~sV~~~p~a~~ilLan  294 (1165)
                      ....|++=+|.|+++|+.+++-+|.
T Consensus       288 VLkyHsagvn~vAfspd~~lmAaas  312 (323)
T KOG0322|consen  288 VLKYHSAGVNAVAFSPDCELMAAAS  312 (323)
T ss_pred             hhhhhhcceeEEEeCCCCchhhhcc
Confidence            3456889999999999988765543


No 237
>KOG3671 consensus Actin regulatory protein (Wiskott-Aldrich syndrome protein) [Signal transduction mechanisms; Cytoskeleton]
Probab=91.70  E-value=0.27  Score=58.93  Aligned_cols=6  Identities=67%  Similarity=1.536  Sum_probs=2.2

Q ss_pred             CCCCCC
Q 001070           25 PYPPPS   30 (1165)
Q Consensus        25 ~~~~~~   30 (1165)
                      |+|||+
T Consensus       375 ~PPPpp  380 (569)
T KOG3671|consen  375 PPPPPP  380 (569)
T ss_pred             CCcCCC
Confidence            333333


No 238
>KOG2106 consensus Uncharacterized conserved protein, contains HELP and WD40 domains [Function unknown]
Probab=91.12  E-value=1.4  Score=53.22  Aligned_cols=77  Identities=21%  Similarity=0.325  Sum_probs=57.0

Q ss_pred             CceEEEeecCCcEEEEeCcc----hhhHhhcCCcc----------------------EEEeecCCCceeEEecCCCCCCc
Q 001070          157 KHYVCYGLKGGNVRVLNLNT----ATRSLLRGHTK----------------------IKIWEDSKVAPLIILKPHGGQPV  210 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t----~ir~llrGH~q----------------------VriWD~~~g~pl~~lephdG~sV  210 (1165)
                      ...||+-. -|+|-.|+..+    .-..+|.+|++                      |.||+..+..-...-..||| .|
T Consensus       213 ~nliit~G-k~H~~Fw~~~~~~l~k~~~~fek~ekk~Vl~v~F~engdviTgDS~G~i~Iw~~~~~~~~k~~~aH~g-gv  290 (626)
T KOG2106|consen  213 PNLIITCG-KGHLYFWTLRGGSLVKRQGIFEKREKKFVLCVTFLENGDVITGDSGGNILIWSKGTNRISKQVHAHDG-GV  290 (626)
T ss_pred             CcEEEEeC-CceEEEEEccCCceEEEeeccccccceEEEEEEEcCCCCEEeecCCceEEEEeCCCceEEeEeeecCC-ce
Confidence            44555443 38999999997    23349999998                      89999865432222228887 89


Q ss_pred             ceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          211 NSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      |+++-+     .++. |++ |.-||.|-+||-
T Consensus       291 ~~L~~l-----r~Gt-llS-GgKDRki~~Wd~  315 (626)
T KOG2106|consen  291 FSLCML-----RDGT-LLS-GGKDRKIILWDD  315 (626)
T ss_pred             EEEEEe-----cCcc-Eee-cCccceEEeccc
Confidence            999997     6777 775 889999999994


No 239
>COG5178 PRP8 U5 snRNP spliceosome subunit [RNA processing and modification]
Probab=90.89  E-value=0.14  Score=65.61  Aligned_cols=19  Identities=26%  Similarity=0.320  Sum_probs=11.9

Q ss_pred             HHHHhhccCcccccccCCC
Q 001070         1057 VSWLCSQVDMHGLLSMVPL 1075 (1165)
Q Consensus      1057 V~~LcsrvDP~~Lfsl~Pl 1075 (1165)
                      |-.+-++.+|..+|+|...
T Consensus      1204 f~svysk~nPnllFSM~Gf 1222 (2365)
T COG5178        1204 FGSVYSKINPNLLFSMVGF 1222 (2365)
T ss_pred             cceeeeccCCceeEEeece
Confidence            3345566777777776643


No 240
>KOG1272 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=90.84  E-value=0.35  Score=57.69  Aligned_cols=91  Identities=19%  Similarity=0.262  Sum_probs=54.5

Q ss_pred             ccEeeec--CceEEEeecCCcEEEEeCcc-hhhH-hhcCCcc------------------EEEeecC-CCceeEEecCC-
Q 001070          150 GRQIAVN--KHYVCYGLKGGNVRVLNLNT-ATRS-LLRGHTK------------------IKIWEDS-KVAPLIILKPH-  205 (1165)
Q Consensus       150 GR~IAVn--~~yIayG~kdg~IRVwdi~t-~ir~-llrGH~q------------------VriWD~~-~g~pl~~leph-  205 (1165)
                      -+.||||  |.|.+|...|..++|||+.+ ..-+ +..-|--                  |.||-+. +|.+ ..-.|+ 
T Consensus       296 V~siAv~~~G~YMaTtG~Dr~~kIWDlR~~~ql~t~~tp~~a~~ls~SqkglLA~~~G~~v~iw~d~~~~s~-~~~~pYm  374 (545)
T KOG1272|consen  296 VSSIAVDRGGRYMATTGLDRKVKIWDLRNFYQLHTYRTPHPASNLSLSQKGLLALSYGDHVQIWKDALKGSG-HGETPYM  374 (545)
T ss_pred             cceEEECCCCcEEeecccccceeEeeeccccccceeecCCCccccccccccceeeecCCeeeeehhhhcCCC-CCCcchh
Confidence            3569996  99999999999999999987 3222 2111111                  9999664 3221 112222 


Q ss_pred             ---CCCCcceeEeecC------CCCCCceEEEeecCCCceEEEeE
Q 001070          206 ---GGQPVNSAQYLTA------PNQAGHIILVTAGPLNREVKLWA  241 (1165)
Q Consensus       206 ---dG~sV~SVaFl~a------P~~~d~~~lvtsGslnrtIKLW~  241 (1165)
                         -|-+|..|-|+.-      -+.+++..+|+=|+.+-...=|+
T Consensus       375 ~H~~~~~V~~l~FcP~EDvLGIGH~~G~tsilVPGsGePN~Ds~e  419 (545)
T KOG1272|consen  375 NHRCGGPVEDLRFCPYEDVLGIGHAGGITSILVPGSGEPNYDSLE  419 (545)
T ss_pred             hhccCcccccceeccHHHeeeccccCCceeEeccCCCCCCcchhc
Confidence               1239999999621      12345555666666554444443


No 241
>KOG1645 consensus RING-finger-containing E3 ubiquitin ligase [Posttranslational modification, protein turnover, chaperones]
Probab=90.82  E-value=2.6  Score=50.08  Aligned_cols=153  Identities=14%  Similarity=0.196  Sum_probs=106.2

Q ss_pred             hhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceE
Q 001070          181 LLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCT  260 (1165)
Q Consensus       181 llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~  260 (1165)
                      +|-|-. |++.|..+-.+.+ +-|-.|.-+.+++|  +|+..+   |++.+|++++|||.|+.+.            .|+
T Consensus       169 ~lpGvG-v~~l~~~~fkssq-~lp~~g~~Irdlaf--Sp~~~G---Ll~~asl~nkiki~dlet~------------~~v  229 (463)
T KOG1645|consen  169 LLPGVG-VQKLESHDFKSSQ-ILPGEGSFIRDLAF--SPFNEG---LLGLASLGNKIKIMDLETS------------CVV  229 (463)
T ss_pred             cCCccc-eEEeccCCcchhh-cccccchhhhhhcc--Cccccc---eeeeeccCceEEEEecccc------------eee
Confidence            888877 9999887766666 44555889999999  576666   8889999999999999554            888


Q ss_pred             EEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCccccccccccccccccceeeeeeccC-C-C
Q 001070          261 QTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFTGTID-P-P  338 (1165)
Q Consensus       261 QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft~~~d-~-~  338 (1165)
                      +++..        + +-..+++.+.+..-.+-|--.+-.||+.-+....++-   +...++- -..||.++.-... + -
T Consensus       230 ssy~a--------~-~~~wSC~wDlde~h~IYaGl~nG~VlvyD~R~~~~~~---~e~~a~~-t~~pv~~i~~~~~n~~f  296 (463)
T KOG1645|consen  230 SSYIA--------Y-NQIWSCCWDLDERHVIYAGLQNGMVLVYDMRQPEGPL---MELVANV-TINPVHKIAPVQPNKIF  296 (463)
T ss_pred             eheec--------c-CCceeeeeccCCcceeEEeccCceEEEEEccCCCchH---hhhhhhh-ccCcceeecccCccccc
Confidence            88884        3 4455889999988888888889999998888755532   1111211 1356655433221 1 0


Q ss_pred             CcceEEEEEeehhhhhhhccccc-cccCCC
Q 001070          339 SEHIIKLYCVQTQAIQQYSLNLF-QCLPPP  367 (1165)
Q Consensus       339 ge~~vq~yCvQtqAIQqy~l~~~-~c~pp~  367 (1165)
                      -.+.  +-.-+--++|+|-+.++ .|.|+.
T Consensus       297 ~~gg--lLv~~lt~l~f~ei~~s~~~~p~v  324 (463)
T KOG1645|consen  297 TSGG--LLVFALTVLQFYEIVFSAECLPCV  324 (463)
T ss_pred             cccc--eEEeeehhhhhhhhhccccCCCcc
Confidence            1111  12336678999999998 666654


No 242
>PRK04792 tolB translocation protein TolB; Provisional
Probab=90.74  E-value=2.7  Score=50.24  Aligned_cols=93  Identities=16%  Similarity=0.189  Sum_probs=52.6

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCc--eEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNR--EVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnr--tIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      |++||..+|.+ ..+....| ...+.+|  +|||..   |+.+.+.+.  .|.+|+++++            .. ..|..
T Consensus       244 L~~~dl~tg~~-~~lt~~~g-~~~~~~w--SPDG~~---La~~~~~~g~~~Iy~~dl~tg------------~~-~~lt~  303 (448)
T PRK04792        244 IFVQDIYTQVR-EKVTSFPG-INGAPRF--SPDGKK---LALVLSKDGQPEIYVVDIATK------------AL-TRITR  303 (448)
T ss_pred             EEEEECCCCCe-EEecCCCC-CcCCeeE--CCCCCE---EEEEEeCCCCeEEEEEECCCC------------Ce-EECcc
Confidence            88888887764 22322223 3457888  566543   443333333  5666676443            21 22221


Q ss_pred             cCCCCCccccccEEEEEeecCCcEEEEeccC--CCcEEEEEeecC
Q 001070          266 KSSAKPRVEEAFFNQVVVLSQAGLLLFANAK--KNAIYSVHLGYG  308 (1165)
Q Consensus       266 ~~s~~~~~~~aff~sV~~~p~a~~ilLan~~--r~aIYalhl~~g  308 (1165)
                              +.........+|++++|+.+..+  +..||.+.++-+
T Consensus       304 --------~~~~~~~p~wSpDG~~I~f~s~~~g~~~Iy~~dl~~g  340 (448)
T PRK04792        304 --------HRAIDTEPSWHPDGKSLIFTSERGGKPQIYRVNLASG  340 (448)
T ss_pred             --------CCCCccceEECCCCCEEEEEECCCCCceEEEEECCCC
Confidence                    12233456789999988765433  467998887643


No 243
>KOG4497 consensus Uncharacterized conserved protein WDR8, contains WD repeats [General function prediction only]
Probab=90.59  E-value=1.3  Score=51.47  Aligned_cols=92  Identities=13%  Similarity=0.277  Sum_probs=62.7

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCC-ceeEEecCCCC
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKV-APLIILKPHGG  207 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g-~pl~~lephdG  207 (1165)
                      .++.||+|||...+- ++-|=|..| .+.+||.--.+                      |.+|+..-- ---.+-|+.+ 
T Consensus        15 ~fSp~g~yiAs~~~y-rlviRd~~tlq~~qlf~cldki~yieW~ads~~ilC~~yk~~~vqvwsl~Qpew~ckIdeg~a-   92 (447)
T KOG4497|consen   15 SFSPCGNYIASLSRY-RLVIRDSETLQLHQLFLCLDKIVYIEWKADSCHILCVAYKDPKVQVWSLVQPEWYCKIDEGQA-   92 (447)
T ss_pred             eECCCCCeeeeeeee-EEEEeccchhhHHHHHHHHHHhhheeeeccceeeeeeeeccceEEEEEeecceeEEEeccCCC-
Confidence            367799999976654 666677777 66666644333                      778886532 1233444444 


Q ss_pred             CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCC
Q 001070          208 QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLP  251 (1165)
Q Consensus       208 ~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~  251 (1165)
                       ...+..|  +|+|   +++++..+.+-.|-+|.+-+..|.++|
T Consensus        93 -gls~~~W--SPdg---rhiL~tseF~lriTVWSL~t~~~~~~~  130 (447)
T KOG4497|consen   93 -GLSSISW--SPDG---RHILLTSEFDLRITVWSLNTQKGYLLP  130 (447)
T ss_pred             -cceeeeE--CCCc---ceEeeeecceeEEEEEEeccceeEEec
Confidence             4788889  4554   557778999999999999888766554


No 244
>KOG2236 consensus Uncharacterized conserved protein [Function unknown]
Probab=90.41  E-value=0.58  Score=55.92  Aligned_cols=44  Identities=20%  Similarity=0.230  Sum_probs=20.2

Q ss_pred             cccccccccCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
Q 001070           15 KQFDMRNWFPPYPPPSSSAAGDNFFPYPPPPPPPPPEPHANMHPHPY   61 (1165)
Q Consensus        15 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ppp~p~p~~~~~~~~~~~   61 (1165)
                      +.|-=..|+.|+-+-.++.+  |+|+.- +|+|+++.|+++|.-+..
T Consensus       404 p~~~~~s~p~pq~qNyppp~--p~f~m~-~~hP~~~~p~~~~g~~~P  447 (483)
T KOG2236|consen  404 PSSSDNSGPSPQQQNYPPPS--PSFPMF-QPHPPESNPPANFGQANP  447 (483)
T ss_pred             ccccCCCCCCcccCCCCCCC--CCCCcc-CCCCCCCCCcccccccCc
Confidence            34444566666433333333  344443 334444555555555533


No 245
>PLN02919 haloacid dehalogenase-like hydrolase family protein
Probab=90.16  E-value=3.5  Score=54.78  Aligned_cols=137  Identities=9%  Similarity=0.074  Sum_probs=80.2

Q ss_pred             Eeeec---CceEEEeecCCcEEEEeCcchhhHhhc--CCc------------------------c-----------EEEe
Q 001070          152 QIAVN---KHYVCYGLKGGNVRVLNLNTATRSLLR--GHT------------------------K-----------IKIW  191 (1165)
Q Consensus       152 ~IAVn---~~yIayG~kdg~IRVwdi~t~ir~llr--GH~------------------------q-----------VriW  191 (1165)
                      .||||   |...+.-..++.|+|||....+-..+-  |..                        .           ||++
T Consensus       572 gvavd~~~g~lyVaDs~n~rI~v~d~~G~~i~~ig~~g~~G~~dG~~~~a~f~~P~GIavd~~gn~LYVaDt~n~~Ir~i  651 (1057)
T PLN02919        572 KLAIDLLNNRLFISDSNHNRIVVTDLDGNFIVQIGSTGEEGLRDGSFEDATFNRPQGLAYNAKKNLLYVADTENHALREI  651 (1057)
T ss_pred             eEEEECCCCeEEEEECCCCeEEEEeCCCCEEEEEccCCCcCCCCCchhccccCCCcEEEEeCCCCEEEEEeCCCceEEEE
Confidence            47884   556666788999999998873322111  110                        0           6666


Q ss_pred             ecCCCceeEEecCC-------C-C--------CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCC
Q 001070          192 EDSKVAPLIILKPH-------G-G--------QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAE  255 (1165)
Q Consensus       192 D~~~g~pl~~leph-------d-G--------~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~  255 (1165)
                      |..++. +.++.+-       + |        ...+.|+|  .|++.  . +.++...|+.|++|+...+.         
T Consensus       652 d~~~~~-V~tlag~G~~g~~~~gg~~~~~~~ln~P~gVa~--dp~~g--~-LyVad~~~~~I~v~d~~~g~---------  716 (1057)
T PLN02919        652 DFVNET-VRTLAGNGTKGSDYQGGKKGTSQVLNSPWDVCF--EPVNE--K-VYIAMAGQHQIWEYNISDGV---------  716 (1057)
T ss_pred             ecCCCE-EEEEeccCcccCCCCCChhhhHhhcCCCeEEEE--ecCCC--e-EEEEECCCCeEEEEECCCCe---------
Confidence            665554 4444321       0 1        13456777  34332  3 55568889999999975431         


Q ss_pred             CcceEEEEeccCCC---CC-cc---ccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          256 SWKCTQTLDLKSSA---KP-RV---EEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       256 ~w~C~QTLe~~~s~---~~-~~---~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                         + .++-+....   .. .+   .-..-+.++++|++++|++||...+.|+++-+.-
T Consensus       717 ---v-~~~~G~G~~~~~~g~~~~~~~~~~P~GIavspdG~~LYVADs~n~~Irv~D~~t  771 (1057)
T PLN02919        717 ---T-RVFSGDGYERNLNGSSGTSTSFAQPSGISLSPDLKELYIADSESSSIRALDLKT  771 (1057)
T ss_pred             ---E-EEEecCCccccCCCCccccccccCccEEEEeCCCCEEEEEECCCCeEEEEECCC
Confidence               1 112111000   00 00   0112346889999999999999999999987653


No 246
>KOG3881 consensus Uncharacterized conserved protein [Function unknown]
Probab=89.93  E-value=0.58  Score=54.90  Aligned_cols=95  Identities=17%  Similarity=0.164  Sum_probs=63.7

Q ss_pred             cccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhHhh----c------------CCc--------cEEEeecC
Q 001070          139 TKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRSLL----R------------GHT--------KIKIWEDS  194 (1165)
Q Consensus       139 t~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~ll----r------------GH~--------qVriWD~~  194 (1165)
                      .++-++..|..|--    -.-+|++.+-+++|+||+...-|=.+    .            ||.        ++..+|.+
T Consensus       202 PvW~tdi~Fl~g~~----~~~fat~T~~hqvR~YDt~~qRRPV~~fd~~E~~is~~~l~p~gn~Iy~gn~~g~l~~FD~r  277 (412)
T KOG3881|consen  202 PVWITDIRFLEGSP----NYKFATITRYHQVRLYDTRHQRRPVAQFDFLENPISSTGLTPSGNFIYTGNTKGQLAKFDLR  277 (412)
T ss_pred             eeeeccceecCCCC----CceEEEEecceeEEEecCcccCcceeEeccccCcceeeeecCCCcEEEEecccchhheeccc
Confidence            44555666665510    13345899999999999986333211    1            111        17788998


Q ss_pred             CCceeEE-ecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          195 KVAPLII-LKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       195 ~g~pl~~-lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      ++..+.. |.+-.| ++.|+.-.     +.|+ +++++.+||-|+|+|+.+
T Consensus       278 ~~kl~g~~~kg~tG-sirsih~h-----p~~~-~las~GLDRyvRIhD~kt  321 (412)
T KOG3881|consen  278 GGKLLGCGLKGITG-SIRSIHCH-----PTHP-VLASCGLDRYVRIHDIKT  321 (412)
T ss_pred             CceeeccccCCccC-CcceEEEc-----CCCc-eEEeeccceeEEEeeccc
Confidence            8876555 776666 88888873     5556 456888999999999866


No 247
>PRK01029 tolB translocation protein TolB; Provisional
Probab=89.63  E-value=3.7  Score=48.99  Aligned_cols=78  Identities=12%  Similarity=0.124  Sum_probs=42.3

Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCc
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAG  288 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~  288 (1165)
                      .+.+.+|  +|||..   |+.....+...+||......        . ......|.+        +...+.....+||++
T Consensus       282 ~~~~p~w--SPDG~~---Laf~s~~~g~~~ly~~~~~~--------~-g~~~~~lt~--------~~~~~~~p~wSPDG~  339 (428)
T PRK01029        282 TQGNPSF--SPDGTR---LVFVSNKDGRPRIYIMQIDP--------E-GQSPRLLTK--------KYRNSSCPAWSPDGK  339 (428)
T ss_pred             CcCCeEE--CCCCCE---EEEEECCCCCceEEEEECcc--------c-ccceEEecc--------CCCCccceeECCCCC
Confidence            4567888  566543   55434445556677653321        0 012333432        112233567899999


Q ss_pred             EEEEeccC--CCcEEEEEeecC
Q 001070          289 LLLFANAK--KNAIYSVHLGYG  308 (1165)
Q Consensus       289 ~ilLan~~--r~aIYalhl~~g  308 (1165)
                      +|+.....  ...||.+.++-|
T Consensus       340 ~Laf~~~~~g~~~I~v~dl~~g  361 (428)
T PRK01029        340 KIAFCSVIKGVRQICVYDLATG  361 (428)
T ss_pred             EEEEEEcCCCCcEEEEEECCCC
Confidence            88876543  346888776543


No 248
>KOG1963 consensus WD40 repeat protein [General function prediction only]
Probab=89.51  E-value=2.6  Score=53.61  Aligned_cols=164  Identities=21%  Similarity=0.259  Sum_probs=92.5

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeec
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAG  231 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsG  231 (1165)
                      +..|++|||.|.-||+|+||.=-..              ++.+ .+-+--|  | -..|.+++|  +++|..   |++ |
T Consensus       213 ~spn~~~~Aa~d~dGrI~vw~d~~~--------------~~~~~t~t~lHW--H-~~~V~~L~f--S~~G~~---LlS-G  269 (792)
T KOG1963|consen  213 LSPNERYLAAGDSDGRILVWRDFGS--------------SDDSETCTLLHW--H-HDEVNSLSF--SSDGAY---LLS-G  269 (792)
T ss_pred             eccccceEEEeccCCcEEEEecccc--------------ccccccceEEEe--c-ccccceeEE--ecCCce---Eee-c
Confidence            4457999999999999999953221              1221 1223334  3 249999999  466654   885 6


Q ss_pred             CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCc
Q 001070          232 PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNS  311 (1165)
Q Consensus       232 slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~  311 (1165)
                      ..-.-+.+|.+++++.-+||--                     .+-++.++++||+.+..|.... |.|..||.   ++-
T Consensus       270 G~E~VLv~Wq~~T~~kqfLPRL---------------------gs~I~~i~vS~ds~~~sl~~~D-NqI~li~~---~dl  324 (792)
T KOG1963|consen  270 GREGVLVLWQLETGKKQFLPRL---------------------GSPILHIVVSPDSDLYSLVLED-NQIHLIKA---SDL  324 (792)
T ss_pred             ccceEEEEEeecCCCccccccc---------------------CCeeEEEEEcCCCCeEEEEecC-ceEEEEec---cch
Confidence            6888999999988855444411                     2456677788888876665553 44444443   332


Q ss_pred             c----ccccccccccccccceeeeeecc-CC-------CCc-ceEEEEEeehhhhhhhccccccccC
Q 001070          312 A----ATRIDYIAEFTVTMPVLSFTGTI-DP-------PSE-HIIKLYCVQTQAIQQYSLNLFQCLP  365 (1165)
Q Consensus       312 ~----~~r~dyiaeF~v~~PILSft~~~-d~-------~ge-~~vq~yCvQtqAIQqy~l~~~~c~p  365 (1165)
                      +    ...+.|.+.=+=++|.=-+++.. |+       .|. +-||.|-.+|..- -|.++.++=-.
T Consensus       325 ~~k~tIsgi~~~~~~~k~~~~~l~t~~~idpr~~~~vln~~~g~vQ~ydl~td~~-i~~~~v~~~n~  390 (792)
T KOG1963|consen  325 EIKSTISGIKPPTPSTKTRPQSLTTGVSIDPRTNSLVLNGHPGHVQFYDLYTDST-IYKLQVCDENY  390 (792)
T ss_pred             hhhhhccCccCCCccccccccccceeEEEcCCCCceeecCCCceEEEEeccccce-eeeEEEEeecc
Confidence            1    12222221111112221112211 22       233 5688888888753 36666554433


No 249
>KOG1923 consensus Rac1 GTPase effector FRL [Signal transduction mechanisms; Cytoskeleton]
Probab=89.39  E-value=1.3  Score=55.89  Aligned_cols=8  Identities=13%  Similarity=0.015  Sum_probs=3.0

Q ss_pred             CCCCCCCC
Q 001070           56 MHPHPYPH   63 (1165)
Q Consensus        56 ~~~~~~~~   63 (1165)
                      +++-|.++
T Consensus       313 ~ppv~~ln  320 (830)
T KOG1923|consen  313 FPPVGPLN  320 (830)
T ss_pred             CCCCCCCC
Confidence            33333333


No 250
>KOG4190 consensus Uncharacterized conserved protein [Function unknown]
Probab=89.19  E-value=0.84  Score=55.32  Aligned_cols=117  Identities=23%  Similarity=0.360  Sum_probs=66.8

Q ss_pred             cCceEEEeecCCcEEEEeCcc--------hhhHhhcCCcc--------------------EEEeecCCCceeE--EecCC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT--------ATRSLLRGHTK--------------------IKIWEDSKVAPLI--ILKPH  205 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t--------~ir~llrGH~q--------------------VriWD~~~g~pl~--~leph  205 (1165)
                      |.+-..+.++|+++++|.|..        +...+...|+.                    |.+||---|.||.  .|.|.
T Consensus       746 NENSFiSASkDKTVKLWSik~EgD~~~tsaCQfTY~aHkk~i~~igfL~~lr~i~ScD~giHlWDPFigr~Laq~~dapk  825 (1034)
T KOG4190|consen  746 NENSFISASKDKTVKLWSIKPEGDEIGTSACQFTYQAHKKPIHDIGFLADLRSIASCDGGIHLWDPFIGRLLAQMEDAPK  825 (1034)
T ss_pred             cccceeeccCCceEEEEEeccccCccccceeeeEhhhccCcccceeeeeccceeeeccCcceeecccccchhHhhhcCcc
Confidence            455566799999999999984        23346777877                    4455544444433  22232


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                      .| ++.-|--+  |+ -+..+++++.+...|+||+|.-..          .|.|    ||+....+ +-.+..--+++.+
T Consensus       826 ~~-a~~~ikcl--~n-v~~~iliAgcsaeSTVKl~DaRsc----------e~~~----E~kVcna~-~Pna~~R~iaVa~  886 (1034)
T KOG4190|consen  826 EG-AGGNIKCL--EN-VDRHILIAGCSAESTVKLFDARSC----------EWTC----ELKVCNAP-GPNALTRAIAVAD  886 (1034)
T ss_pred             cC-CCceeEec--cc-Ccchheeeeccchhhheeeecccc----------ccee----eEEeccCC-CCchheeEEEecc
Confidence            22 22223222  11 122225665599999999996333          4566    34333111 2345666667778


Q ss_pred             CCcEEE
Q 001070          286 QAGLLL  291 (1165)
Q Consensus       286 ~a~~il  291 (1165)
                      .|+|+-
T Consensus       887 ~GN~lA  892 (1034)
T KOG4190|consen  887 KGNKLA  892 (1034)
T ss_pred             Ccchhh
Confidence            777753


No 251
>KOG0994 consensus Extracellular matrix glycoprotein Laminin subunit beta [Extracellular structures]
Probab=89.10  E-value=99  Score=41.70  Aligned_cols=33  Identities=9%  Similarity=0.218  Sum_probs=26.2

Q ss_pred             EEEEeecCCcEEEEecc---CCCcEEEEEeecCCCc
Q 001070          279 NQVVVLSQAGLLLFANA---KKNAIYSVHLGYGNNS  311 (1165)
Q Consensus       279 ~sV~~~p~a~~ilLan~---~r~aIYalhl~~g~~~  311 (1165)
                      ..+.+.|.++||++-|+   ..-..|-|||.+..++
T Consensus       656 ~~~sl~p~sRyvv~~~~vClE~G~~Yklri~~~~~~  691 (1758)
T KOG0994|consen  656 IPFSLPPGSRYVVAPNPVCLEAGKVYKLRIYFERKS  691 (1758)
T ss_pred             cccccCCCceeeecCCchhhccCcceEEEEEecccc
Confidence            36778899999999875   5677899999986653


No 252
>KOG2675 consensus Adenylate cyclase-associated protein (CAP/Srv2p) [Cytoskeleton; Signal transduction mechanisms]
Probab=88.92  E-value=0.39  Score=56.94  Aligned_cols=28  Identities=29%  Similarity=0.437  Sum_probs=14.3

Q ss_pred             CceEEEeecCCCceEEEeEccCcCCCCCCC
Q 001070          223 GHIILVTAGPLNREVKLWASASEEGWSLPT  252 (1165)
Q Consensus       223 d~~~lvtsGslnrtIKLW~~a~~~~~~~~~  252 (1165)
                      .|+ .+.=-+||.+|.= ...++-+.++|.
T Consensus       421 c~i-YLSk~sL~~eIvt-sKSsemNi~vp~  448 (480)
T KOG2675|consen  421 CHI-YLSKDSLDCEIVT-SKSSEMNINVPT  448 (480)
T ss_pred             eeE-EeccccccceEEe-ecccceeEeccc
Confidence            344 3445677777762 223333555553


No 253
>PF08450 SGL:  SMP-30/Gluconolaconase/LRE-like region;  InterPro: IPR013658 This family describes a region that is found in proteins expressed by a variety of eukaryotic and prokaryotic species. These proteins include various enzymes, such as senescence marker protein 30 (SMP-30, Q15493 from SWISSPROT), gluconolactonase (Q01578 from SWISSPROT) and luciferin-regenerating enzyme (LRE, Q86DU5 from SWISSPROT). SMP-30 is known to hydrolyse diisopropyl phosphorofluoridate in the liver, and has been noted as having sequence similarity, in the region described in this family, with PON1 (P52430 from SWISSPROT) and LRE. ; PDB: 2GHS_A 2DG0_L 2DG1_D 2DSO_D 3E5Z_A 2IAT_A 2IAV_A 2GVV_A 3HLI_A 2GVU_A ....
Probab=88.72  E-value=7.1  Score=42.21  Aligned_cols=97  Identities=16%  Similarity=0.108  Sum_probs=59.6

Q ss_pred             EEEeecCCCc--eeEEec-C-CCCCCcceeEeecCCCCCCceEEEeecCCC--ce---EEEeEccCcCCCCCCCCCCCcc
Q 001070          188 IKIWEDSKVA--PLIILK-P-HGGQPVNSAQYLTAPNQAGHIILVTAGPLN--RE---VKLWASASEEGWSLPTHAESWK  258 (1165)
Q Consensus       188 VriWD~~~g~--pl~~le-p-hdG~sV~SVaFl~aP~~~d~~~lvtsGsln--rt---IKLW~~a~~~~~~~~~~~~~w~  258 (1165)
                      ++++|..+|.  .+.... . +.....+.++|  .|+|   .+.+|.....  ..   =+||.++..           ++
T Consensus        62 ~~~~d~~~g~~~~~~~~~~~~~~~~~~ND~~v--d~~G---~ly~t~~~~~~~~~~~~g~v~~~~~~-----------~~  125 (246)
T PF08450_consen   62 IAVVDPDTGKVTVLADLPDGGVPFNRPNDVAV--DPDG---NLYVTDSGGGGASGIDPGSVYRIDPD-----------GK  125 (246)
T ss_dssp             EEEEETTTTEEEEEEEEETTCSCTEEEEEEEE---TTS----EEEEEECCBCTTCGGSEEEEEEETT-----------SE
T ss_pred             eEEEecCCCcEEEEeeccCCCcccCCCceEEE--cCCC---CEEEEecCCCccccccccceEEECCC-----------Ce
Confidence            7777877774  233331 1 12247888888  4444   4455422111  11   245555433           24


Q ss_pred             eEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCC
Q 001070          259 CTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       259 C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      +...++         .-.+-|-++++|++++|+++|..++.||.+.+....
T Consensus       126 ~~~~~~---------~~~~pNGi~~s~dg~~lyv~ds~~~~i~~~~~~~~~  167 (246)
T PF08450_consen  126 VTVVAD---------GLGFPNGIAFSPDGKTLYVADSFNGRIWRFDLDADG  167 (246)
T ss_dssp             EEEEEE---------EESSEEEEEEETTSSEEEEEETTTTEEEEEEEETTT
T ss_pred             EEEEec---------CcccccceEECCcchheeecccccceeEEEeccccc
Confidence            544444         235678999999999999999999999999998543


No 254
>smart00320 WD40 WD40 repeats. Note that these repeats are permuted with respect to the structural repeats (blades) of the beta propeller domain.
Probab=88.25  E-value=1  Score=31.30  Aligned_cols=39  Identities=28%  Similarity=0.491  Sum_probs=28.1

Q ss_pred             CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeE
Q 001070          196 VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWA  241 (1165)
Q Consensus       196 g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~  241 (1165)
                      +.++..+..|. ..|+++.|  .+++   . ++.+|+.|++|++|+
T Consensus         2 ~~~~~~~~~~~-~~i~~~~~--~~~~---~-~~~~~~~d~~~~~~~   40 (40)
T smart00320        2 GELLKTLKGHT-GPVTSVAF--SPDG---K-YLASASDDGTIKLWD   40 (40)
T ss_pred             cEEEEEEEecC-CceeEEEE--CCCC---C-EEEEecCCCeEEEcC
Confidence            34577787775 48999999  3443   3 344678899999996


No 255
>PF15492 Nbas_N:  Neuroblastoma-amplified sequence, N terminal
Probab=87.88  E-value=4.5  Score=46.20  Aligned_cols=41  Identities=17%  Similarity=0.150  Sum_probs=32.6

Q ss_pred             cccccEeee--cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc
Q 001070          147 LLIGRQIAV--NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK  187 (1165)
Q Consensus       147 ~~~GR~IAV--n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q  187 (1165)
                      ++..|+++=  |+..|||.-..|+|||+|+.. .+..+-.+|+.
T Consensus        43 ~PQWRkl~WSpD~tlLa~a~S~G~i~vfdl~g~~lf~I~p~~~~   86 (282)
T PF15492_consen   43 NPQWRKLAWSPDCTLLAYAESTGTIRVFDLMGSELFVIPPAMSF   86 (282)
T ss_pred             CchheEEEECCCCcEEEEEcCCCeEEEEecccceeEEcCccccc
Confidence            677888765  899999999999999999996 55555555544


No 256
>KOG1354 consensus Serine/threonine protein phosphatase 2A, regulatory subunit [Signal transduction mechanisms]
Probab=87.77  E-value=2  Score=50.23  Aligned_cols=140  Identities=19%  Similarity=0.272  Sum_probs=85.7

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeec-CCCce----eEEecCCCCCCcceeEeecCCCCCCceEEEee
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWED-SKVAP----LIILKPHGGQPVNSAQYLTAPNQAGHIILVTA  230 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~-~~g~p----l~~lephdG~sV~SVaFl~aP~~~d~~~lvts  230 (1165)
                      .|.|||||-++|.+-++-......     |+ -++.-. ++..|    |..++-.  +.|+-+.|+  +++..-.||++ 
T Consensus        36 ~Ge~LatGdkgGRVv~f~r~~~~~-----~e-y~~~t~fqshepEFDYLkSleie--EKinkIrw~--~~~n~a~FLls-  104 (433)
T KOG1354|consen   36 YGERLATGDKGGRVVLFEREKLYK-----GE-YNFQTEFQSHEPEFDYLKSLEIE--EKINKIRWL--DDGNLAEFLLS-  104 (433)
T ss_pred             ccceEeecCCCCeEEEeecccccc-----cc-eeeeeeeeccCcccchhhhhhhh--hhhhhceec--CCCCccEEEEe-
Confidence            499999999999999987765332     21 222210 01111    2223221  477888886  33333456763 


Q ss_pred             cCCCceEEEeEccCc----CCCCCCCCCCCcceEEEEeccCC--------C-----CCccccccEEEEEeecCCcEEEEe
Q 001070          231 GPLNREVKLWASASE----EGWSLPTHAESWKCTQTLDLKSS--------A-----KPRVEEAFFNQVVVLSQAGLLLFA  293 (1165)
Q Consensus       231 GslnrtIKLW~~a~~----~~~~~~~~~~~w~C~QTLe~~~s--------~-----~~~~~~aff~sV~~~p~a~~ilLa  293 (1165)
                      + +|||||||-....    +||.+|.... ..-+.+|..+..        +     -.++|.=.+|++.+..|...+|=|
T Consensus       105 t-NdktiKlWKi~er~~k~~~~~~~~~~~-~~~~~~lr~p~~~~~~~~vea~prRv~aNaHtyhiNSIS~NsD~Et~lSA  182 (433)
T KOG1354|consen  105 T-NDKTIKLWKIRERGSKKEGYNLPEEGP-PGTITSLRLPVEGRHDLEVEASPRRVYANAHTYHINSISVNSDKETFLSA  182 (433)
T ss_pred             c-CCcceeeeeeeccccccccccccccCC-CCccceeeceeeccccceeeeeeeeeccccceeEeeeeeecCccceEeec
Confidence            3 8999999998543    3444442221 112233333221        0     124788889999999999999999


Q ss_pred             ccCCCcEEEEEeecC
Q 001070          294 NAKKNAIYSVHLGYG  308 (1165)
Q Consensus       294 n~~r~aIYalhl~~g  308 (1165)
                      |.-|=.++-+.+.-+
T Consensus       183 DdLRINLWnlei~d~  197 (433)
T KOG1354|consen  183 DDLRINLWNLEIIDQ  197 (433)
T ss_pred             cceeeeeccccccCC
Confidence            999988887777653


No 257
>KOG0280 consensus Uncharacterized conserved protein [Amino acid transport and metabolism]
Probab=87.64  E-value=1.2  Score=50.96  Aligned_cols=81  Identities=21%  Similarity=0.352  Sum_probs=52.7

Q ss_pred             CceEEEeecCCcEEEEeCcchhhHhhcCCcc------------------------EEEeecCCCceeE---EecCCCCCC
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRSLLRGHTK------------------------IKIWEDSKVAPLI---ILKPHGGQP  209 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~llrGH~q------------------------VriWD~~~g~pl~---~lephdG~s  209 (1165)
                      +.||+||+-|-.||+||..+--+-|+.+--+                        ++|-+..++. .+   +++-|.+  
T Consensus       223 ~~~I~TGsYDe~i~~~DtRnm~kPl~~~~v~GGVWRi~~~p~~~~~lL~~CMh~G~ki~~~~~~~-~e~~~~~~s~~~--  299 (339)
T KOG0280|consen  223 PTYIATGSYDECIRVLDTRNMGKPLFKAKVGGGVWRIKHHPEIFHRLLAACMHNGAKILDSSDKV-LEFQIVLPSDKI--  299 (339)
T ss_pred             CceEEEeccccceeeeehhcccCccccCccccceEEEEecchhhhHHHHHHHhcCceEEEecccc-cchheeeecccc--
Confidence            6799999999999999998766667766554                        5555555443 22   3333322  


Q ss_pred             cceeEeecCCCCCCc----eEEEeecCCCceEE-EeEccCc
Q 001070          210 VNSAQYLTAPNQAGH----IILVTAGPLNREVK-LWASASE  245 (1165)
Q Consensus       210 V~SVaFl~aP~~~d~----~~lvtsGslnrtIK-LW~~a~~  245 (1165)
                      -+|++|     |.||    -++.|.---||.|+ +|--.++
T Consensus       300 hdSl~Y-----G~DWd~~~~~lATCsFYDk~~~~~Wl~~t~  335 (339)
T KOG0280|consen  300 HDSLCY-----GGDWDSKDSFLATCSFYDKKIRQLWLHITG  335 (339)
T ss_pred             ccceee-----ccccccccceeeeeeccccceeeeeeeccC
Confidence            356666     6777    44555455777765 8876554


No 258
>KOG1240 consensus Protein kinase containing WD40 repeats [Signal transduction mechanisms]
Probab=87.49  E-value=1.6  Score=57.39  Aligned_cols=128  Identities=18%  Similarity=0.297  Sum_probs=73.0

Q ss_pred             ccccEeeec---CceEEEeecCCcEEEEeCcchh------hHhhcCC-cc-----------------------EEEeecC
Q 001070          148 LIGRQIAVN---KHYVCYGLKGGNVRVLNLNTAT------RSLLRGH-TK-----------------------IKIWEDS  194 (1165)
Q Consensus       148 ~~GR~IAVn---~~yIayG~kdg~IRVwdi~t~i------r~llrGH-~q-----------------------VriWD~~  194 (1165)
                      .+++ ||++   +.|.++|+.||+|||||...-+      |+-++=| +.                       |++.++.
T Consensus      1050 ~v~k-~a~s~~~~s~FvsgS~DGtVKvW~~~k~~~~~~s~rS~ltys~~~sr~~~vt~~~~~~~~Av~t~DG~v~~~~id 1128 (1431)
T KOG1240|consen 1050 AVIK-LAVSSEHTSLFVSGSDDGTVKVWNLRKLEGEGGSARSELTYSPEGSRVEKVTMCGNGDQFAVSTKDGSVRVLRID 1128 (1431)
T ss_pred             cccc-eeecCCCCceEEEecCCceEEEeeehhhhcCcceeeeeEEEeccCCceEEEEeccCCCeEEEEcCCCeEEEEEcc
Confidence            3453 5553   5899999999999999987522      2222222 11                       4444332


Q ss_pred             C-----CceeEEecCC---CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          195 K-----VAPLIILKPH---GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       195 ~-----g~pl~~leph---dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      -     -.+.+...|-   +|--|.--+| ++-.+. |  +|.-+-.++.|.+||.-..+        ..|    ++.+.
T Consensus      1129 ~~~~~~~~~~~~ri~n~~~~g~vv~m~a~-~~~~~S-~--~lvy~T~~~~iv~~D~r~~~--------~~w----~lk~~ 1192 (1431)
T KOG1240|consen 1129 HYNVSKRVATQVRIPNLKKDGVVVSMHAF-TAIVQS-H--VLVYATDLSRIVSWDTRMRH--------DAW----RLKNQ 1192 (1431)
T ss_pred             ccccccceeeeeecccccCCCceEEeecc-cccccc-e--eEEEEEeccceEEecchhhh--------hHH----hhhcC
Confidence            1     1122222222   2333333344 233333 2  34457799999999974442        123    33331


Q ss_pred             CCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          267 SSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       267 ~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      .      ....+-+++++|.+.|+++...+.-
T Consensus      1193 ~------~hG~vTSi~idp~~~WlviGts~G~ 1218 (1431)
T KOG1240|consen 1193 L------RHGLVTSIVIDPWCNWLVIGTSRGQ 1218 (1431)
T ss_pred             c------cccceeEEEecCCceEEEEecCCce
Confidence            1      2357789999999999999988754


No 259
>KOG1409 consensus Uncharacterized conserved protein, contains WD40 repeats and FYVE domains [Function unknown]
Probab=87.46  E-value=0.76  Score=53.41  Aligned_cols=30  Identities=20%  Similarity=0.310  Sum_probs=24.8

Q ss_pred             ceEEEeecCCcEEEEeCcc--hhhHhhcCCcc
Q 001070          158 HYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK  187 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t--~ir~llrGH~q  187 (1165)
                      ..|.+|++|..|-+|||--  -+-..+.||.+
T Consensus       210 ~~LfSg~~d~~vi~wdigg~~g~~~el~gh~~  241 (404)
T KOG1409|consen  210 RLLFSGASDHSVIMWDIGGRKGTAYELQGHND  241 (404)
T ss_pred             cEEEeccccCceEEEeccCCcceeeeeccchh
Confidence            4567899999999999985  56668888887


No 260
>KOG1830 consensus Wiskott Aldrich syndrome proteins [Cytoskeleton]
Probab=86.51  E-value=3.2  Score=49.44  Aligned_cols=6  Identities=67%  Similarity=0.911  Sum_probs=2.4

Q ss_pred             ccEeee
Q 001070          150 GRQIAV  155 (1165)
Q Consensus       150 GR~IAV  155 (1165)
                      -|.|||
T Consensus       494 sRRiav  499 (518)
T KOG1830|consen  494 SRRIAV  499 (518)
T ss_pred             HHHHHH
Confidence            344443


No 261
>KOG1912 consensus WD40 repeat protein [General function prediction only]
Probab=86.26  E-value=6.1  Score=50.22  Aligned_cols=209  Identities=13%  Similarity=0.181  Sum_probs=121.1

Q ss_pred             ceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeec--CceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----
Q 001070          115 YVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVN--KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----  187 (1165)
Q Consensus       115 ~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn--~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----  187 (1165)
                      ..|+=||+|.---.|+=.+.=.-||+--|-|.-+.-...+.-  -=.||.+-..|+|-|||... .++.-|.-|..    
T Consensus        35 slV~VVDs~s~q~iqsie~h~s~V~~VrWap~~~p~~llS~~~~~lliAsaD~~GrIil~d~~~~s~~~~l~~~~~~~qd  114 (1062)
T KOG1912|consen   35 SLVSVVDSRSLQLIQSIELHQSAVTSVRWAPAPSPRDLLSPSSSQLLIASADISGRIILVDFVLASVINWLSHSNDSVQD  114 (1062)
T ss_pred             ceEEEEehhhhhhhhccccCccceeEEEeccCCCchhccCccccceeEEeccccCcEEEEEehhhhhhhhhcCCCcchhh
Confidence            567788887764443112222456666676655444443321  23467788899999999998 66666666655    


Q ss_pred             ----------------------EEEeecCCCc----------eeE--EecCCCC---------CCcceeEeec--CCCCC
Q 001070          188 ----------------------IKIWEDSKVA----------PLI--ILKPHGG---------QPVNSAQYLT--APNQA  222 (1165)
Q Consensus       188 ----------------------VriWD~~~g~----------pl~--~lephdG---------~sV~SVaFl~--aP~~~  222 (1165)
                                            |-+|...+|.          +|.  ++.|+|-         .-|.++-|+.  -|+++
T Consensus       115 l~W~~~rd~Srd~LlaIh~ss~lvLwntdtG~k~Wk~~ys~~iLs~f~~DPfd~rh~~~l~s~g~vl~~~~l~~sep~~p  194 (1062)
T KOG1912|consen  115 LCWVPARDDSRDVLLAIHGSSTLVLWNTDTGEKFWKYDYSHEILSCFRVDPFDSRHFCVLGSKGFVLSCKDLGLSEPDVP  194 (1062)
T ss_pred             eeeeeccCcchheeEEecCCcEEEEEEccCCceeeccccCCcceeeeeeCCCCcceEEEEccCceEEEEeccCCCCCCCC
Confidence                                  7788877774          233  5566652         2566666654  37788


Q ss_pred             CceEEEeecCCC-ceEEEeEccCcC-------CCCCC------CCCCCcceEEEEeccCCCC-CccccccEEEEEeecCC
Q 001070          223 GHIILVTAGPLN-REVKLWASASEE-------GWSLP------THAESWKCTQTLDLKSSAK-PRVEEAFFNQVVVLSQA  287 (1165)
Q Consensus       223 d~~~lvtsGsln-rtIKLW~~a~~~-------~~~~~------~~~~~w~C~QTLe~~~s~~-~~~~~aff~sV~~~p~a  287 (1165)
                      ++.|-|++--.| ..++.-. +++.       ....+      +-...|+-+--+.|+..-- -+-+-.-.+.|+..+++
T Consensus       195 gk~~qI~sd~Sdl~~lere~-at~ns~ts~~~sa~fity~a~faf~p~~rn~lfi~~prellv~dle~~~~l~vvpier~  273 (1062)
T KOG1912|consen  195 GKEFQITSDHSDLAHLERET-ATGNSTTSTPASAYFITYCAQFAFSPHWRNILFITFPRELLVFDLEYECCLAVVPIERG  273 (1062)
T ss_pred             ceeEEEecCccchhhhhhhh-hccccccCCCcchhHHHHHHhhhcChhhhceEEEEeccceEEEcchhhceeEEEEeccC
Confidence            888888765222 1111100 1110       00000      0024577776666654320 00111234466677777


Q ss_pred             c---EEEEeccCCCcEEEEEeecCCCccccccccccccccc
Q 001070          288 G---LLLFANAKKNAIYSVHLGYGNNSAATRIDYIAEFTVT  325 (1165)
Q Consensus       288 ~---~ilLan~~r~aIYalhl~~g~~~~~~r~dyiaeF~v~  325 (1165)
                      +   +=++-+.+|-++||+|.. |.-.-..|-.|-.+|+..
T Consensus       274 ~akfv~vlP~~~rd~LfclH~n-G~ltirvrk~~~~~f~~~  313 (1062)
T KOG1912|consen  274 GAKFVDVLPDPRRDALFCLHSN-GRLTIRVRKEEPTEFKKP  313 (1062)
T ss_pred             CcceeEeccCCCcceEEEEecC-CeEEEEEeeccCcccccc
Confidence            4   446788999999999987 555445667788888765


No 262
>PRK15319 AIDA autotransporter-like protein ShdA; Provisional
Probab=86.12  E-value=1.3  Score=60.25  Aligned_cols=7  Identities=29%  Similarity=0.325  Sum_probs=3.1

Q ss_pred             eecCCcE
Q 001070          283 VLSQAGL  289 (1165)
Q Consensus       283 ~~p~a~~  289 (1165)
                      +-|++++
T Consensus      1912 LEPQAQL 1918 (2039)
T PRK15319       1912 LTPQAQV 1918 (2039)
T ss_pred             EEEEEEE
Confidence            3444443


No 263
>KOG2139 consensus WD40 repeat protein [General function prediction only]
Probab=85.58  E-value=7.9  Score=45.74  Aligned_cols=150  Identities=24%  Similarity=0.398  Sum_probs=88.2

Q ss_pred             EEEeecCCCc--eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC---cCCCCCCCCCCC---c-c
Q 001070          188 IKIWEDSKVA--PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS---EEGWSLPTHAES---W-K  258 (1165)
Q Consensus       188 VriWD~~~g~--pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~---~~~~~~~~~~~~---w-~  258 (1165)
                      |+|||+.+|.  ||..+ +.  -.+.=+-|  +||+   .+|. ++.-|+.-++|....   .|.|.+.++...   | .
T Consensus       220 i~iWdpdtg~~~pL~~~-gl--gg~slLkw--SPdg---d~lf-aAt~davfrlw~e~q~wt~erw~lgsgrvqtacWsp  290 (445)
T KOG2139|consen  220 IMIWDPDTGQKIPLIPK-GL--GGFSLLKW--SPDG---DVLF-AATCDAVFRLWQENQSWTKERWILGSGRVQTACWSP  290 (445)
T ss_pred             EEEEcCCCCCccccccc-CC--CceeeEEE--cCCC---CEEE-EecccceeeeehhcccceecceeccCCceeeeeecC
Confidence            9999998874  55533 22  24666777  4665   3355 477999999996543   456655544321   2 2


Q ss_pred             eEEEEeccCCCCCc----------------------------------------cccccEEEEEeecCCcEEEEeccCCC
Q 001070          259 CTQTLDLKSSAKPR----------------------------------------VEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       259 C~QTLe~~~s~~~~----------------------------------------~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      |-.+|-|..+.+++                                        ++++-  +++-||.|.++.+.=-..+
T Consensus       291 cGsfLLf~~sgsp~lysl~f~~~~~~~~~~~~~k~~lliaDL~e~ti~ag~~l~cgeaq--~lawDpsGeyLav~fKg~~  368 (445)
T KOG2139|consen  291 CGSFLLFACSGSPRLYSLTFDGEDSVFLRPQSIKRVLLIADLQEVTICAGQRLCCGEAQ--CLAWDPSGEYLAVIFKGQS  368 (445)
T ss_pred             CCCEEEEEEcCCceEEEEeecCCCccccCcccceeeeeeccchhhhhhcCcccccCccc--eeeECCCCCEEEEEEcCCc
Confidence            43444443322110                                        11121  4567788887777766666


Q ss_pred             --cEEEEEeecCCCccccccccccccccccceeeee--ecc--C-C--------CCcceEEEEEeehhhhhhhccccc
Q 001070          299 --AIYSVHLGYGNNSAATRIDYIAEFTVTMPVLSFT--GTI--D-P--------PSEHIIKLYCVQTQAIQQYSLNLF  361 (1165)
Q Consensus       299 --aIYalhl~~g~~~~~~r~dyiaeF~v~~PILSft--~~~--d-~--------~ge~~vq~yCvQtqAIQqy~l~~~  361 (1165)
                        .+|-.|+..        ||     +...|+.+|.  +..  + |        +-++-+-.-|-=|==||.|-|.+.
T Consensus       369 ~v~~~k~~i~~--------fd-----tr~sp~vels~cg~i~ge~P~~IsF~pl~n~g~lLsiaWsTGriq~ypl~f~  433 (445)
T KOG2139|consen  369 FVLLCKLHISR--------FD-----TRKSPPVELSYCGMIGGEYPAYISFGPLKNEGRLLSIAWSTGRIQRYPLTFQ  433 (445)
T ss_pred             hhhhhhhhhhh--------hc-----ccccCceEEEecccccCCCCceEEeeecccCCcEEEEEeccCceEeeeeEEE
Confidence              667666653        22     2345555554  211  1 1        356667777888888999988875


No 264
>PF02897 Peptidase_S9_N:  Prolyl oligopeptidase, N-terminal beta-propeller domain;  InterPro: IPR004106 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Proteolytic enzymes that exploit serine in their catalytic activity are ubiquitous, being found in viruses, bacteria and eukaryotes []. They include a wide range of peptidase activity, including exopeptidase, endopeptidase, oligopeptidase and omega-peptidase activity. Over 20 families (denoted S1 - S66) of serine protease have been identified, these being grouped into clans on the basis of structural similarity and other functional evidence []. Structures are known for members of the clans and the structures indicate that some appear to be totally unrelated, suggesting different evolutionary origins for the serine peptidases []. Not withstanding their different evolutionary origins, there are similarities in the reaction mechanisms of several peptidases. Chymotrypsin, subtilisin and carboxypeptidase C have a catalytic triad of serine, aspartate and histidine in common: serine acts as a nucleophile, aspartate as an electrophile, and histidine as a base []. The geometric orientations of the catalytic residues are similar between families, despite different protein folds []. The linear arrangements of the catalytic residues commonly reflect clan relationships. For example the catalytic triad in the chymotrypsin clan (PA) is ordered HDS, but is ordered DHS in the subtilisin clan (SB) and SDH in the carboxypeptidase clan (SC) [, ]. This entry represents the beta-propeller domain found at the N-terminal of prolyl oligopeptidase, including acylamino-acid-releasing enzyme (also known as acylaminoacyl peptidase), which belong to the MEROPS peptidase family S9 (clan SC), subfamily S9A. The prolyl oligopeptidase family consist of a number of evolutionary related peptidases whose catalytic activity seems to be provided by a charge relay system similar to that of the trypsin family of serine proteases, but which evolved by independent convergent evolution. The N-terminal domain of prolyl oligopeptidases form an unusual 7-bladed beta-propeller consisting of seven 4-stranded beta-sheet motifs.  Prolyl oligopeptidase is a large cytosolic enzyme involved in the maturation and degradation of peptide hormones and neuropeptides, which relate to the induction of amnesia. The enzyme contains a peptidase domain, where its catalytic triad (Ser554, His680, Asp641) is covered by the central tunnel of the N-terminal beta-propeller domain. In this way, large structured peptides are excluded from the active site, thereby protecting larger peptides and proteins from proteolysis in the cytosol []. The protein fold of the peptidase domain for members of this family resembles that of serine carboxypeptidase D, the type example of clan SC. Mammalian acylaminoacyl peptidase is an exopeptidase that is a member of the same prolyl oligopeptidase family of serine peptidases. This enzyme removes acylated amino acid residues from the N terminus of oligopeptides [].; GO: 0004252 serine-type endopeptidase activity, 0006508 proteolysis; PDB: 2BKL_B 3DDU_A 1YR2_A 2XE4_A 1VZ3_A 3EQ9_A 1O6F_A 3EQ7_A 4AN0_A 1UOP_A ....
Probab=85.48  E-value=5  Score=46.74  Aligned_cols=59  Identities=19%  Similarity=0.283  Sum_probs=37.4

Q ss_pred             CCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCcccccc-EEEEEeecCCcEEEEeccCCC---cEEEEEeecC
Q 001070          233 LNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAF-FNQVVVLSQAGLLLFANAKKN---AIYSVHLGYG  308 (1165)
Q Consensus       233 lnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~af-f~sV~~~p~a~~ilLan~~r~---aIYalhl~~g  308 (1165)
                      ..+.|++|.+.+..          -...  +-|...     ...| +..+..+.+++||++.-....   -||.+.+..+
T Consensus       200 ~~~~v~~~~~gt~~----------~~d~--lvfe~~-----~~~~~~~~~~~s~d~~~l~i~~~~~~~~s~v~~~d~~~~  262 (414)
T PF02897_consen  200 YPRQVYRHKLGTPQ----------SEDE--LVFEEP-----DEPFWFVSVSRSKDGRYLFISSSSGTSESEVYLLDLDDG  262 (414)
T ss_dssp             CCEEEEEEETTS-G----------GG-E--EEEC-T-----TCTTSEEEEEE-TTSSEEEEEEESSSSEEEEEEEECCCT
T ss_pred             CCcEEEEEECCCCh----------HhCe--eEEeec-----CCCcEEEEEEecCcccEEEEEEEccccCCeEEEEecccc
Confidence            46778888884431          1222  333221     2356 889999999999998655554   5899988875


No 265
>KOG1538 consensus Uncharacterized conserved protein WDR10, contains WD40 repeats [General function prediction only]
Probab=85.30  E-value=1.1  Score=55.38  Aligned_cols=101  Identities=19%  Similarity=0.238  Sum_probs=68.5

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEE------
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQ------  261 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~Q------  261 (1165)
                      +.|+|+..|..++.+++|. +-||+|||.     .|++ +.+||+.|+-+-||....+ |.|-=+.+..-.|.-      
T Consensus        35 lliyD~ndG~llqtLKgHK-DtVycVAys-----~dGk-rFASG~aDK~VI~W~~klE-G~LkYSH~D~IQCMsFNP~~h  106 (1081)
T KOG1538|consen   35 LLVYDTSDGTLLQPLKGHK-DTVYCVAYA-----KDGK-RFASGSADKSVIIWTSKLE-GILKYSHNDAIQCMSFNPITH  106 (1081)
T ss_pred             EEEEeCCCccccccccccc-ceEEEEEEc-----cCCc-eeccCCCceeEEEeccccc-ceeeeccCCeeeEeecCchHH
Confidence            7899999999999999984 699999994     5556 6889999999999997554 554445554444432      


Q ss_pred             EEeccC-------CCCC-----ccccccEEEEEeecCCcEEEEeccC
Q 001070          262 TLDLKS-------SAKP-----RVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       262 TLe~~~-------s~~~-----~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      .|--.+       |++-     ....+=++.++-+-||+++.|....
T Consensus       107 ~LasCsLsdFglWS~~qK~V~K~kss~R~~~CsWtnDGqylalG~~n  153 (1081)
T KOG1538|consen  107 QLASCSLSDFGLWSPEQKSVSKHKSSSRIICCSWTNDGQYLALGMFN  153 (1081)
T ss_pred             HhhhcchhhccccChhhhhHHhhhhheeEEEeeecCCCcEEEEeccC
Confidence            111000       0000     0122346677888999998887653


No 266
>KOG1963 consensus WD40 repeat protein [General function prediction only]
Probab=85.18  E-value=7.1  Score=49.91  Aligned_cols=88  Identities=15%  Similarity=0.315  Sum_probs=50.9

Q ss_pred             eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccE
Q 001070          199 LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFF  278 (1165)
Q Consensus       199 l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff  278 (1165)
                      -.+-.|| |+.+-..+|+..+. .+ + +| +++.|..+|||.+...+.- +| .+..|.|.--=-|        |+.-.
T Consensus       448 T~I~~PH-~~~~vat~~~~~~r-s~-~-~v-ta~~dg~~KiW~~~~~~n~-~k-~~s~W~c~~i~sy--------~k~~i  512 (792)
T KOG1963|consen  448 TKINNPH-GNAFVATIFLNPTR-SV-R-CV-TASVDGDFKIWVFTDDSNI-YK-KSSNWTCKAIGSY--------HKTPI  512 (792)
T ss_pred             EEEecCC-CceeEEEEEecCcc-cc-e-eE-EeccCCeEEEEEEeccccc-Cc-CccceEEeeeecc--------ccCcc
Confidence            4556677 67888888874333 33 2 55 4789999999999766542 11 2346999754433        22223


Q ss_pred             EEEEeecCCcEEEEeccCCCcEEEE
Q 001070          279 NQVVVLSQAGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       279 ~sV~~~p~a~~ilLan~~r~aIYal  303 (1165)
                      ...+..-||.+|-+  ...+.|-..
T Consensus       513 ~a~~fs~dGslla~--s~~~~Itiw  535 (792)
T KOG1963|consen  513 TALCFSQDGSLLAV--SFDDTITIW  535 (792)
T ss_pred             cchhhcCCCcEEEE--ecCCEEEEe
Confidence            33445666754443  344444333


No 267
>KOG0309 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=84.40  E-value=1.3  Score=55.62  Aligned_cols=34  Identities=18%  Similarity=0.278  Sum_probs=25.6

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc--hhhHhhcCCcc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK  187 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q  187 (1165)
                      =++|+..+|. ...+.|||||...  +.+..++||.-
T Consensus       167 nyk~p~vlas-shg~~i~vwd~r~gs~pl~s~K~~vs  202 (1081)
T KOG0309|consen  167 NYKDPNVLAS-SHGNDIFVWDLRKGSTPLCSLKGHVS  202 (1081)
T ss_pred             cccCcchhhh-ccCCceEEEeccCCCcceEEecccce
Confidence            3456666663 4567899999985  88888999887


No 268
>KOG2106 consensus Uncharacterized conserved protein, contains HELP and WD40 domains [Function unknown]
Probab=84.23  E-value=5.7  Score=48.43  Aligned_cols=48  Identities=15%  Similarity=0.306  Sum_probs=35.1

Q ss_pred             EEEeecCCCce---eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          188 IKIWEDSKVAP---LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       188 VriWD~~~g~p---l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      +.||+.++|..   ..+||.++-+-|.||+|+  +|| |   .| .|..|..|-||+-
T Consensus       224 ~~Fw~~~~~~l~k~~~~fek~ekk~Vl~v~F~--eng-d---vi-TgDS~G~i~Iw~~  274 (626)
T KOG2106|consen  224 LYFWTLRGGSLVKRQGIFEKREKKFVLCVTFL--ENG-D---VI-TGDSGGNILIWSK  274 (626)
T ss_pred             EEEEEccCCceEEEeeccccccceEEEEEEEc--CCC-C---EE-eecCCceEEEEeC
Confidence            66777777655   445666655689999995  333 3   55 4999999999996


No 269
>KOG1334 consensus WD40 repeat protein [General function prediction only]
Probab=83.60  E-value=1.6  Score=52.69  Aligned_cols=68  Identities=25%  Similarity=0.523  Sum_probs=48.7

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCc
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNR  235 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnr  235 (1165)
                      ..|+++|+-=|+|-|||.++ .+-.++.|--.          =|--||||             |+-|=   |.+|| +|+
T Consensus       406 sEyVvSGSDCGhIFiW~K~t~eii~~MegDr~----------VVNCLEpH-------------P~~Pv---LAsSG-id~  458 (559)
T KOG1334|consen  406 SEYVVSGSDCGHIFIWDKKTGEIIRFMEGDRH----------VVNCLEPH-------------PHLPV---LASSG-IDH  458 (559)
T ss_pred             cceEEecCccceEEEEecchhHHHHHhhcccc----------eEeccCCC-------------CCCch---hhccC-Ccc
Confidence            58999999999999999999 77667766332          15558888             33332   55554 999


Q ss_pred             eEEEeEccCcCCCCCC
Q 001070          236 EVKLWASASEEGWSLP  251 (1165)
Q Consensus       236 tIKLW~~a~~~~~~~~  251 (1165)
                      .||||-.-+.+..+.+
T Consensus       459 DVKIWTP~~~er~~~~  474 (559)
T KOG1334|consen  459 DVKIWTPLTAERATEP  474 (559)
T ss_pred             ceeeecCCccccccCh
Confidence            9999998555444333


No 270
>KOG1240 consensus Protein kinase containing WD40 repeats [Signal transduction mechanisms]
Probab=83.04  E-value=25  Score=47.13  Aligned_cols=201  Identities=17%  Similarity=0.227  Sum_probs=110.8

Q ss_pred             Cc-eEEEeecCCcEEEEeCcchhhH-hhcCCcc------------------------EEEeecCCCceeEEecCCCCCCc
Q 001070          157 KH-YVCYGLKGGNVRVLNLNTATRS-LLRGHTK------------------------IKIWEDSKVAPLIILKPHGGQPV  210 (1165)
Q Consensus       157 ~~-yIayG~kdg~IRVwdi~t~ir~-llrGH~q------------------------VriWD~~~g~pl~~lephdG~sV  210 (1165)
                      ++ -|+|+...+.|-.||+.+..+. .++.-.+                        +-+||.|=+.|+..|+-.+--++
T Consensus      1162 ~S~~lvy~T~~~~iv~~D~r~~~~~w~lk~~~~hG~vTSi~idp~~~WlviGts~G~l~lWDLRF~~~i~sw~~P~~~~i 1241 (1431)
T KOG1240|consen 1162 QSHVLVYATDLSRIVSWDTRMRHDAWRLKNQLRHGLVTSIVIDPWCNWLVIGTSRGQLVLWDLRFRVPILSWEHPARAPI 1241 (1431)
T ss_pred             cceeEEEEEeccceEEecchhhhhHHhhhcCccccceeEEEecCCceEEEEecCCceEEEEEeecCceeecccCcccCCc
Confidence            55 8999999999999999984443 3333222                        77999999999999984433477


Q ss_pred             ceeEeecCCCCCCceEEEeecC-CCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecC--C
Q 001070          211 NSAQYLTAPNQAGHIILVTAGP-LNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQ--A  287 (1165)
Q Consensus       211 ~SVaFl~aP~~~d~~~lvtsGs-lnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~--a  287 (1165)
                      ..|+-..-+.+..  ..|++|+ .+.+|-+|+..++            .|.++|--- ..++.-+.+.-..++-.|.  .
T Consensus      1242 ~~v~~~~~~~~~S--~~vs~~~~~~nevs~wn~~~g------------~~~~vl~~s-~~~p~ls~~~Ps~~~~kp~~~~ 1306 (1431)
T KOG1240|consen 1242 RHVWLCPTYPQES--VSVSAGSSSNNEVSTWNMETG------------LRQTVLWAS-DGAPILSYALPSNDARKPDSLA 1306 (1431)
T ss_pred             ceEEeeccCCCCc--eEEEecccCCCceeeeecccC------------cceEEEEcC-CCCcchhhhcccccCCCCCccc
Confidence            7776632222223  2466677 8999999998554            888888642 1111111111000000011  0


Q ss_pred             cEEEEeccCCCcEEEEEeecCCCcccccccc----ccccccccceeeeeeccCC------CCcceEEEEEeehhhhhhhc
Q 001070          288 GLLLFANAKKNAIYSVHLGYGNNSAATRIDY----IAEFTVTMPVLSFTGTIDP------PSEHIIKLYCVQTQAIQQYS  357 (1165)
Q Consensus       288 ~~ilLan~~r~aIYalhl~~g~~~~~~r~dy----iaeF~v~~PILSft~~~d~------~ge~~vq~yCvQtqAIQqy~  357 (1165)
                      +.+..-+-++.-    -+.-|.+-...++||    +.+|.+.-|=++++..++.      +|...++.|.     |-|-.
T Consensus      1307 ~~~~~~~~~~~~----~ltggsd~kIR~wD~~~p~~ss~~~~~~s~~~~~~~~s~~~~~i~~~~~i~e~i-----~~~~t 1377 (1431)
T KOG1240|consen 1307 GISCGVCEKNGF----LLTGGSDMKIRKWDPTRPEISSYAVPGPSTSYSTNSESYDLSTIPGSQFIDEFI-----IYQQT 1377 (1431)
T ss_pred             ceeeecccCCce----eeecCCccceeeccCCCcccccccccCccccccccchhccccccCCCccchhhh-----hhhhh
Confidence            111111111111    112233334444554    3457777777778777665      5666655432     22223


Q ss_pred             cccccccCCCCCCCCCCCCCCCccc
Q 001070          358 LNLFQCLPPPAESGGLERPDSSVSN  382 (1165)
Q Consensus       358 l~~~~c~pp~~~~~~~e~~~~~~s~  382 (1165)
                      ..+.+-+- +.++....+++++..|
T Consensus      1378 v~~t~~~~-~~~~~~~~~~~ps~~H 1401 (1431)
T KOG1240|consen 1378 VGLTEALR-ENQKLRPGPSDPSTYH 1401 (1431)
T ss_pred             cCchhhcc-cccccccCCCCCcccc
Confidence            33332222 4566777777888887


No 271
>KOG0771 consensus Prolactin regulatory element-binding protein/Protein transport protein SEC12p [Intracellular trafficking, secretion, and vesicular transport]
Probab=82.93  E-value=5.5  Score=47.37  Aligned_cols=123  Identities=12%  Similarity=0.174  Sum_probs=76.1

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhh-Hhhc---C--------------------------CccEEEeecCCCceeEEe
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATR-SLLR---G--------------------------HTKIKIWEDSKVAPLIIL  202 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir-~llr---G--------------------------H~qVriWD~~~g~pl~~l  202 (1165)
                      ++-||++|+|-..| .-||||.++... .-+.   +                          |..|+.||..      .|
T Consensus       194 FS~dgk~lasig~d-~~~VW~~~~g~~~a~~t~~~k~~~~~~cRF~~d~~~~~l~laa~~~~~~~v~~~~~~------~w  266 (398)
T KOG0771|consen  194 FSPDGKFLASIGAD-SARVWSVNTGAALARKTPFSKDEMFSSCRFSVDNAQETLRLAASQFPGGGVRLCDIS------LW  266 (398)
T ss_pred             eCCCCcEEEEecCC-ceEEEEeccCchhhhcCCcccchhhhhceecccCCCceEEEEEecCCCCceeEEEee------ee
Confidence            77899999998888 999999998311 1111   1                          1114443322      22


Q ss_pred             cC---------CCC-CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCc
Q 001070          203 KP---------HGG-QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPR  272 (1165)
Q Consensus       203 ep---------hdG-~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~  272 (1165)
                      ..         -.+ +++.|++-.     .+++|+.. |..+..|-|++.               +=+|++-+-.    +
T Consensus       267 ~~~~~l~~~~~~~~~~siSsl~VS-----~dGkf~Al-GT~dGsVai~~~---------------~~lq~~~~vk----~  321 (398)
T KOG0771|consen  267 SGSNFLRLRKKIKRFKSISSLAVS-----DDGKFLAL-GTMDGSVAIYDA---------------KSLQRLQYVK----E  321 (398)
T ss_pred             ccccccchhhhhhccCcceeEEEc-----CCCcEEEE-eccCCcEEEEEe---------------ceeeeeEeeh----h
Confidence            21         112 378888873     55676665 788999999997               3334444322    2


Q ss_pred             cccccEEEEEeecCCcEEE-EeccCCCcEEEEEeec
Q 001070          273 VEEAFFNQVVVLSQAGLLL-FANAKKNAIYSVHLGY  307 (1165)
Q Consensus       273 ~~~aff~sV~~~p~a~~il-Lan~~r~aIYalhl~~  307 (1165)
                      .|.-|+-.|.+.|+.+++. ++-..+-+|-.|-++|
T Consensus       322 aH~~~VT~ltF~Pdsr~~~svSs~~~~~v~~l~vd~  357 (398)
T KOG0771|consen  322 AHLGFVTGLTFSPDSRYLASVSSDNEAAVTKLAVDK  357 (398)
T ss_pred             hheeeeeeEEEcCCcCcccccccCCceeEEEEeecc
Confidence            5777999999999988654 4444445555555543


No 272
>KOG2695 consensus WD40 repeat protein [General function prediction only]
Probab=82.91  E-value=1.6  Score=50.92  Aligned_cols=80  Identities=18%  Similarity=0.164  Sum_probs=54.0

Q ss_pred             EEEeecCCC-----ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcce---
Q 001070          188 IKIWEDSKV-----APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKC---  259 (1165)
Q Consensus       188 VriWD~~~g-----~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C---  259 (1165)
                      |-+.|.|.+     -+.++|- | +-+|.|+--|+    -+.++|++ .+.+.+|||||+-..            +|   
T Consensus       276 I~~iDLR~rnqG~~~~a~rly-h-~Ssvtslq~Lq----~s~q~Lma-S~M~gkikLyD~R~~------------K~~~~  336 (425)
T KOG2695|consen  276 IFVIDLRCRNQGNGWCAQRLY-H-DSSVTSLQILQ----FSQQKLMA-SDMTGKIKLYDLRAT------------KCKKS  336 (425)
T ss_pred             EEEEEeeecccCCCcceEEEE-c-Ccchhhhhhhc----cccceEee-ccCcCceeEeeehhh------------hcccc
Confidence            777887753     4566663 3 45888887762    14466886 569999999999444            88   


Q ss_pred             EEEEeccCCCCCccccccEEEEEeecCCcEEEE
Q 001070          260 TQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLF  292 (1165)
Q Consensus       260 ~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilL  292 (1165)
                      +++.|+|+..-      =++-+-+++..++|+-
T Consensus       337 V~qYeGHvN~~------a~l~~~v~~eeg~I~s  363 (425)
T KOG2695|consen  337 VMQYEGHVNLS------AYLPAHVKEEEGSIFS  363 (425)
T ss_pred             eeeeecccccc------cccccccccccceEEE
Confidence            99999987541      1234445677666654


No 273
>KOG1587 consensus Cytoplasmic dynein intermediate chain [Cytoskeleton]
Probab=82.66  E-value=5.3  Score=49.69  Aligned_cols=111  Identities=18%  Similarity=0.214  Sum_probs=61.4

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCC-C--CCcceeEeecCCCCCCceEEEeecC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHG-G--QPVNSAQYLTAPNQAGHIILVTAGP  232 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephd-G--~sV~SVaFl~aP~~~d~~~lvtsGs  232 (1165)
                      ++.+||.|..+|+|-+||+....+.+                 ...+..++ .  ++|..|.|+..+.+-  .  +.|++
T Consensus       254 ~p~ll~gG~y~GqV~lWD~~~~~~~~-----------------~s~ls~~~~sh~~~v~~vvW~~~~~~~--~--f~s~s  312 (555)
T KOG1587|consen  254 DPNLLAGGCYNGQVVLWDLRKGSDTP-----------------PSGLSALEVSHSEPVTAVVWLQNEHNT--E--FFSLS  312 (555)
T ss_pred             CcceEEeeccCceEEEEEccCCCCCC-----------------CcccccccccCCcCeEEEEEeccCCCC--c--eEEEe
Confidence            46777778888887777765422211                 22222222 2  367777776544442  3  33688


Q ss_pred             CCceEEEeEccCcCCCCCCCCC-----------CCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          233 LNREVKLWASASEEGWSLPTHA-----------ESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       233 lnrtIKLW~~a~~~~~~~~~~~-----------~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      .|..|+.|+...   ...|.+.           +.|+|.++..++=..      .--+..++--+.|+|.-++.+
T Consensus       313 sDG~i~~W~~~~---l~~P~e~~~~~~~~~~~~~~~~~~~~t~~~F~~------~~p~~FiVGTe~G~v~~~~r~  378 (555)
T KOG1587|consen  313 SDGSICSWDTDM---LSLPVEGLLLESKKHKGQQSSKAVGATSLKFEP------TDPNHFIVGTEEGKVYKGCRK  378 (555)
T ss_pred             cCCcEeeeeccc---cccchhhcccccccccccccccccceeeEeecc------CCCceEEEEcCCcEEEEEecc
Confidence            899999998743   2222221           247777766542211      112234556677777766654


No 274
>KOG1524 consensus WD40 repeat-containing protein CHE-2 [General function prediction only]
Probab=82.33  E-value=8.2  Score=47.41  Aligned_cols=121  Identities=19%  Similarity=0.270  Sum_probs=80.5

Q ss_pred             ccccccEee-----ecCceEEEeecCCcEEEEeCcchhhHhhcCCcc--EEEeecCCCceeEEecCCCCCCcceeEeecC
Q 001070          146 ELLIGRQIA-----VNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTK--IKIWEDSKVAPLIILKPHGGQPVNSAQYLTA  218 (1165)
Q Consensus       146 ~~~~GR~IA-----Vn~~yIayG~kdg~IRVwdi~t~ir~llrGH~q--VriWD~~~g~pl~~lephdG~sV~SVaFl~a  218 (1165)
                      .|+.|.+|.     .|-+-|=.-+.||.|--.|-++.--.++.|-++  .||||-. |.+|-.=.+|+ +++.||||  +
T Consensus       161 l~c~g~h~~IKpL~~n~k~i~WkAHDGiiL~~~W~~~s~lI~sgGED~kfKvWD~~-G~~Lf~S~~~e-y~ITSva~--n  236 (737)
T KOG1524|consen  161 VFCQGGHISIKPLAANSKIIRWRAHDGLVLSLSWSTQSNIIASGGEDFRFKIWDAQ-GANLFTSAAEE-YAITSVAF--N  236 (737)
T ss_pred             EEecCCeEEEeecccccceeEEeccCcEEEEeecCccccceeecCCceeEEeeccc-CcccccCChhc-cceeeeee--c
Confidence            345566644     477888888899999888877766668889888  8999987 67777777885 79999999  5


Q ss_pred             CCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCC
Q 001070          219 PNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKN  298 (1165)
Q Consensus       219 P~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~  298 (1165)
                      |+   ..|+|  ||-|                           |++|.+.   +. ...| -++-++||--+-.+.....
T Consensus       237 pd---~~~~v--~S~n---------------------------t~R~~~p---~~-GSif-nlsWS~DGTQ~a~gt~~G~  279 (737)
T KOG1524|consen  237 PE---KDYLL--WSYN---------------------------TARFSSP---RV-GSIF-NLSWSADGTQATCGTSTGQ  279 (737)
T ss_pred             cc---cceee--eeee---------------------------eeeecCC---Cc-cceE-EEEEcCCCceeeccccCce
Confidence            66   34555  4443                           3334221   11 1333 3455677766666666666


Q ss_pred             cEEEEEeec
Q 001070          299 AIYSVHLGY  307 (1165)
Q Consensus       299 aIYalhl~~  307 (1165)
                      .|.|--++.
T Consensus       280 v~~A~~ieq  288 (737)
T KOG1524|consen  280 LIVAYAIEQ  288 (737)
T ss_pred             EEEeeeehh
Confidence            665544443


No 275
>COG4946 Uncharacterized protein related to the periplasmic component of the Tol biopolymer transport system [Function unknown]
Probab=81.41  E-value=39  Score=41.44  Aligned_cols=161  Identities=19%  Similarity=0.250  Sum_probs=89.7

Q ss_pred             Cceee----cCCceEEecccCCC--------CCCCCCCcccccccccCCCcccccccEeee-----------cCceEEEe
Q 001070          107 YGKRV----FGDYVAYDVDAVEE--------GREPTQQLEVNPITKYGSDPELLIGRQIAV-----------NKHYVCYG  163 (1165)
Q Consensus       107 ~Gr~l----~g~~~~~dVd~~~~--------ge~~~pqlev~pIt~Y~sd~~~~~GR~IAV-----------n~~yIayG  163 (1165)
                      +|||+    .|+-..||.++-.-        =+--+-+-+..--.||--|-....|..||.           ++.|..--
T Consensus       277 DGkrIvFq~~GdIylydP~td~lekldI~lpl~rk~k~~k~~~pskyledfa~~~Gd~ia~VSRGkaFi~~~~~~~~iqv  356 (668)
T COG4946         277 DGKRIVFQNAGDIYLYDPETDSLEKLDIGLPLDRKKKQPKFVNPSKYLEDFAVVNGDYIALVSRGKAFIMRPWDGYSIQV  356 (668)
T ss_pred             CCcEEEEecCCcEEEeCCCcCcceeeecCCccccccccccccCHHHhhhhhccCCCcEEEEEecCcEEEECCCCCeeEEc
Confidence            78888    56888899876322        111101222333346666666666666653           11222222


Q ss_pred             ecCCcEEEEeCcchhhHhhcCCcc---EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEe
Q 001070          164 LKGGNVRVLNLNTATRSLLRGHTK---IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLW  240 (1165)
Q Consensus       164 ~kdg~IRVwdi~t~ir~llrGH~q---VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW  240 (1165)
                      -+.|.||---|.+.-..+..|...   +-|+|-.+|. +.++++.=| -|.+|.-  .   ++++++|+   .|....||
T Consensus       357 ~~~~~VrY~r~~~~~e~~vigt~dgD~l~iyd~~~~e-~kr~e~~lg-~I~av~v--s---~dGK~~vv---aNdr~el~  426 (668)
T COG4946         357 GKKGGVRYRRIQVDPEGDVIGTNDGDKLGIYDKDGGE-VKRIEKDLG-NIEAVKV--S---PDGKKVVV---ANDRFELW  426 (668)
T ss_pred             CCCCceEEEEEccCCcceEEeccCCceEEEEecCCce-EEEeeCCcc-ceEEEEE--c---CCCcEEEE---EcCceEEE
Confidence            223445555554422244444433   7888887665 788886545 6888887  3   44465776   35555666


Q ss_pred             EccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEecc
Q 001070          241 ASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANA  295 (1165)
Q Consensus       241 ~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~  295 (1165)
                      -.+...|          + .+-++       +.+.+++...+.+|.++||--|-.
T Consensus       427 vididng----------n-v~~id-------kS~~~lItdf~~~~nsr~iAYafP  463 (668)
T COG4946         427 VIDIDNG----------N-VRLID-------KSEYGLITDFDWHPNSRWIAYAFP  463 (668)
T ss_pred             EEEecCC----------C-eeEec-------ccccceeEEEEEcCCceeEEEecC
Confidence            5544322          1 11111       134678888899999999876654


No 276
>smart00320 WD40 WD40 repeats. Note that these repeats are permuted with respect to the structural repeats (blades) of the beta propeller domain.
Probab=81.13  E-value=1.2  Score=30.88  Aligned_cols=18  Identities=11%  Similarity=0.466  Sum_probs=16.1

Q ss_pred             cCceEEEeecCCcEEEEe
Q 001070          156 NKHYVCYGLKGGNVRVLN  173 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwd  173 (1165)
                      ++.++++|..||.|||||
T Consensus        23 ~~~~~~~~~~d~~~~~~~   40 (40)
T smart00320       23 DGKYLASASDDGTIKLWD   40 (40)
T ss_pred             CCCEEEEecCCCeEEEcC
Confidence            367999999999999997


No 277
>KOG0132 consensus RNA polymerase II C-terminal domain-binding protein RA4, contains RPR and RRM domains [RNA processing and modification; Transcription]
Probab=81.13  E-value=4  Score=51.66  Aligned_cols=6  Identities=17%  Similarity=0.379  Sum_probs=2.2

Q ss_pred             CCCCCC
Q 001070          369 ESGGLE  374 (1165)
Q Consensus       369 ~~~~~e  374 (1165)
                      .|..+|
T Consensus       837 ~~~~~e  842 (894)
T KOG0132|consen  837 KNTSVE  842 (894)
T ss_pred             cccccc
Confidence            333333


No 278
>KOG0974 consensus WD-repeat protein WDR6, WD repeat superfamily [General function prediction only]
Probab=81.11  E-value=2.4  Score=54.75  Aligned_cols=84  Identities=19%  Similarity=0.264  Sum_probs=60.7

Q ss_pred             ccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc----------------------EEEeecCCCceeE-EecCC
Q 001070          150 GRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK----------------------IKIWEDSKVAPLI-ILKPH  205 (1165)
Q Consensus       150 GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q----------------------VriWD~~~g~pl~-~leph  205 (1165)
                      +-+++.+.=||+.|+--|.|-||+-+- +.-.-|.||+.                      +|+|++.++.-+. +.=+|
T Consensus       138 ~~g~s~~~~~i~~gsv~~~iivW~~~~dn~p~~l~GHeG~iF~i~~s~dg~~i~s~SdDRsiRlW~i~s~~~~~~~~fgH  217 (967)
T KOG0974|consen  138 IIGDSAEELYIASGSVFGEIIVWKPHEDNKPIRLKGHEGSIFSIVTSLDGRYIASVSDDRSIRLWPIDSREVLGCTGFGH  217 (967)
T ss_pred             EEeccCcEEEEEeccccccEEEEeccccCCcceecccCCceEEEEEccCCcEEEEEecCcceeeeecccccccCcccccc
Confidence            444666788999999999999999986 55557999999                      9999998864222 11123


Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      .+ -|..+.|+  |+    . ++ +++-|-|.++|..
T Consensus       218 sa-Rvw~~~~~--~n----~-i~-t~gedctcrvW~~  245 (967)
T KOG0974|consen  218 SA-RVWACCFL--PN----R-II-TVGEDCTCRVWGV  245 (967)
T ss_pred             cc-eeEEEEec--cc----e-eE-EeccceEEEEEec
Confidence            22 56677775  33    1 44 5889999999954


No 279
>KOG2079 consensus Vacuolar assembly/sorting protein VPS8 [Intracellular trafficking, secretion, and vesicular transport]
Probab=80.57  E-value=3.2  Score=54.12  Aligned_cols=65  Identities=20%  Similarity=0.403  Sum_probs=49.9

Q ss_pred             eeecCceEEEeecCCcEEEEeCcchhhH----------------------hhcCCcc--EEEeecCCCceeEEecCCCCC
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNTATRS----------------------LLRGHTK--IKIWEDSKVAPLIILKPHGGQ  208 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t~ir~----------------------llrGH~q--VriWD~~~g~pl~~lephdG~  208 (1165)
                      +|+-+.+|++|..-|+|=..|..++++.                      ++-||..  |.|||+..+-+++.+.-| |+
T Consensus        95 ~a~~~~~ivi~Ts~ghvl~~d~~~nL~~~~~ne~v~~~Vtsvafn~dg~~l~~G~~~G~V~v~D~~~~k~l~~i~e~-~a  173 (1206)
T KOG2079|consen   95 SAIVVVPIVIGTSHGHVLLSDMTGNLGPLHQNERVQGPVTSVAFNQDGSLLLAGLGDGHVTVWDMHRAKILKVITEH-GA  173 (1206)
T ss_pred             eeeeeeeEEEEcCchhhhhhhhhcccchhhcCCccCCcceeeEecCCCceeccccCCCcEEEEEccCCcceeeeeec-CC
Confidence            4556788999999887766666665554                      4444444  999999999999988876 89


Q ss_pred             CcceeEeecC
Q 001070          209 PVNSAQYLTA  218 (1165)
Q Consensus       209 sV~SVaFl~a  218 (1165)
                      ++.+|.|+..
T Consensus       174 p~t~vi~v~~  183 (1206)
T KOG2079|consen  174 PVTGVIFVGR  183 (1206)
T ss_pred             ccceEEEEEE
Confidence            9999999754


No 280
>KOG4672 consensus Uncharacterized conserved low complexity protein [Function unknown]
Probab=79.98  E-value=7.2  Score=46.47  Aligned_cols=14  Identities=21%  Similarity=0.442  Sum_probs=6.7

Q ss_pred             CCCCCCcccccccc
Q 001070            8 QSPNQNQKQFDMRN   21 (1165)
Q Consensus         8 ~~~~~~~~~~~~~~   21 (1165)
                      +.-.+|++.|+-.|
T Consensus       286 ~~eden~~~~~~sn  299 (487)
T KOG4672|consen  286 RPEDENASSFQNSN  299 (487)
T ss_pred             chhhhccccccccc
Confidence            33445555555444


No 281
>TIGR02658 TTQ_MADH_Hv methylamine dehydrogenase heavy chain. This family consists of the heavy chain of methylamine dehydrogenase light chain, a periplasmic enzyme. The enzyme contains a tryptophan tryptophylquinone (TTQ) prothetic group derived from two Trp residues in the light subunity. The enzyme forms a complex with the type I blue copper protein amicyanin and a cytochrome. Electron transfer procedes from TQQ to the copper and then to the heme group of the cytochrome.
Probab=79.58  E-value=14  Score=43.57  Aligned_cols=79  Identities=13%  Similarity=0.060  Sum_probs=54.0

Q ss_pred             CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC-CCcEEEEEeecCCC
Q 001070          232 PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK-KNAIYSVHLGYGNN  310 (1165)
Q Consensus       232 slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~-r~aIYalhl~~g~~  310 (1165)
                      .-+..|.+||.++.            +-+.++......+-- .-.+-..++++|+++||+++|.. .++|-++-++.+. 
T Consensus        74 ~~~d~V~v~D~~t~------------~~~~~i~~p~~p~~~-~~~~~~~~~ls~dgk~l~V~n~~p~~~V~VvD~~~~k-  139 (352)
T TIGR02658        74 KRTDYVEVIDPQTH------------LPIADIELPEGPRFL-VGTYPWMTSLTPDNKTLLFYQFSPSPAVGVVDLEGKA-  139 (352)
T ss_pred             CCCCEEEEEECccC------------cEEeEEccCCCchhh-ccCccceEEECCCCCEEEEecCCCCCEEEEEECCCCc-
Confidence            38899999998665            777788865432200 01233367899999999999988 9999999888532 


Q ss_pred             ccccccccccccccccceeee
Q 001070          311 SAATRIDYIAEFTVTMPVLSF  331 (1165)
Q Consensus       311 ~~~~r~dyiaeF~v~~PILSf  331 (1165)
                             .++|+.|.-+.+-+
T Consensus       140 -------vv~ei~vp~~~~vy  153 (352)
T TIGR02658       140 -------FVRMMDVPDCYHIF  153 (352)
T ss_pred             -------EEEEEeCCCCcEEE
Confidence                   35555554433333


No 282
>PF11101 DUF2884:  Protein of unknown function (DUF2884);  InterPro: IPR021307  Some members in this bacterial family of proteins are annotated as YggN which currently has no known function. 
Probab=79.56  E-value=1.1e+02  Score=34.17  Aligned_cols=24  Identities=13%  Similarity=0.029  Sum_probs=12.8

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          814 RTQQITGLITNLINKDLTASLEKL  837 (1165)
Q Consensus       814 RQ~qLL~LVS~~LnktL~~nLEk~  837 (1165)
                      .|++.|+--++-|.+.+|.+.+-+
T Consensus        46 ~Q~q~l~~Y~~~lr~~lP~~~~~a   69 (229)
T PF11101_consen   46 EQQQALQQYQQGLRQQLPWVVQLA   69 (229)
T ss_pred             HHHHHHHHHHHHHHHHhHHHHHHH
Confidence            445555555555555565554433


No 283
>PF05308 Mito_fiss_reg:  Mitochondrial fission regulator;  InterPro: IPR007972 This family consists of several uncharacterised eukaryotic proteins of unknown function.
Probab=79.37  E-value=3  Score=47.03  Aligned_cols=7  Identities=43%  Similarity=0.966  Sum_probs=3.4

Q ss_pred             HHHHHhh
Q 001070           86 PQILALL   92 (1165)
Q Consensus        86 ~~~~~~l   92 (1165)
                      +-.|++|
T Consensus       238 PnMldVL  244 (253)
T PF05308_consen  238 PNMLDVL  244 (253)
T ss_pred             ccHHHHH
Confidence            3445555


No 284
>TIGR02658 TTQ_MADH_Hv methylamine dehydrogenase heavy chain. This family consists of the heavy chain of methylamine dehydrogenase light chain, a periplasmic enzyme. The enzyme contains a tryptophan tryptophylquinone (TTQ) prothetic group derived from two Trp residues in the light subunity. The enzyme forms a complex with the type I blue copper protein amicyanin and a cytochrome. Electron transfer procedes from TQQ to the copper and then to the heme group of the cytochrome.
Probab=79.36  E-value=29  Score=41.15  Aligned_cols=138  Identities=14%  Similarity=0.136  Sum_probs=85.3

Q ss_pred             cccccccCC--CcccccccEeeecCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCC-CceeEEecCCCCCCcc
Q 001070          135 VNPITKYGS--DPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSK-VAPLIILKPHGGQPVN  211 (1165)
Q Consensus       135 v~pIt~Y~s--d~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~-g~pl~~lephdG~sV~  211 (1165)
                      +..+.++..  +|.+.-.+....||+++..-.+ |.|.+.|....--..+      +.|..-+ +..-+-|+|..=++  
T Consensus       182 ~~~~~vf~~~~~~v~~rP~~~~~dg~~~~vs~e-G~V~~id~~~~~~~~~------~~~~~~~~~~~~~~wrP~g~q~--  252 (352)
T TIGR02658       182 IKPTEVFHPEDEYLINHPAYSNKSGRLVWPTYT-GKIFQIDLSSGDAKFL------PAIEAFTEAEKADGWRPGGWQQ--  252 (352)
T ss_pred             EeeeeeecCCccccccCCceEcCCCcEEEEecC-CeEEEEecCCCcceec------ceeeeccccccccccCCCccee--
Confidence            444444333  4444444445558888877777 9999999776221111      3565432 22234577752123  


Q ss_pred             eeEeecCCCCCCceEEEeec---------CCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEE
Q 001070          212 SAQYLTAPNQAGHIILVTAG---------PLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVV  282 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsG---------slnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~  282 (1165)
                       ++|  .|++.-   |.+.+         ...++|-++|.            ++++.+.++..       +  .-..+++
T Consensus       253 -ia~--~~dg~~---lyV~~~~~~~~thk~~~~~V~ViD~------------~t~kvi~~i~v-------G--~~~~~ia  305 (352)
T TIGR02658       253 -VAY--HRARDR---IYLLADQRAKWTHKTASRFLFVVDA------------KTGKRLRKIEL-------G--HEIDSIN  305 (352)
T ss_pred             -EEE--cCCCCE---EEEEecCCccccccCCCCEEEEEEC------------CCCeEEEEEeC-------C--CceeeEE
Confidence             888  455533   33322         12247777775            45699999986       2  3445899


Q ss_pred             eecCCc-EEEEeccCCCcEEEEEeecC
Q 001070          283 VLSQAG-LLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       283 ~~p~a~-~ilLan~~r~aIYalhl~~g  308 (1165)
                      ++||+. +|+++|...+.|+++-.+-+
T Consensus       306 vS~Dgkp~lyvtn~~s~~VsViD~~t~  332 (352)
T TIGR02658       306 VSQDAKPLLYALSTGDKTLYIFDAETG  332 (352)
T ss_pred             ECCCCCeEEEEeCCCCCcEEEEECcCC
Confidence            999999 99999999999998876643


No 285
>KOG2315 consensus Predicted translation initiation factor related to eIF-3a [Translation, ribosomal structure and biogenesis]
Probab=79.26  E-value=4.9  Score=49.31  Aligned_cols=120  Identities=19%  Similarity=0.437  Sum_probs=77.0

Q ss_pred             ceeecCCceEEecccCCCCCCCC-CCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchh--------
Q 001070          108 GKRVFGDYVAYDVDAVEEGREPT-QQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTAT--------  178 (1165)
Q Consensus       108 Gr~l~g~~~~~dVd~~~~ge~~~-pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~i--------  178 (1165)
                      |..--|+.-.|=.++.  ||..- |=+.-.||-.|.|.+   .||.++|     |||----.+-|+|..-..        
T Consensus       244 n~SYYGEq~Lyll~t~--g~s~~V~L~k~GPVhdv~W~~---s~~EF~V-----vyGfMPAkvtifnlr~~~v~df~egp  313 (566)
T KOG2315|consen  244 NASYYGEQTLYLLATQ--GESVSVPLLKEGPVHDVTWSP---SGREFAV-----VYGFMPAKVTIFNLRGKPVFDFPEGP  313 (566)
T ss_pred             CccccccceEEEEEec--CceEEEecCCCCCceEEEECC---CCCEEEE-----EEecccceEEEEcCCCCEeEeCCCCC
Confidence            4444566666655554  54430 123367999999988   6999998     999887777777776422        


Q ss_pred             --hHhhcCCcc-------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecC-----CCceEE
Q 001070          179 --RSLLRGHTK-------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGP-----LNREVK  238 (1165)
Q Consensus       179 --r~llrGH~q-------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGs-----lnrtIK  238 (1165)
                        +..|.-|+.             |-|||+.+--.+.+++-.|  +.| +.|  +|||   .|++|+--     .|.-||
T Consensus       314 RN~~~fnp~g~ii~lAGFGNL~G~mEvwDv~n~K~i~~~~a~~--tt~-~eW--~PdG---e~flTATTaPRlrvdNg~K  385 (566)
T KOG2315|consen  314 RNTAFFNPHGNIILLAGFGNLPGDMEVWDVPNRKLIAKFKAAN--TTV-FEW--SPDG---EYFLTATTAPRLRVDNGIK  385 (566)
T ss_pred             ccceEECCCCCEEEEeecCCCCCceEEEeccchhhccccccCC--ceE-EEE--cCCC---cEEEEEeccccEEecCCeE
Confidence              224444444             9999999876777776442  121 234  4555   34554433     588999


Q ss_pred             EeEccCc
Q 001070          239 LWASASE  245 (1165)
Q Consensus       239 LW~~a~~  245 (1165)
                      ||+..+.
T Consensus       386 iwhytG~  392 (566)
T KOG2315|consen  386 IWHYTGS  392 (566)
T ss_pred             EEEecCc
Confidence            9998554


No 286
>TIGR03300 assembly_YfgL outer membrane assembly lipoprotein YfgL. Members of this protein family are YfgL, a lipoprotein component of a complex that acts protein insertion into the bacterial outer membrane. Other members of this complex are NlpB, YfiO, and YaeT. This protein contains multiple copies of a repeat that, in other contexts, are associated with binding of the coenzyme PQQ.
Probab=79.12  E-value=21  Score=41.10  Aligned_cols=81  Identities=12%  Similarity=0.037  Sum_probs=42.1

Q ss_pred             CceEEEeecCCcEEEEeCcc-hhhHhhc--CCcc----------------EEEeecCCCceeEEecCCCCCCcceeEeec
Q 001070          157 KHYVCYGLKGGNVRVLNLNT-ATRSLLR--GHTK----------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLT  217 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t-~ir~llr--GH~q----------------VriWD~~~g~pl~~lephdG~sV~SVaFl~  217 (1165)
                      +.+|..+..+|.++.||+++ .++....  ++..                |..+|..+|..+-..+...+..+.+.+.  
T Consensus       241 ~~~vy~~~~~g~l~a~d~~tG~~~W~~~~~~~~~p~~~~~~vyv~~~~G~l~~~d~~tG~~~W~~~~~~~~~~ssp~i--  318 (377)
T TIGR03300       241 GGQVYAVSYQGRVAALDLRSGRVLWKRDASSYQGPAVDDNRLYVTDADGVVVALDRRSGSELWKNDELKYRQLTAPAV--  318 (377)
T ss_pred             CCEEEEEEcCCEEEEEECCCCcEEEeeccCCccCceEeCCEEEEECCCCeEEEEECCCCcEEEccccccCCccccCEE--
Confidence            44555667788888888876 3322211  1111                6666666665443332222222222222  


Q ss_pred             CCCCCCceEEEeecCCCceEEEeEccCc
Q 001070          218 APNQAGHIILVTAGPLNREVKLWASASE  245 (1165)
Q Consensus       218 aP~~~d~~~lvtsGslnrtIKLW~~a~~  245 (1165)
                          -+.. ++ .|+.|..|.+||..++
T Consensus       319 ----~g~~-l~-~~~~~G~l~~~d~~tG  340 (377)
T TIGR03300       319 ----VGGY-LV-VGDFEGYLHWLSREDG  340 (377)
T ss_pred             ----ECCE-EE-EEeCCCEEEEEECCCC
Confidence                1222 33 3668888988886544


No 287
>KOG2111 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=78.73  E-value=35  Score=39.98  Aligned_cols=93  Identities=13%  Similarity=0.166  Sum_probs=59.0

Q ss_pred             EEEeecCCCc--eeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCC-ceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          188 IKIWEDSKVA--PLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLN-REVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       188 VriWD~~~g~--pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsln-rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                      |+|-|...-.  +-.+...||+ .+-+|+.-     .+|- +|+++|.+ +=|+|||...+            .-+|.|+
T Consensus       161 vQi~dL~~~~~~~p~~I~AH~s-~Iacv~Ln-----~~Gt-~vATaStkGTLIRIFdt~~g------------~~l~E~R  221 (346)
T KOG2111|consen  161 VQIVDLASTKPNAPSIINAHDS-DIACVALN-----LQGT-LVATASTKGTLIRIFDTEDG------------TLLQELR  221 (346)
T ss_pred             EEEEEhhhcCcCCceEEEcccC-ceeEEEEc-----CCcc-EEEEeccCcEEEEEEEcCCC------------cEeeeee
Confidence            8888766533  2356677865 77778772     3334 45555555 55899997554            6677776


Q ss_pred             ccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          265 LKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       265 ~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      =      ....+=...++++|++.||-+|.-| -.|..+.|.
T Consensus       222 R------G~d~A~iy~iaFSp~~s~LavsSdK-gTlHiF~l~  256 (346)
T KOG2111|consen  222 R------GVDRADIYCIAFSPNSSWLAVSSDK-GTLHIFSLR  256 (346)
T ss_pred             c------CCchheEEEEEeCCCccEEEEEcCC-CeEEEEEee
Confidence            2      1223444599999999999887544 455444444


No 288
>PF01442 Apolipoprotein:  Apolipoprotein A1/A4/E domain;  InterPro: IPR000074  Exchangeable apolipoproteins (apoA, apoC and apoE) have the same genomic structure and are members of a multi-gene family that probably evolved from a common ancestral gene. This entry includes the ApoA1, ApoA4 and ApoE proteins. ApoA1 and ApoA4 are part of the APOA1/C3/A4/A5 gene cluster on chromosome 11 []. Apolipoproteins function in lipid transport as structural components of lipoprotein particles, cofactors for enzymes and ligands for cell-surface receptors. In particular, apoA1 is the major protein component of high-density lipoproteins; apoA4 is thought to act primarily in intestinal lipid absorption; and apoE is a blood plasma protein that mediates the transport and uptake of cholesterol and lipid by way of its high affinity interaction with different cellular receptors, including the low-density lipoprotein (LDL) receptor. Recent findings with apoA1 and apoE suggest that the tertiary structures of these two members of the human exchangeable apolipoprotein gene family are related []. The three-dimensional structure of the LDL receptor-binding domain of apoE indicates that the protein forms an unusually elongated four-helix bundle that may be stabilised by a tightly packed hydrophobic core that includes leucine zipper-type interactions and by numerous salt bridges on the mostly charged surface. Basic amino acids important for LDL receptor binding are clustered into a surface patch on one long helix [].; GO: 0008289 lipid binding, 0006869 lipid transport, 0042157 lipoprotein metabolic process, 0005576 extracellular region; PDB: 1YA9_A 3S84_A 1NFN_A 1LE2_A 1B68_A 1BZ4_A 1OEG_A 2L7B_A 1LE4_A 1EA8_A ....
Probab=78.72  E-value=82  Score=32.21  Aligned_cols=23  Identities=26%  Similarity=0.517  Sum_probs=13.9

Q ss_pred             HHHHHHHHHHHHHHHHHHhhhhc
Q 001070          744 MQDMLNQLMTMQKELQKQMSNLV  766 (1165)
Q Consensus       744 mq~~l~ql~~~qke~qkqm~~~v  766 (1165)
                      |.+.++.+...-.++..++..++
T Consensus         3 l~~~~~~l~~~~~~l~~~l~~~~   25 (202)
T PF01442_consen    3 LDDRLDSLSSRTEELEERLEELS   25 (202)
T ss_dssp             HHHHHHHHHHHHHHHHHCHCSCC
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHH
Confidence            45556666666666666666533


No 289
>COG3386 Gluconolactonase [Carbohydrate transport and metabolism]
Probab=78.65  E-value=25  Score=40.79  Aligned_cols=140  Identities=13%  Similarity=0.074  Sum_probs=74.2

Q ss_pred             ccEeeec---CceEEEeecCCcEEEEeCcchhhHhhcCCcc---------EEEeecCCCce-eEEecCCCCCC---ccee
Q 001070          150 GRQIAVN---KHYVCYGLKGGNVRVLNLNTATRSLLRGHTK---------IKIWEDSKVAP-LIILKPHGGQP---VNSA  213 (1165)
Q Consensus       150 GR~IAVn---~~yIayG~kdg~IRVwdi~t~ir~llrGH~q---------VriWD~~~g~p-l~~lephdG~s---V~SV  213 (1165)
                      ++++-||   ++.+.+-.+.|..++|..-..+-.+..-+.+         +++||..++.. ....++.+|..   -+-+
T Consensus        37 ~~L~w~DI~~~~i~r~~~~~g~~~~~~~p~~~~~~~~~d~~g~Lv~~~~g~~~~~~~~~~~~t~~~~~~~~~~~~r~ND~  116 (307)
T COG3386          37 GALLWVDILGGRIHRLDPETGKKRVFPSPGGFSSGALIDAGGRLIACEHGVRLLDPDTGGKITLLAEPEDGLPLNRPNDG  116 (307)
T ss_pred             CEEEEEeCCCCeEEEecCCcCceEEEECCCCcccceeecCCCeEEEEccccEEEeccCCceeEEeccccCCCCcCCCCce
Confidence            3445554   5555666667777777766533332222222         77777655544 33333334432   1222


Q ss_pred             EeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCC--CCccccccEEEEEeecCCcEEE
Q 001070          214 QYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSA--KPRVEEAFFNQVVVLSQAGLLL  291 (1165)
Q Consensus       214 aFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~--~~~~~~aff~sV~~~p~a~~il  291 (1165)
                      -.     .+++.|.++....      |+  .+..+    ..+.+ |+..+.-....  ...++-.+=|.++++||+..+.
T Consensus       117 ~v-----~pdG~~wfgt~~~------~~--~~~~~----~~~~G-~lyr~~p~g~~~~l~~~~~~~~NGla~SpDg~tly  178 (307)
T COG3386         117 VV-----DPDGRIWFGDMGY------FD--LGKSE----ERPTG-SLYRVDPDGGVVRLLDDDLTIPNGLAFSPDGKTLY  178 (307)
T ss_pred             eE-----cCCCCEEEeCCCc------cc--cCccc----cCCcc-eEEEEcCCCCEEEeecCcEEecCceEECCCCCEEE
Confidence            22     2445556654432      22  11111    11112 33333311110  1112245678999999999999


Q ss_pred             EeccCCCcEEEEEeec
Q 001070          292 FANAKKNAIYSVHLGY  307 (1165)
Q Consensus       292 Lan~~r~aIYalhl~~  307 (1165)
                      ++|..++.||++.++.
T Consensus       179 ~aDT~~~~i~r~~~d~  194 (307)
T COG3386         179 VADTPANRIHRYDLDP  194 (307)
T ss_pred             EEeCCCCeEEEEecCc
Confidence            9999999999999985


No 290
>PRK04043 tolB translocation protein TolB; Provisional
Probab=78.24  E-value=24  Score=42.27  Aligned_cols=127  Identities=11%  Similarity=0.135  Sum_probs=69.5

Q ss_pred             eeecCce-EEEee---cCCcEEEEeCcc-hhhHh--hcCCcc----------------------EEEeecCCCceeEEec
Q 001070          153 IAVNKHY-VCYGL---KGGNVRVLNLNT-ATRSL--LRGHTK----------------------IKIWEDSKVAPLIILK  203 (1165)
Q Consensus       153 IAVn~~y-IayG~---kdg~IRVwdi~t-~ir~l--lrGH~q----------------------VriWD~~~g~pl~~le  203 (1165)
                      .+-||++ |+|..   ++..|.++|+.+ ..+.|  +.|...                      |.++|..+|. +.++.
T Consensus       195 wSpDG~~~i~y~s~~~~~~~Iyv~dl~tg~~~~lt~~~g~~~~~~~SPDG~~la~~~~~~g~~~Iy~~dl~~g~-~~~LT  273 (419)
T PRK04043        195 WANKEQTAFYYTSYGERKPTLYKYNLYTGKKEKIASSQGMLVVSDVSKDGSKLLLTMAPKGQPDIYLYDTNTKT-LTQIT  273 (419)
T ss_pred             ECCCCCcEEEEEEccCCCCEEEEEECCCCcEEEEecCCCcEEeeEECCCCCEEEEEEccCCCcEEEEEECCCCc-EEEcc
Confidence            4557875 66532   246799999998 33333  233322                      5666766665 55666


Q ss_pred             CCCCCCcceeEeecCCCCCCceEEEeecC-CCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEE
Q 001070          204 PHGGQPVNSAQYLTAPNQAGHIILVTAGP-LNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVV  282 (1165)
Q Consensus       204 phdG~sV~SVaFl~aP~~~d~~~lvtsGs-lnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~  282 (1165)
                      .+.|. ..+..|  +|||.- + ++++.- ....|-+++++++            .. +.+.+.      +  . ++ ..
T Consensus       274 ~~~~~-d~~p~~--SPDG~~-I-~F~Sdr~g~~~Iy~~dl~~g------------~~-~rlt~~------g--~-~~-~~  325 (419)
T PRK04043        274 NYPGI-DVNGNF--VEDDKR-I-VFVSDRLGYPNIFMKKLNSG------------SV-EQVVFH------G--K-NN-SS  325 (419)
T ss_pred             cCCCc-cCccEE--CCCCCE-E-EEEECCCCCceEEEEECCCC------------Ce-EeCccC------C--C-cC-ce
Confidence            55442 234467  566533 3 344432 2235666666443            22 223321      1  1 12 36


Q ss_pred             eecCCcEEEEeccCC--------CcEEEEEeecC
Q 001070          283 VLSQAGLLLFANAKK--------NAIYSVHLGYG  308 (1165)
Q Consensus       283 ~~p~a~~ilLan~~r--------~aIYalhl~~g  308 (1165)
                      .+|++++|+......        ..||.+.++-|
T Consensus       326 ~SPDG~~Ia~~~~~~~~~~~~~~~~I~v~d~~~g  359 (419)
T PRK04043        326 VSTYKNYIVYSSRETNNEFGKNTFNLYLISTNSD  359 (419)
T ss_pred             ECCCCCEEEEEEcCCCcccCCCCcEEEEEECCCC
Confidence            799999887776543        46888776543


No 291
>KOG2675 consensus Adenylate cyclase-associated protein (CAP/Srv2p) [Cytoskeleton; Signal transduction mechanisms]
Probab=77.95  E-value=3.2  Score=49.70  Aligned_cols=10  Identities=40%  Similarity=0.713  Sum_probs=6.0

Q ss_pred             hHHHHHhhcCC
Q 001070           85 GPQILALLNNN   95 (1165)
Q Consensus        85 ~~~~~~~l~~~   95 (1165)
                      || |.|-||.+
T Consensus       265 ~A-lFaqlNqG  274 (480)
T KOG2675|consen  265 GA-LFAQLNQG  274 (480)
T ss_pred             HH-HHHHHhcc
Confidence            55 66666655


No 292
>COG2706 3-carboxymuconate cyclase [Carbohydrate transport and metabolism]
Probab=77.15  E-value=55  Score=38.75  Aligned_cols=90  Identities=13%  Similarity=0.144  Sum_probs=62.6

Q ss_pred             CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCC-CCCccccccEEEEEee
Q 001070          206 GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSS-AKPRVEEAFFNQVVVL  284 (1165)
Q Consensus       206 dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s-~~~~~~~aff~sV~~~  284 (1165)
                      +|.+...|++.     .+++||+++-=.-..|.+.-+..        ++..|.-+|++.-..+ ...+.+..-+..+.++
T Consensus        87 ~g~~p~yvsvd-----~~g~~vf~AnY~~g~v~v~p~~~--------dG~l~~~v~~~~h~g~~p~~rQ~~~h~H~a~~t  153 (346)
T COG2706          87 PGSPPCYVSVD-----EDGRFVFVANYHSGSVSVYPLQA--------DGSLQPVVQVVKHTGSGPHERQESPHVHSANFT  153 (346)
T ss_pred             CCCCCeEEEEC-----CCCCEEEEEEccCceEEEEEccc--------CCccccceeeeecCCCCCCccccCCccceeeeC
Confidence            46666777773     56677887655556777766533        3456788888875333 2233445557778899


Q ss_pred             cCCcEEEEeccCCCcEEEEEeecC
Q 001070          285 SQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       285 p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      |++++|++-|..---||..-++-|
T Consensus       154 P~~~~l~v~DLG~Dri~~y~~~dg  177 (346)
T COG2706         154 PDGRYLVVPDLGTDRIFLYDLDDG  177 (346)
T ss_pred             CCCCEEEEeecCCceEEEEEcccC
Confidence            999999999999888888877743


No 293
>PF01442 Apolipoprotein:  Apolipoprotein A1/A4/E domain;  InterPro: IPR000074  Exchangeable apolipoproteins (apoA, apoC and apoE) have the same genomic structure and are members of a multi-gene family that probably evolved from a common ancestral gene. This entry includes the ApoA1, ApoA4 and ApoE proteins. ApoA1 and ApoA4 are part of the APOA1/C3/A4/A5 gene cluster on chromosome 11 []. Apolipoproteins function in lipid transport as structural components of lipoprotein particles, cofactors for enzymes and ligands for cell-surface receptors. In particular, apoA1 is the major protein component of high-density lipoproteins; apoA4 is thought to act primarily in intestinal lipid absorption; and apoE is a blood plasma protein that mediates the transport and uptake of cholesterol and lipid by way of its high affinity interaction with different cellular receptors, including the low-density lipoprotein (LDL) receptor. Recent findings with apoA1 and apoE suggest that the tertiary structures of these two members of the human exchangeable apolipoprotein gene family are related []. The three-dimensional structure of the LDL receptor-binding domain of apoE indicates that the protein forms an unusually elongated four-helix bundle that may be stabilised by a tightly packed hydrophobic core that includes leucine zipper-type interactions and by numerous salt bridges on the mostly charged surface. Basic amino acids important for LDL receptor binding are clustered into a surface patch on one long helix [].; GO: 0008289 lipid binding, 0006869 lipid transport, 0042157 lipoprotein metabolic process, 0005576 extracellular region; PDB: 1YA9_A 3S84_A 1NFN_A 1LE2_A 1B68_A 1BZ4_A 1OEG_A 2L7B_A 1LE4_A 1EA8_A ....
Probab=75.71  E-value=99  Score=31.60  Aligned_cols=49  Identities=20%  Similarity=0.261  Sum_probs=23.6

Q ss_pred             hHHHHHHHHHH---HHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHH
Q 001070          773 EGRRLEASLGR---GIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGL  821 (1165)
Q Consensus       773 E~kklE~~L~~---~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~L  821 (1165)
                      .+..++.+|..   .+...|....+++..+|...-.........+.+.+...
T Consensus        13 ~~~~l~~~l~~~~~~~~~~l~~~~~~~~~~l~~~~~~~~~~l~~~~~~~~~~   64 (202)
T PF01442_consen   13 RTEELEERLEELSDEIADRLAEEIEALSERLESELEELSDRLEERLDEVKER   64 (202)
T ss_dssp             HHHHHHHCHCSCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            34445555443   44455555555555555554444444444444444333


No 294
>KOG3914 consensus WD repeat protein WDR4 [Function unknown]
Probab=75.62  E-value=15  Score=43.82  Aligned_cols=93  Identities=14%  Similarity=0.178  Sum_probs=60.5

Q ss_pred             EEEeecCCCceeEEecCCCCC--CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          188 IKIWEDSKVAPLIILKPHGGQ--PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~--sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      +.||.+.+|++.-.+    ||  =|+.|||.  ||+   +|++|   .||-=|||-+-.+      +.    .=+.+|- 
T Consensus       134 ~di~s~~~~~~~~~l----GhvSml~dVavS--~D~---~~Iit---aDRDEkIRvs~yp------a~----f~Iesfc-  190 (390)
T KOG3914|consen  134 FDILSADSGRCEPIL----GHVSMLLDVAVS--PDD---QFIIT---ADRDEKIRVSRYP------AT----FVIESFC-  190 (390)
T ss_pred             eeeecccccCcchhh----hhhhhhheeeec--CCC---CEEEE---ecCCceEEEEecC------cc----cchhhhc-
Confidence            556665555543333    66  78999994  444   77898   3555555555222      10    1112222 


Q ss_pred             cCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCCc
Q 001070          266 KSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNNS  311 (1165)
Q Consensus       266 ~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~~  311 (1165)
                            -||++|+..+++.+.  +.|++.---+.||+-.+..|+..
T Consensus       191 ------lGH~eFVS~isl~~~--~~LlS~sGD~tlr~Wd~~sgk~L  228 (390)
T KOG3914|consen  191 ------LGHKEFVSTISLTDN--YLLLSGSGDKTLRLWDITSGKLL  228 (390)
T ss_pred             ------cccHhheeeeeeccC--ceeeecCCCCcEEEEecccCCcc
Confidence                  389999988877654  44888888899999999998884


No 295
>PF01213 CAP_N:  Adenylate cyclase associated (CAP) N terminal;  InterPro: IPR013992  Cyclase-associated proteins (CAPs) are highly conserved actin-binding proteins present in a wide range of organisms including yeast, fly, plants, and mammals. CAPs are multifunctional proteins that contain several structural domains. CAP is involved in species-specific signalling pathways [, , , ]. In Drosophila, CAP functions in Hedgehog-mediated eye development and in establishing oocyte polarity. In Dictyostelium (slim mold), CAP is involved in microfilament reorganisation near the plasma membrane in a PIP2-regulated manner and is required to perpetuate the cAMP relay signal to organise fruitbody formation. In plants, CAP is involved in plant signalling pathways required for co-ordinated organ expansion. In yeast, CAP is involved in adenylate cyclase activation, as well as in vesicle trafficking and endocytosis. In both yeast and mammals, CAPs appear to be involved in recycling G-actin monomers from ADF/cofilins for subsequent rounds of filament assembly [, ]. In mammals, there are two different CAPs (CAP1 and CAP2) that share 64% amino acid identity.  All CAPs appear to contain a C-terminal actin-binding domain that regulates actin remodelling in response to cellular signals and is required for normal cellular morphology, cell division, growth and locomotion in eukaryotes. CAP directly regulates actin filament dynamics and has been implicated in a number of complex developmental and morphological processes, including mRNA localisation and the establishment of cell polarity. Actin exists both as globular (G) (monomeric) actin subunits and assembled into filamentous (F) actin. In cells, actin cycles between these two forms. Proteins that bind F-actin often regulate F-actin assembly and its interaction with other proteins, while proteins that interact with G-actin often control the availability of unpolymerised actin. CAPs bind G-actin.  In addition to actin-binding, CAPs can have additional roles, and may act as bifunctional proteins. In Saccharomyces cerevisiae (Baker's yeast), CAP is a component of the adenylyl cyclase complex (Cyr1p) that serves as an effector of Ras during normal cell signalling. S. cerevisiae CAP functions to expose adenylate cyclase binding sites to Ras, thereby enabling adenylate cyclase to be activated by Ras regulatory signals. In Schizosaccharomyces pombe (Fission yeast), CAP is also required for adenylate cyclase activity, but not through the Ras pathway. In both organisms, the N-terminal domain is responsible for adenylate cyclase activation, but the S cerevisiae and S. pombe N-termini cannot complement one another. Yeast CAPs are unique among the CAP family of proteins, because they are the only ones to directly interact with and activate adenylate cyclase []. S. cerevisiae CAP has four major domains. In addition to the N-terminal adenylate cyclase-interacting domain, and the C-terminal actin-binding domain, it possesses two other domains: a proline-rich domain that interacts with Src homology 3 (SH3) domains of specific proteins, and a domain that is responsible for CAP oligomerisation to form multimeric complexes (although oligomerisation appears to involve the N- and C-terminal domains as well). The proline-rich domain interacts with profilin, a protein that catalyses nucleotide exchange on G-actin monomers and promotes addition to barbed ends of filamentous F-actin []. Since CAP can bind profilin via a proline-rich domain, and G-actin via a C-terminal domain, it has been suggested that a ternary G-actin/CAP/profilin complex could be formed. This entry represents the N-terminal domain of CAP proteins. This domain has an all-alpha structure consisting of six helices in a bundle with a left-handed twist and an up-and-down topology [].; GO: 0003779 actin binding, 0007010 cytoskeleton organization; PDB: 1TJF_B 1S0P_A.
Probab=75.47  E-value=0.91  Score=52.48  Aligned_cols=7  Identities=43%  Similarity=0.615  Sum_probs=0.0

Q ss_pred             HHHhhcC
Q 001070           88 ILALLNN   94 (1165)
Q Consensus        88 ~~~~l~~   94 (1165)
                      |++=||.
T Consensus       265 lFaeLN~  271 (312)
T PF01213_consen  265 LFAELNQ  271 (312)
T ss_dssp             -------
T ss_pred             HHHHHhc
Confidence            4444443


No 296
>COG5354 Uncharacterized protein, contains Trp-Asp (WD) repeat [General function prediction only]
Probab=73.78  E-value=7.9  Score=47.27  Aligned_cols=95  Identities=17%  Similarity=0.317  Sum_probs=58.8

Q ss_pred             cccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcchhhHh----------hcCCcc-------------EEEe
Q 001070          135 VNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNTATRSL----------LRGHTK-------------IKIW  191 (1165)
Q Consensus       135 v~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t~ir~l----------lrGH~q-------------VriW  191 (1165)
                      -.||-.|+|+|   ++++++|     |+|.-+-.|-++|+.+++|..          |.-|+.             |-||
T Consensus       274 ~~pVhdf~W~p---~S~~F~v-----i~g~~pa~~s~~~lr~Nl~~~~Pe~~rNT~~fsp~~r~il~agF~nl~gni~i~  345 (561)
T COG5354         274 KDPVHDFTWEP---LSSRFAV-----ISGYMPASVSVFDLRGNLRFYFPEQKRNTIFFSPHERYILFAGFDNLQGNIEIF  345 (561)
T ss_pred             cccceeeeecc---cCCceeE-----EecccccceeecccccceEEecCCcccccccccCcccEEEEecCCccccceEEe
Confidence            35888899988   7899997     899988888888888766542          222322             6677


Q ss_pred             ecCCCce-eEEecCCCCCCcceeEeecCCCCCCceEEEeecC-----CCceEEEeEccCc
Q 001070          192 EDSKVAP-LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGP-----LNREVKLWASASE  245 (1165)
Q Consensus       192 D~~~g~p-l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGs-----lnrtIKLW~~a~~  245 (1165)
                      |.....- +..+.+.+   -.-+-|  .   ||+.|+.++-.     .|..|||||..+.
T Consensus       346 ~~~~rf~~~~~~~~~n---~s~~~w--s---pd~qF~~~~~ts~k~~~Dn~i~l~~v~g~  397 (561)
T COG5354         346 DPAGRFKVAGAFNGLN---TSYCDW--S---PDGQFYDTDTTSEKLRVDNSIKLWDVYGA  397 (561)
T ss_pred             ccCCceEEEEEeecCC---ceEeec--c---CCceEEEecCCCcccccCcceEEEEecCc
Confidence            7665433 22554331   111123  2   33344443322     5789999999665


No 297
>KOG1064 consensus RAVE (regulator of V-ATPase assembly) complex subunit RAV1/DMX protein, WD repeat superfamily [General function prediction only]
Probab=73.04  E-value=3  Score=56.91  Aligned_cols=72  Identities=14%  Similarity=0.356  Sum_probs=47.7

Q ss_pred             cCceEEEeecCCcEEEEeCcc-hhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCC
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLN  234 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsln  234 (1165)
                      +-..|.+|.|+|.|.||||.. .+|+++..      ||.+                            +   .++.|+.-
T Consensus      2347 ~~qllisggr~G~v~l~D~rqrql~h~~~~------~~~~----------------------------~---~f~~~ss~ 2389 (2439)
T KOG1064|consen 2347 KHQLLISGGRKGEVCLFDIRQRQLRHTFQA------LDTR----------------------------E---YFVTGSSE 2389 (2439)
T ss_pred             cceEEEecCCcCcEEEeehHHHHHHHHhhh------hhhh----------------------------h---eeeccCcc
Confidence            345566788888888888877 77777643      4421                            1   34469999


Q ss_pred             ceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEE
Q 001070          235 REVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQV  281 (1165)
Q Consensus       235 rtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV  281 (1165)
                      ..||||.+..-            .-+.||.+.++     +..||..+
T Consensus      2390 g~ikIw~~s~~------------~ll~~~p~e~a-----k~gfFr~~ 2419 (2439)
T KOG1064|consen 2390 GNIKIWRLSEF------------GLLHTFPSEHA-----KQGFFRNI 2419 (2439)
T ss_pred             cceEEEEcccc------------chhhcCchhhc-----ccchhhhc
Confidence            99999998554            45567776552     34677555


No 298
>KOG1925 consensus Rac1 GTPase effector FHOS [Signal transduction mechanisms; Cytoskeleton]
Probab=71.17  E-value=3.4  Score=50.04  Aligned_cols=6  Identities=50%  Similarity=0.850  Sum_probs=2.4

Q ss_pred             HHHHHH
Q 001070          822 ITNLIN  827 (1165)
Q Consensus       822 VS~~Ln  827 (1165)
                      |-|+||
T Consensus       483 IGNfLn  488 (817)
T KOG1925|consen  483 IGNFLN  488 (817)
T ss_pred             Hhcccc
Confidence            334443


No 299
>KOG2321 consensus WD40 repeat protein [General function prediction only]
Probab=70.56  E-value=7.6  Score=48.03  Aligned_cols=61  Identities=23%  Similarity=0.502  Sum_probs=50.0

Q ss_pred             CceEEEeecCCcEEEEeCcchhhHhhcCCcc-------------------------EEEeecCCCceeEEecCCCCCCcc
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRSLLRGHTK-------------------------IKIWEDSKVAPLIILKPHGGQPVN  211 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~llrGH~q-------------------------VriWD~~~g~pl~~lephdG~sV~  211 (1165)
                      |=-++-|..+|.|-|+|+.+..-.+.+.|..                         +||||-.+|.+....||.-  .++
T Consensus       240 gL~~aVGts~G~v~iyDLRa~~pl~~kdh~~e~pi~~l~~~~~~~q~~v~S~Dk~~~kiWd~~~Gk~~asiEpt~--~lN  317 (703)
T KOG2321|consen  240 GLHVAVGTSTGSVLIYDLRASKPLLVKDHGYELPIKKLDWQDTDQQNKVVSMDKRILKIWDECTGKPMASIEPTS--DLN  317 (703)
T ss_pred             ceeEEeeccCCcEEEEEcccCCceeecccCCccceeeecccccCCCceEEecchHHhhhcccccCCceeeccccC--CcC
Confidence            4445679999999999999877777777765                         8999999999999999873  599


Q ss_pred             eeEeecCCCC
Q 001070          212 SAQYLTAPNQ  221 (1165)
Q Consensus       212 SVaFl~aP~~  221 (1165)
                      -++|+  |++
T Consensus       318 D~C~~--p~s  325 (703)
T KOG2321|consen  318 DFCFV--PGS  325 (703)
T ss_pred             ceeee--cCC
Confidence            99996  554


No 300
>KOG4849 consensus mRNA cleavage factor I subunit/CPSF subunit [RNA processing and modification]
Probab=70.40  E-value=15  Score=43.20  Aligned_cols=14  Identities=21%  Similarity=0.173  Sum_probs=6.4

Q ss_pred             cCCCCCCCCCCCCC
Q 001070           23 FPPYPPPSSSAAGD   36 (1165)
Q Consensus        23 ~~~~~~~~~~~~~~   36 (1165)
                      -||-|+-+++-+|+
T Consensus       224 ~~P~P~m~~P~s~P  237 (498)
T KOG4849|consen  224 VRPTPLMSQPTSLP  237 (498)
T ss_pred             CCCCCCCCCCCCCC
Confidence            34444444444443


No 301
>KOG4547 consensus WD40 repeat-containing protein [General function prediction only]
Probab=70.14  E-value=17  Score=44.86  Aligned_cols=61  Identities=20%  Similarity=0.196  Sum_probs=43.8

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      |-.|+...+.-...|..- -..|.|++.+  ||   ++.|++   ..|+||+|++.+.            +-++||++++
T Consensus       126 v~~~~~~~~~~~~~~~~~-~~~~~sl~is--~D---~~~l~~---as~~ik~~~~~~k------------evv~~ftgh~  184 (541)
T KOG4547|consen  126 VVYILEKEKVIIRIWKEQ-KPLVSSLCIS--PD---GKILLT---ASRQIKVLDIETK------------EVVITFTGHG  184 (541)
T ss_pred             EEEEecccceeeeeeccC-CCccceEEEc--CC---CCEEEe---ccceEEEEEccCc------------eEEEEecCCC
Confidence            667777766666677632 2488889884  55   455776   4599999999665            8889999877


Q ss_pred             CC
Q 001070          268 SA  269 (1165)
Q Consensus       268 s~  269 (1165)
                      +.
T Consensus       185 s~  186 (541)
T KOG4547|consen  185 SP  186 (541)
T ss_pred             cc
Confidence            65


No 302
>PRK06800 fliH flagellar assembly protein H; Validated
Probab=69.86  E-value=1.5e+02  Score=32.57  Aligned_cols=101  Identities=18%  Similarity=0.217  Sum_probs=58.8

Q ss_pred             HHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHH
Q 001070          744 MQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLIT  823 (1165)
Q Consensus       744 mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS  823 (1165)
                      +++-+.+|.+.||++.|-|+.     +.+|-.++|..=..-...  +..|..+-..-..+......+|...|+++---++
T Consensus        36 ~~~d~~~L~~~Q~~L~~e~~~-----l~~eqQ~l~~er~~l~~e--r~~~~~~~~e~~~~~e~~r~~fekekqq~~~~~t  108 (228)
T PRK06800         36 IQKDHEELLAQQKSLHKELNQ-----LRQEQQKLERERQQLLAD--REQFQEHVQQQMKEIEAARQQFQKEQQETAYEWT  108 (228)
T ss_pred             hhhhHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            566788999999999999987     566777776331111110  1122222111111122223455566677777778


Q ss_pred             HHHHHHHHHHHHHHHHHHHH----HhhhhhHh
Q 001070          824 NLINKDLTASLEKLVKKELA----AVGPAIVR  851 (1165)
Q Consensus       824 ~~LnktL~~nLEk~LKkeV~----sVvPAI~~  851 (1165)
                      .+|=..-=..-|+.|..-|.    .|+|-+..
T Consensus       109 ~~LwdeSi~LAEkIV~QaiDtR~l~vlPiLt~  140 (228)
T PRK06800        109 ELLWDQSFQLAEKIVNQAVDTRLLDVLPILTG  140 (228)
T ss_pred             HHHHHHHHHHHHHHHHHhhhHHHHHHHHHHHH
Confidence            77766666777888777766    56665544


No 303
>PF04286 DUF445:  Protein of unknown function (DUF445);  InterPro: IPR007383 This entry contains proteins of unknown function. They are predicted to be transmembrane proteins with 2 or 3 TM domains.
Probab=69.63  E-value=1.8e+02  Score=33.17  Aligned_cols=17  Identities=12%  Similarity=0.429  Sum_probs=7.5

Q ss_pred             HHHHHHHhHHHHHHHHH
Q 001070          785 IEKAVKASTDALWARFH  801 (1165)
Q Consensus       785 ieK~lk~eld~L~~R~d  801 (1165)
                      +.+.+...++.+..++.
T Consensus       184 l~~~i~~~l~~~l~~l~  200 (367)
T PF04286_consen  184 LAEKIQDELDSLLEKLQ  200 (367)
T ss_pred             HHHHHHHHHHHHHHHHH
Confidence            33444444444444444


No 304
>KOG4714 consensus Nucleoporin [Nuclear structure]
Probab=69.62  E-value=11  Score=42.95  Aligned_cols=51  Identities=22%  Similarity=0.552  Sum_probs=40.1

Q ss_pred             EEEeecCCC-ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccC
Q 001070          188 IKIWEDSKV-APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       188 VriWD~~~g-~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~  244 (1165)
                      |-+||.+.+ .|+..+.-|. ..+.-|.|  .|..|++  |+| .+.|.+|-.||..+
T Consensus       204 ~~l~d~rn~~~p~S~l~ahk-~~i~eV~F--Hpk~p~~--Lft-~sedGslw~wdas~  255 (319)
T KOG4714|consen  204 VGLWDARNVAMPVSLLKAHK-AEIWEVHF--HPKNPEH--LFT-CSEDGSLWHWDAST  255 (319)
T ss_pred             EEEEEcccccchHHHHHHhh-hhhhheec--cCCCchh--eeE-ecCCCcEEEEcCCC
Confidence            888998875 5788888774 48899999  6777774  565 67999999999753


No 305
>PF07250 Glyoxal_oxid_N:  Glyoxal oxidase N-terminus;  InterPro: IPR009880 This entry represents the N terminus (approximately 300 residues) of a number of plant and fungal glyoxal oxidase enzymes. Glyoxal oxidase catalyses the oxidation of aldehydes to carboxylic acids, coupled with reduction of dioxygen to hydrogen peroxide. It is an essential component of the extracellular lignin degradation pathways of the wood-rot fungus Phanerochaete chrysosporium [].
Probab=69.45  E-value=40  Score=38.06  Aligned_cols=143  Identities=22%  Similarity=0.340  Sum_probs=77.7

Q ss_pred             ceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeec-C--CcEEEEeCcchhhHhhcCCccEEEe
Q 001070          115 YVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLK-G--GNVRVLNLNTATRSLLRGHTKIKIW  191 (1165)
Q Consensus       115 ~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~k-d--g~IRVwdi~t~ir~llrGH~qVriW  191 (1165)
                      .++||++++.          ++|++.. +| .|+-|-.+--||+.|.+|.. +  +.||+++..+     ..+.  - =|
T Consensus        48 s~~yD~~tn~----------~rpl~v~-td-~FCSgg~~L~dG~ll~tGG~~~G~~~ir~~~p~~-----~~~~--~-~w  107 (243)
T PF07250_consen   48 SVEYDPNTNT----------FRPLTVQ-TD-TFCSGGAFLPDGRLLQTGGDNDGNKAIRIFTPCT-----SDGT--C-DW  107 (243)
T ss_pred             EEEEecCCCc----------EEeccCC-CC-CcccCcCCCCCCCEEEeCCCCccccceEEEecCC-----CCCC--C-Cc
Confidence            5678887732          3455543 33 37777777778888888654 2  3456655543     0000  0 12


Q ss_pred             ecCC-CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCC
Q 001070          192 EDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAK  270 (1165)
Q Consensus       192 D~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~  270 (1165)
                      .... ..-.       +.|=-++.=|     +|++++|.||..+-+.-+|.-....        ..   ..++.|-....
T Consensus       108 ~e~~~~m~~-------~RWYpT~~~L-----~DG~vlIvGG~~~~t~E~~P~~~~~--------~~---~~~~~~l~~~~  164 (243)
T PF07250_consen  108 TESPNDMQS-------GRWYPTATTL-----PDGRVLIVGGSNNPTYEFWPPKGPG--------PG---PVTLPFLSQTS  164 (243)
T ss_pred             eECcccccC-------CCccccceEC-----CCCCEEEEeCcCCCcccccCCccCC--------CC---ceeeecchhhh
Confidence            1111 1112       2333344444     5667899999997776666542110        00   11222211111


Q ss_pred             CccccccEEEEEeecCCcEEEEeccCCCcEE
Q 001070          271 PRVEEAFFNQVVVLSQAGLLLFANAKKNAIY  301 (1165)
Q Consensus       271 ~~~~~aff~sV~~~p~a~~ilLan~~r~aIY  301 (1165)
                      .....-+|--+-+.|+|++++.||. +..||
T Consensus       165 ~~~~~nlYP~~~llPdG~lFi~an~-~s~i~  194 (243)
T PF07250_consen  165 DTLPNNLYPFVHLLPDGNLFIFANR-GSIIY  194 (243)
T ss_pred             ccCccccCceEEEcCCCCEEEEEcC-CcEEE
Confidence            0123567888899999999999985 45555


No 306
>KOG0132 consensus RNA polymerase II C-terminal domain-binding protein RA4, contains RPR and RRM domains [RNA processing and modification; Transcription]
Probab=68.77  E-value=12  Score=47.77  Aligned_cols=21  Identities=14%  Similarity=0.029  Sum_probs=8.0

Q ss_pred             CCCCCCCCCCCCCCCCCCCCC
Q 001070           51 EPHANMHPHPYPHGPHRLLPY   71 (1165)
Q Consensus        51 ~~~~~~~~~~~~~~~~~~~~~   71 (1165)
                      |||+-.+.++...-|.+.+|+
T Consensus       621 PpP~~~Pg~np~~pPpg~~pP  641 (894)
T KOG0132|consen  621 PPPPLRPGYNPYPPPPGFMPP  641 (894)
T ss_pred             CCCCCCCCCCCCCCCcccCCC
Confidence            333333333333334444433


No 307
>KOG1354 consensus Serine/threonine protein phosphatase 2A, regulatory subunit [Signal transduction mechanisms]
Probab=68.30  E-value=24  Score=41.66  Aligned_cols=138  Identities=15%  Similarity=0.238  Sum_probs=79.2

Q ss_pred             ceEEEeecCCcEEEEeCcc-hhh----HhhcCCcc---------------------------------EEEeec-CCCce
Q 001070          158 HYVCYGLKGGNVRVLNLNT-ATR----SLLRGHTK---------------------------------IKIWED-SKVAP  198 (1165)
Q Consensus       158 ~yIayG~kdg~IRVwdi~t-~ir----~llrGH~q---------------------------------VriWD~-~~g~p  198 (1165)
                      ..++|.+.-|.||+.|+.. ++|    .||.--++                                 |+|||. ....|
T Consensus       227 n~f~YSSSKGtIrLcDmR~~aLCd~hsKlfEepedp~~rsffseiIsSISDvKFs~sGryilsRDyltvk~wD~nme~~p  306 (433)
T KOG1354|consen  227 NVFVYSSSKGTIRLCDMRQSALCDAHSKLFEEPEDPSSRSFFSEIISSISDVKFSHSGRYILSRDYLTVKLWDLNMEAKP  306 (433)
T ss_pred             cEEEEecCCCcEEEeechhhhhhcchhhhhccccCCcchhhHHHHhhhhhceEEccCCcEEEEeccceeEEEeccccCCc
Confidence            4577999999999999974 333    35544444                                 999999 56788


Q ss_pred             eEEecCCCC-----------CCcc---eeEeecCCCCCCceEEEeecCCCceEEEeEccCcC--CCCCCCCCCC--cceE
Q 001070          199 LIILKPHGG-----------QPVN---SAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE--GWSLPTHAES--WKCT  260 (1165)
Q Consensus       199 l~~lephdG-----------~sV~---SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~--~~~~~~~~~~--w~C~  260 (1165)
                      ++++.-|+-           ++|+   ..+|.    | +..+.. +|+-+.-.++++++-+.  -+.++...+.  .+-+
T Consensus       307 v~t~~vh~~lr~kLc~lYEnD~IfdKFec~~s----g-~~~~v~-TGsy~n~frvf~~~~gsk~d~tl~asr~~~~~~~~  380 (433)
T KOG1354|consen  307 VETYPVHEYLRSKLCSLYENDAIFDKFECSWS----G-NDSYVM-TGSYNNVFRVFNLARGSKEDFTLEASRKNMKPRKV  380 (433)
T ss_pred             ceEEeehHhHHHHHHHHhhccchhheeEEEEc----C-CcceEe-cccccceEEEecCCCCcceeecccccccCCccccc
Confidence            988888842           3443   34552    3 334345 58899999999965542  2222222221  2222


Q ss_pred             EEEeccCCCCCc----------cccccEEEEEeecCCcEEEEeccCCCcEEEE
Q 001070          261 QTLDLKSSAKPR----------VEEAFFNQVVVLSQAGLLLFANAKKNAIYSV  303 (1165)
Q Consensus       261 QTLe~~~s~~~~----------~~~aff~sV~~~p~a~~ilLan~~r~aIYal  303 (1165)
                      ..++..++...+          .-..-.++.+-+|.-+.|-+|.  -|.+|.+
T Consensus       381 ~k~~~V~~~g~r~~~~~~vd~ldf~kkilh~aWhp~en~ia~aa--tnnlyif  431 (433)
T KOG1354|consen  381 LKLRLVSSSGKRKRDEISVDALDFRKKILHTAWHPKENSIAVAA--TNNLYIF  431 (433)
T ss_pred             ccceeeecCCCccccccccchhhhhhHHHhhccCCccceeeeee--cCceEEe
Confidence            233322211000          1112345667788888776654  4566654


No 308
>PF05694 SBP56:  56kDa selenium binding protein (SBP56);  InterPro: IPR008826 This family consists of several eukaryotic selenium binding proteins as well as three sequences from archaea. The exact function of this protein is unknown although it is thought that SBP56 participates in late stages of intra-Golgi protein transport []. The Lotus japonicus homologue of SBP56, LjSBP is thought to have more than one physiological role and can be implicated in controlling the oxidation/reduction status of target proteins in vesicular Golgi transport [].; GO: 0008430 selenium binding; PDB: 2ECE_A.
Probab=67.35  E-value=23  Score=43.15  Aligned_cols=58  Identities=21%  Similarity=0.267  Sum_probs=39.0

Q ss_pred             cCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEE--EeecCCcEEEEeccCCCcEEEEEee
Q 001070          231 GPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQV--VVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       231 GslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV--~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      |...++|-+||+...            +-+|||.+..      +....+.|  +++|++.+=++..+-...|+-+|-.
T Consensus       218 ~~yG~~l~vWD~~~r------------~~~Q~idLg~------~g~~pLEvRflH~P~~~~gFvg~aLss~i~~~~k~  277 (461)
T PF05694_consen  218 GKYGHSLHVWDWSTR------------KLLQTIDLGE------EGQMPLEVRFLHDPDANYGFVGCALSSSIWRFYKD  277 (461)
T ss_dssp             H-S--EEEEEETTTT------------EEEEEEES-T------TEEEEEEEEE-SSTT--EEEEEEE--EEEEEEEE-
T ss_pred             ccccCeEEEEECCCC------------cEeeEEecCC------CCCceEEEEecCCCCccceEEEEeccceEEEEEEc
Confidence            447899999998665            8999999832      12355566  7999999999999999999999884


No 309
>COG5354 Uncharacterized protein, contains Trp-Asp (WD) repeat [General function prediction only]
Probab=65.10  E-value=71  Score=39.55  Aligned_cols=121  Identities=21%  Similarity=0.273  Sum_probs=77.7

Q ss_pred             CceeecC-CceEEe-cccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEE-----eecCCcEEEEeCcc--h
Q 001070          107 YGKRVFG-DYVAYD-VDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCY-----GLKGGNVRVLNLNT--A  177 (1165)
Q Consensus       107 ~Gr~l~g-~~~~~d-Vd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIay-----G~kdg~IRVwdi~t--~  177 (1165)
                      ++-||.| +-.+|+ -+.-.+++..  .|.+.-|+.|.+-|.-        |+.-|||     +-+++++|||.|-.  .
T Consensus       145 y~ARvv~~sl~i~e~t~n~~~~p~~--~lr~~gi~dFsisP~~--------n~~~la~~tPEk~~kpa~~~i~sIp~~s~  214 (561)
T COG5354         145 YVARVVGSSLYIHEITDNIEEHPFK--NLRPVGILDFSISPEG--------NHDELAYWTPEKLNKPAMVRILSIPKNSV  214 (561)
T ss_pred             hhhhhccCeEEEEecCCccccCchh--hccccceeeEEecCCC--------CCceEEEEccccCCCCcEEEEEEccCCCe
Confidence            5666755 556677 3444455553  7888888899888843        6667888     66789999999973  2


Q ss_pred             h--hHhhcCCcc------------------------------EEEeecCC-CceeEEecCCCCCCcceeEeecCCCCCCc
Q 001070          178 T--RSLLRGHTK------------------------------IKIWEDSK-VAPLIILKPHGGQPVNSAQYLTAPNQAGH  224 (1165)
Q Consensus       178 i--r~llrGH~q------------------------------VriWD~~~-g~pl~~lephdG~sV~SVaFl~aP~~~d~  224 (1165)
                      +  +.||+--..                              .+|.+++. .+||+.. -  -.+|.+++|  .|.+.  
T Consensus       215 l~tk~lfk~~~~qLkW~~~g~~ll~l~~t~~ksnKsyfgesnLyl~~~~e~~i~V~~~-~--~~pVhdf~W--~p~S~--  287 (561)
T COG5354         215 LVTKNLFKVSGVQLKWQVLGKYLLVLVMTHTKSNKSYFGESNLYLLRITERSIPVEKD-L--KDPVHDFTW--EPLSS--  287 (561)
T ss_pred             eeeeeeEeecccEEEEecCCceEEEEEEEeeecccceeccceEEEEeecccccceecc-c--cccceeeee--cccCC--
Confidence            2  223322211                              33444442 2344431 1  138999999  56653  


Q ss_pred             eEEEeecCCCceEEEeEccC
Q 001070          225 IILVTAGPLNREVKLWASAS  244 (1165)
Q Consensus       225 ~~lvtsGslnrtIKLW~~a~  244 (1165)
                      +|.|.+|.....+-++|+.+
T Consensus       288 ~F~vi~g~~pa~~s~~~lr~  307 (561)
T COG5354         288 RFAVISGYMPASVSVFDLRG  307 (561)
T ss_pred             ceeEEecccccceeeccccc
Confidence            57888999999999999844


No 310
>PRK04043 tolB translocation protein TolB; Provisional
Probab=65.04  E-value=74  Score=38.26  Aligned_cols=98  Identities=10%  Similarity=0.087  Sum_probs=51.2

Q ss_pred             CccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          185 HTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       185 H~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                      +.+|.++|..+|..-.... ..| .+.+..|  +|||.. ..+..+-..+..|-+++++++            ...+ |.
T Consensus       212 ~~~Iyv~dl~tg~~~~lt~-~~g-~~~~~~~--SPDG~~-la~~~~~~g~~~Iy~~dl~~g------------~~~~-LT  273 (419)
T PRK04043        212 KPTLYKYNLYTGKKEKIAS-SQG-MLVVSDV--SKDGSK-LLLTMAPKGQPDIYLYDTNTK------------TLTQ-IT  273 (419)
T ss_pred             CCEEEEEECCCCcEEEEec-CCC-cEEeeEE--CCCCCE-EEEEEccCCCcEEEEEECCCC------------cEEE-cc
Confidence            3348888888776433332 223 3455678  576644 212222233456666676443            2222 22


Q ss_pred             ccCCCCCccccccEEEEEeecCCcEE-EEeccC-CCcEEEEEeecC
Q 001070          265 LKSSAKPRVEEAFFNQVVVLSQAGLL-LFANAK-KNAIYSVHLGYG  308 (1165)
Q Consensus       265 ~~~s~~~~~~~aff~sV~~~p~a~~i-lLan~~-r~aIYalhl~~g  308 (1165)
                      ..        ......-..+||+++| +++|.. ...||.+.++-|
T Consensus       274 ~~--------~~~d~~p~~SPDG~~I~F~Sdr~g~~~Iy~~dl~~g  311 (419)
T PRK04043        274 NY--------PGIDVNGNFVEDDKRIVFVSDRLGYPNIFMKKLNSG  311 (419)
T ss_pred             cC--------CCccCccEECCCCCEEEEEECCCCCceEEEEECCCC
Confidence            10        1111123578999754 555543 348999999743


No 311
>KOG4849 consensus mRNA cleavage factor I subunit/CPSF subunit [RNA processing and modification]
Probab=64.86  E-value=15  Score=43.10  Aligned_cols=13  Identities=38%  Similarity=0.325  Sum_probs=8.4

Q ss_pred             cccCCCCCCCccc
Q 001070            4 QSQSQSPNQNQKQ   16 (1165)
Q Consensus         4 ~~~~~~~~~~~~~   16 (1165)
                      |.-+-.+|-||.+
T Consensus       232 ~P~s~P~N~~~~P  244 (498)
T KOG4849|consen  232 QPTSLPSNLNQAP  244 (498)
T ss_pred             CCCCCCCCcCcCc
Confidence            4455667777765


No 312
>PF06705 SF-assemblin:  SF-assemblin/beta giardin
Probab=64.83  E-value=2.4e+02  Score=31.58  Aligned_cols=37  Identities=14%  Similarity=0.201  Sum_probs=31.0

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITN  824 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~  824 (1165)
                      .|..-|..+|..|+.+.+.|...+..|...|-..|..
T Consensus         9 ~i~e~~~~f~~~le~e~~~Rr~~ee~r~~~i~e~i~~   45 (247)
T PF06705_consen    9 SINERFSGFESDLENEKRQRREQEEQRFQDIKEQIQK   45 (247)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHH
Confidence            3555677799999999999999999999988887766


No 313
>PF14783 BBS2_Mid:  Ciliary BBSome complex subunit 2, middle region
Probab=64.43  E-value=27  Score=35.24  Aligned_cols=54  Identities=19%  Similarity=0.314  Sum_probs=35.7

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEe
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVT  229 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvt  229 (1165)
                      +..+.+.+.+||+++|+|.|+|..            .|+|-+.+           .+.|.+++++|-. +-+-.-||+
T Consensus        48 L~~~~~~~F~Y~l~NGTVGvY~~~------------~RlWRiKS-----------K~~~~~~~~~D~~-gdG~~eLI~  101 (111)
T PF14783_consen   48 LCSLGGGRFAYALANGTVGVYDRS------------QRLWRIKS-----------KNQVTSMAFYDIN-GDGVPELIV  101 (111)
T ss_pred             EEEcCCCEEEEEecCCEEEEEeCc------------ceeeeecc-----------CCCeEEEEEEcCC-CCCceEEEE
Confidence            344555667899999999999873            68888764           2457778877532 222233665


No 314
>PF03938 OmpH:  Outer membrane protein (OmpH-like);  InterPro: IPR005632 This entry includes outer membrane proteins such as OmpH (Skp) among others. OmpH (outer membrane protein H) is a major structural protein of the outer membrane. In Pasteurella multocida it acts as a channel-forming transmembrane porin []. Porins act as molecular sieves to allow the diffusion of small hydrophilic solutes through the outer membrane and also acts as a receptor for bacteriophages and bacteriocins. Porins are highly immunogenic and are conserved in bacterial families, making them attractive vaccine candidates []. The 17kDa protein (Skp, OmpH) of Escherichia coli is a homotrimeric periplasmic chaperone for newly synthesised outer-membrane proteins, the X-ray structure of which has been reported at resolutions of 2.35 A and 2.30 A [, ]. Three hairpin-shaped alpha-helical extensions reach out by approximately 60 A from a trimerisation domain, which is composed of three intersubunit beta-sheets that wind around a central axis. The alpha-helical extensions approach each other at their distal turns, resulting in a fold that resembles a 'three-pronged grasping forcep'. The overall shape of Skp is reminiscent of the cytosolic chaperone prefoldin (IPR009053 from INTERPRO), although it is based on a radically different topology. The peculiar architecture, with apparent plasticity of the prongs and distinct electrostatic and hydrophobic surface properties, supports the recently proposed biochemical mechanism of this chaperone: formation of a Skp(3)-Omp complex protects the outer membrane protein from aggregation during passage through the bacterial periplasm. The ability of Skp to prevent the aggregation of model substrates in vitro is independent of ATP. Skp can interact directly with membrane lipids and lipopolysaccharide. These interactions are needed for efficient Skp-assisted folding of membrane proteins [].; GO: 0051082 unfolded protein binding; PDB: 1SG2_C 1U2M_C.
Probab=63.92  E-value=93  Score=31.86  Aligned_cols=79  Identities=18%  Similarity=0.195  Sum_probs=37.3

Q ss_pred             hHHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHH-------HHHHHHHHhHHHHHHHHHHHHHhHHH
Q 001070          737 AFSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGR-------GIEKAVKASTDALWARFHEENARNEK  809 (1165)
Q Consensus       737 ~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~-------~ieK~lk~eld~L~~R~dEerr~rEa  809 (1165)
                      +|-..-+.++...+|=...+++++++..     ..+|++++...|..       .--+...+++..+.+.++...+..++
T Consensus        27 v~~~~~~~k~~~~~l~~~~~~~~~~l~~-----~~~el~~~~~~l~~~~~~ls~~~~~~~~~~l~~~~~~l~~~~~~~~~  101 (158)
T PF03938_consen   27 VFQESPAGKDAQAKLQEKFKALQKELQA-----KQKELQKLQQKLQSQKATLSEEERQKRQQELQQKEQELQQFQQQAQQ  101 (158)
T ss_dssp             HHHHHHHHHTHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHTTS----SSHHHHHHHHHHHHHHHHHHHHHHHHHH
T ss_pred             HHHhCHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHhhccchhHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            3333334444444444455555555554     23444444443333       22334445555555555555555555


Q ss_pred             HHHHHHHHHHH
Q 001070          810 LLRDRTQQITG  820 (1165)
Q Consensus       810 a~~~RQ~qLL~  820 (1165)
                      ....+.+.++.
T Consensus       102 ~l~~~~~~~~~  112 (158)
T PF03938_consen  102 QLQQEEQELLQ  112 (158)
T ss_dssp             HHHHHHHHHHH
T ss_pred             HHHHHHHHHHH
Confidence            55555555444


No 315
>PF03178 CPSF_A:  CPSF A subunit region;  InterPro: IPR004871 This family includes a region that lies towards the C terminus of the cleavage and polyadenylation specificity factor (CPSF) A (160 kDa) subunit. CPSF is involved in mRNA polyadenylation and binds the AAUAAA conserved sequence in pre-mRNA. CPSF has also been found to be necessary for splicing of single-intron pre-mRNAs []. The function of the aligned region is unknown but may be involved in RNA/DNA binding.; GO: 0003676 nucleic acid binding, 0005634 nucleus; PDB: 2B5M_A 4A0K_C 4A0B_C 3I7L_A 3I8E_A 4A09_A 4A0A_A 3EI4_C 2B5L_A 3I7O_A ....
Probab=63.54  E-value=1.1e+02  Score=34.67  Aligned_cols=152  Identities=14%  Similarity=0.148  Sum_probs=0.0

Q ss_pred             cCceEEEeec----------CCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCce
Q 001070          156 NKHYVCYGLK----------GGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHI  225 (1165)
Q Consensus       156 n~~yIayG~k----------dg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~  225 (1165)
                      +..||+-|..          .|.|.|+++...      +++..|+.       +.--...+| +||+++-      -.++
T Consensus        41 ~~~~ivVGT~~~~~~~~~~~~Gri~v~~i~~~------~~~~~~l~-------~i~~~~~~g-~V~ai~~------~~~~  100 (321)
T PF03178_consen   41 KKEYIVVGTAFNYGEDPEPSSGRILVFEISES------PENNFKLK-------LIHSTEVKG-PVTAICS------FNGR  100 (321)
T ss_dssp             SSEEEEEEEEE--TTSSS-S-EEEEEEEECSS-----------EEE-------EEEEEEESS--EEEEEE------ETTE
T ss_pred             ccCEEEEEecccccccccccCcEEEEEEEEcc------cccceEEE-------EEEEEeecC-cceEhhh------hCCE


Q ss_pred             EEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEe
Q 001070          226 ILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHL  305 (1165)
Q Consensus       226 ~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl  305 (1165)
                      ++++.|   ++|.+|++...            +.+....+        .+.-+.-+.+...+.+|+++|+. ..|+.+.+
T Consensus       101 lv~~~g---~~l~v~~l~~~------------~~l~~~~~--------~~~~~~i~sl~~~~~~I~vgD~~-~sv~~~~~  156 (321)
T PF03178_consen  101 LVVAVG---NKLYVYDLDNS------------KTLLKKAF--------YDSPFYITSLSVFKNYILVGDAM-KSVSLLRY  156 (321)
T ss_dssp             EEEEET---TEEEEEEEETT------------SSEEEEEE--------E-BSSSEEEEEEETTEEEEEESS-SSEEEEEE
T ss_pred             EEEeec---CEEEEEEccCc------------ccchhhhe--------ecceEEEEEEeccccEEEEEEcc-cCEEEEEE


Q ss_pred             ecCCCccccccccccccccccceeeeeec-cCC-----CCcceEEEEEeehhhhhh
Q 001070          306 GYGNNSAATRIDYIAEFTVTMPVLSFTGT-IDP-----PSEHIIKLYCVQTQAIQQ  355 (1165)
Q Consensus       306 ~~g~~~~~~r~dyiaeF~v~~PILSft~~-~d~-----~ge~~vq~yCvQtqAIQq  355 (1165)
                      .....    +|.-+++=.-...+.+.... ++.     |-.+.+.+|+....+...
T Consensus       157 ~~~~~----~l~~va~d~~~~~v~~~~~l~d~~~~i~~D~~gnl~~l~~~~~~~~~  208 (321)
T PF03178_consen  157 DEENN----KLILVARDYQPRWVTAAEFLVDEDTIIVGDKDGNLFVLRYNPEIPNS  208 (321)
T ss_dssp             ETTTE-----EEEEEEESS-BEEEEEEEE-SSSEEEEEETTSEEEEEEE-SS-SST
T ss_pred             EccCC----EEEEEEecCCCccEEEEEEecCCcEEEEEcCCCeEEEEEECCCCccc


No 316
>PF11715 Nup160:  Nucleoporin Nup120/160;  InterPro: IPR021717  Nup120 is conserved from fungi to plants to humans, and is homologous with the Nup160 of vertebrates. The nuclear core complex, or NPC, mediates macromolecular transport across the nuclear envelope. Deletion of the NUP120 gene causes clustering of NPCs at one side of the nuclear envelope, moderate nucleolar fragmentation and slower cell growth []. The vertebrate NPC is estimated to contain between 30 and 60 different proteins. most of which are not known. Two important ones in creating the nucleoporin basket are Nup98 and Nup153, and Nup120, in conjunction with Nup 133, interacts with these two and itself plays a role in mRNA export []. Nup160, Nup133, Nup96, and Nup107 are all targets of phosphorylation. The phosphorylation sites are clustered mainly at the N-terminal regions of these proteins, which are predicted to be natively disordered. The entire Nup107-160 subcomplex is stable throughout the cell cycle, thus it seems unlikely that phosphorylation affects interactions within the Nup107-160 subcomplex, but rather that it regulates the association of the subcomplex with the NPC and other proteins []. ; PDB: 3F7F_D 3H7N_D 3HXR_A.
Probab=63.08  E-value=15  Score=44.88  Aligned_cols=99  Identities=17%  Similarity=0.246  Sum_probs=49.8

Q ss_pred             ccEeee---cCceEEEeecCCcEEEEeCcc------hhhHhhcCCcc-EEEeecCCCceeEEecCC--CCCCcceeEeec
Q 001070          150 GRQIAV---NKHYVCYGLKGGNVRVLNLNT------ATRSLLRGHTK-IKIWEDSKVAPLIILKPH--GGQPVNSAQYLT  217 (1165)
Q Consensus       150 GR~IAV---n~~yIayG~kdg~IRVwdi~t------~ir~llrGH~q-VriWD~~~g~pl~~leph--dG~sV~SVaFl~  217 (1165)
                      .+..+|   ++..++.++.||.|-.+.+..      .....+.++.. .+.  .....+.. .+.-  +...+.+++...
T Consensus       148 ~~~~~~~~~~~~~l~v~~~dG~ll~l~~~~~~~~~~~~~~~~~~~~~~~~~--l~g~~~~~-~~~~~~~~~~~~~~~~~~  224 (547)
T PF11715_consen  148 HRLAAVTHDSEANLVVSLQDGGLLRLKRSSGDSDGSVWSEELFNDSSWLRS--LSGLFPWS-YRGDNSSSSVAASLAVSS  224 (547)
T ss_dssp             EEEEEE---SSSBEEEEESSS-EEEEEES----SSS-EE----STHHHHHC--CTTTS-TT----SSSS---EEEEEE--
T ss_pred             CeEEEEEecCCCEEEEEECCCCeEEEECCcccCCCCeeEEEEeCCCchhhh--hhCcCCcc-cccCCCCCCccceEEEec
Confidence            456788   999999999999998888775      12222222221 000  00111111 0000  011233333310


Q ss_pred             -CCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          218 -APNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       218 -aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                       .-++.+  +|+ +-+.|++||||++.++            .|+.|+...
T Consensus       225 ~~~~~~~--~l~-tl~~D~~LRiW~l~t~------------~~~~~~~~~  259 (547)
T PF11715_consen  225 SEINDDT--FLF-TLSRDHTLRIWSLETG------------QCLATIDLL  259 (547)
T ss_dssp             ---ETTT--EEE-EEETTSEEEEEETTTT------------CEEEEEETT
T ss_pred             ceeCCCC--EEE-EEeCCCeEEEEECCCC------------eEEEEeccc
Confidence             112333  344 4779999999999665            999998874


No 317
>KOG1538 consensus Uncharacterized conserved protein WDR10, contains WD40 repeats [General function prediction only]
Probab=62.74  E-value=14  Score=46.55  Aligned_cols=74  Identities=14%  Similarity=0.196  Sum_probs=53.0

Q ss_pred             EEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEE
Q 001070          200 IILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFN  279 (1165)
Q Consensus       200 ~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~  279 (1165)
                      .+|+-..-|+||.|||  .|||..   ||.+  .+..+-|+|...|            .-+|||.        +|+|.++
T Consensus         5 ~~~r~~~~hci~d~af--kPDGsq---L~lA--Ag~rlliyD~ndG------------~llqtLK--------gHKDtVy   57 (1081)
T KOG1538|consen    5 LTWRDKAEHCINDIAF--KPDGTQ---LILA--AGSRLLVYDTSDG------------TLLQPLK--------GHKDTVY   57 (1081)
T ss_pred             hhhhcccccchheeEE--CCCCce---EEEe--cCCEEEEEeCCCc------------ccccccc--------cccceEE
Confidence            4455444579999999  788876   4432  2356778886444            6788998        5999999


Q ss_pred             EEEeecCCcEEEEeccCCCcE
Q 001070          280 QVVVLSQAGLLLFANAKKNAI  300 (1165)
Q Consensus       280 sV~~~p~a~~ilLan~~r~aI  300 (1165)
                      -|+++-+|...--..+.|-.|
T Consensus        58 cVAys~dGkrFASG~aDK~VI   78 (1081)
T KOG1538|consen   58 CVAYAKDGKRFASGSADKSVI   78 (1081)
T ss_pred             EEEEccCCceeccCCCceeEE
Confidence            999999988765555555544


No 318
>COG5178 PRP8 U5 snRNP spliceosome subunit [RNA processing and modification]
Probab=62.14  E-value=4.9  Score=52.60  Aligned_cols=17  Identities=18%  Similarity=0.116  Sum_probs=8.9

Q ss_pred             cccccccCCCccccccc
Q 001070          135 VNPITKYGSDPELLIGR  151 (1165)
Q Consensus       135 v~pIt~Y~sd~~~~~GR  151 (1165)
                      ++|-.+|..|-..++|.
T Consensus        98 dm~s~~~~~Dkrs~lga  114 (2365)
T COG5178          98 DMPSVLTKVDKRSYLGA  114 (2365)
T ss_pred             cchhhhhhhhhHhhhhh
Confidence            34455555555555554


No 319
>KOG0971 consensus Microtubule-associated protein dynactin DCTN1/Glued [Cell cycle control, cell division, chromosome partitioning; Cytoskeleton]
Probab=61.19  E-value=5.4e+02  Score=34.52  Aligned_cols=217  Identities=16%  Similarity=0.233  Sum_probs=0.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHH--------------------HHHHHhHHHHHHH
Q 001070          740 QVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIE--------------------KAVKASTDALWAR  799 (1165)
Q Consensus       740 q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ie--------------------K~lk~eld~L~~R  799 (1165)
                      |+...||.=.++|..|-++||++..  +---.||.....++...+|.                    .++.-++..+..|
T Consensus       263 qleqlqEfkSkim~qqa~Lqrel~r--aR~e~keaqe~ke~~k~emad~ad~iEmaTldKEmAEERaesLQ~eve~lkEr  340 (1243)
T KOG0971|consen  263 QLEQLQEFKSKIMEQQADLQRELKR--ARKEAKEAQEAKERYKEEMADTADAIEMATLDKEMAEERAESLQQEVEALKER  340 (1243)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhHHHHHHHHHHHHHHHHHHHHH


Q ss_pred             HHHHHHh---------------------------------------------HHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          800 FHEENAR---------------------------------------------NEKLLRDRTQQITGLITNLINKDLTASL  834 (1165)
Q Consensus       800 ~dEerr~---------------------------------------------rEaa~~~RQ~qLL~LVS~~LnktL~~nL  834 (1165)
                      +||--..                                             .|+.+..|-.+.+.+-.+.+  +-=..+
T Consensus       341 ~deletdlEILKaEmeekG~~~~~~ss~qfkqlEqqN~rLKdalVrLRDlsA~ek~d~qK~~kelE~k~sE~--~eL~r~  418 (1243)
T KOG0971|consen  341 VDELETDLEILKAEMEEKGSDGQAASSYQFKQLEQQNARLKDALVRLRDLSASEKQDHQKLQKELEKKNSEL--EELRRQ  418 (1243)
T ss_pred             HHHHHHHHHHHHHHHHhcCCCCcccchHHHHHHHHHHHHHHHHHHHHHhcchHHHHHHHHHHHHHHHHhhHH--HHHHHH


Q ss_pred             HHHHHHHHHHhhhhhHhhhhhhHHHHHHHHH-HHHHhhcchhhhHHHHHHHHHHHhHHHHH--HHHHHhhhhhhhHHHHH
Q 001070          835 EKLVKKELAAVGPAIVRTISPSIEKTITSAI-VESFQRGVGDKAVNQLERSVNSRLEATVG--RQIQAQFQTSGKHALQD  911 (1165)
Q Consensus       835 Ek~LKkeV~sVvPAI~~~t~~avekqlss~l-~eslq~~l~dk~vnqLeK~V~s~Lp~aVa--raIq~~vqtsv~qaIqd  911 (1165)
                      -..|++++     .+.+.+..-+.+||.+++ .|-|-.-+.|+-.| ||..| +-|+.+|.  .++..         |.+
T Consensus       419 kE~Lsr~~-----d~aEs~iadlkEQVDAAlGAE~MV~qLtdknln-lEekV-klLeetv~dlEalee---------~~E  482 (1243)
T KOG0971|consen  419 KERLSREL-----DQAESTIADLKEQVDAALGAEEMVEQLTDKNLN-LEEKV-KLLEETVGDLEALEE---------MNE  482 (1243)
T ss_pred             HHHHHHHH-----HHHHHHHHHHHHHHHHhhcHHHHHHHHHhhccC-HHHHH-HHHHHHHHHHHHHHH---------HHH


Q ss_pred             HHHHHhHhhcchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhcCchHHHHHHHHHHHHHHHHHHHHHHHHHHHHh
Q 001070          912 ALKSSVEASVIPAFEKSCKAMFEQVDATFQKGMVEHTTATLQHFESTHSPLALVLRESVNSVSSMAQTLSGEFVDGQRK  990 (1165)
Q Consensus       912 avr~af~stLIPAFE~scq~MFqQV~~~F~rGm~E~~~qlQqq~dSaKtsLv~~L~etIssmaa~q~~LqsEll~lQrQ  990 (1165)
                      .+.++=+....--.|..=             ....++++++++.+++... +-.+.+||--.......|+.++.++..+
T Consensus       483 QL~Esn~ele~DLreEld-------------~~~g~~kel~~r~~aaqet-~yDrdqTI~KfRelva~Lqdqlqe~~dq  547 (1243)
T KOG0971|consen  483 QLQESNRELELDLREELD-------------MAKGARKELQKRVEAAQET-VYDRDQTIKKFRELVAHLQDQLQELTDQ  547 (1243)
T ss_pred             HHHHHHHHHHHHHHHHHH-------------HHhhHHHHHHHHHHHHHHH-HHhHHHHHHHHHHHHHHHHHHHHHHHhh


No 320
>KOG2236 consensus Uncharacterized conserved protein [Function unknown]
Probab=60.92  E-value=19  Score=43.68  Aligned_cols=9  Identities=22%  Similarity=0.294  Sum_probs=3.7

Q ss_pred             CCCCCCCCh
Q 001070           77 TTVVSPNAG   85 (1165)
Q Consensus        77 ~~~~~~~~~   85 (1165)
                      ++++.||++
T Consensus       465 ~~pp~p~~~  473 (483)
T KOG2236|consen  465 PPPPPPNSP  473 (483)
T ss_pred             CCCCCCCCh
Confidence            333344444


No 321
>PRK09752 adhesin; Provisional
Probab=60.63  E-value=9.5  Score=50.78  Aligned_cols=8  Identities=13%  Similarity=0.343  Sum_probs=3.7

Q ss_pred             CCCChHHH
Q 001070           81 SPNAGPQI   88 (1165)
Q Consensus        81 ~~~~~~~~   88 (1165)
                      .|-.|+.|
T Consensus       955 RPEvGsYl  962 (1250)
T PRK09752        955 NAKVGGYL  962 (1250)
T ss_pred             ccccchhh
Confidence            34445544


No 322
>KOG1008 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=59.12  E-value=3.7  Score=51.18  Aligned_cols=49  Identities=27%  Similarity=0.318  Sum_probs=38.5

Q ss_pred             EEEeecCCC--ceeEEecCCC--CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          188 IKIWEDSKV--APLIILKPHG--GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       188 VriWD~~~g--~pl~~lephd--G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      ++|||..++  .|.+.|.=..  ++.+.||+|+     .+++ ||-+|..-|.|+|.|+
T Consensus       131 ~~Iwdi~s~ltvPke~~~fs~~~l~gqns~cwl-----rd~k-lvlaGm~sr~~~ifdl  183 (783)
T KOG1008|consen  131 LKIWDINSLLTVPKESPLFSSSTLDGQNSVCWL-----RDTK-LVLAGMTSRSVHIFDL  183 (783)
T ss_pred             ccceecccccCCCccccccccccccCccccccc-----cCcc-hhhcccccchhhhhhh
Confidence            999999988  6766554332  4578899997     7778 5557999999999997


No 323
>PF04762 IKI3:  IKI3 family;  InterPro: IPR006849 Members of this family are components of the elongator multi-subunit component of a novel RNA polymerase II holoenzyme for transcriptional elongation [].
Probab=58.50  E-value=53  Score=43.61  Aligned_cols=108  Identities=19%  Similarity=0.235  Sum_probs=61.1

Q ss_pred             cCceEEEeec------CCcEEEEeCcchhhHh---hcCCcc----------------------EEEeecCCC----ceeE
Q 001070          156 NKHYVCYGLK------GGNVRVLNLNTATRSL---LRGHTK----------------------IKIWEDSKV----APLI  200 (1165)
Q Consensus       156 n~~yIayG~k------dg~IRVwdi~t~ir~l---lrGH~q----------------------VriWD~~~g----~pl~  200 (1165)
                      ||+|.|...-      -+.|||||+...+.+.   ..|-++                      |-||+= +|    .-.-
T Consensus       220 DG~yFAVss~~~~~~~~R~iRVy~ReG~L~stSE~v~gLe~~l~WrPsG~lIA~~q~~~~~~~VvFfEr-NGLrhgeF~l  298 (928)
T PF04762_consen  220 DGEYFAVSSVEPETGSRRVIRVYSREGELQSTSEPVDGLEGALSWRPSGNLIASSQRLPDRHDVVFFER-NGLRHGEFTL  298 (928)
T ss_pred             CCcEEEEEEEEcCCCceeEEEEECCCceEEeccccCCCccCCccCCCCCCEEEEEEEcCCCcEEEEEec-CCcEeeeEec
Confidence            5666665432      3689999999543332   233333                      566642 33    2122


Q ss_pred             EecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEE
Q 001070          201 ILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQ  280 (1165)
Q Consensus       201 ~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~s  280 (1165)
                      +| .+++..|..++|  ++++   -+|..  -+...|+||-...-          .|-..|.+.|.....       +..
T Consensus       299 ~~-~~~~~~v~~l~W--n~ds---~iLAv--~~~~~vqLWt~~NY----------HWYLKqei~~~~~~~-------~~~  353 (928)
T PF04762_consen  299 RF-DPEEEKVIELAW--NSDS---EILAV--WLEDRVQLWTRSNY----------HWYLKQEIRFSSSES-------VNF  353 (928)
T ss_pred             CC-CCCCceeeEEEE--CCCC---CEEEE--EecCCceEEEeeCC----------EEEEEEEEEccCCCC-------CCc
Confidence            23 234568899999  3443   43443  23445999997332          588999999854332       112


Q ss_pred             EEeecCCcE
Q 001070          281 VVVLSQAGL  289 (1165)
Q Consensus       281 V~~~p~a~~  289 (1165)
                      +.-||...+
T Consensus       354 ~~Wdpe~p~  362 (928)
T PF04762_consen  354 VKWDPEKPL  362 (928)
T ss_pred             eEECCCCCC
Confidence            566676543


No 324
>KOG1920 consensus IkappaB kinase complex, IKAP component [Transcription]
Probab=57.33  E-value=95  Score=41.95  Aligned_cols=100  Identities=22%  Similarity=0.298  Sum_probs=52.9

Q ss_pred             ccEeeecCceEEEeecCCcEEEEeCcchh-----hHhhcCCcc--------------------EEEeecCCCc---eeEE
Q 001070          150 GRQIAVNKHYVCYGLKGGNVRVLNLNTAT-----RSLLRGHTK--------------------IKIWEDSKVA---PLII  201 (1165)
Q Consensus       150 GR~IAVn~~yIayG~kdg~IRVwdi~t~i-----r~llrGH~q--------------------VriWD~~~g~---pl~~  201 (1165)
                      |.-+||  .|.|++..-+.|||||+...+     +...-+|.=                    |.|++=. |-   -+..
T Consensus       207 g~~fAV--s~~~~~~~~RkirV~drEg~Lns~se~~~~l~~~LsWkPsgs~iA~iq~~~sd~~IvffErN-GL~hg~f~l  283 (1265)
T KOG1920|consen  207 GEYFAV--SFVESETGTRKIRVYDREGALNSTSEPVEGLQHSLSWKPSGSLIAAIQCKTSDSDIVFFERN-GLRHGEFVL  283 (1265)
T ss_pred             CcEEEE--EEEeccCCceeEEEecccchhhcccCcccccccceeecCCCCeEeeeeecCCCCcEEEEecC-Ccccccccc
Confidence            334555  355556656899999999433     323333322                    4444321 21   0111


Q ss_pred             ecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEec
Q 001070          202 LKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDL  265 (1165)
Q Consensus       202 lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~  265 (1165)
                      -.|.|-..|..++|.  -+ .+--..+++.-.++.|++|-...=          .|--.|-+.|
T Consensus       284 ~~p~de~~ve~L~Wn--s~-sdiLAv~~~~~e~~~v~lwt~~Ny----------hWYLKq~l~~  334 (1265)
T KOG1920|consen  284 PFPLDEKEVEELAWN--SN-SDILAVVTSNLENSLVQLWTTGNY----------HWYLKQELQF  334 (1265)
T ss_pred             CCcccccchheeeec--CC-CCceeeeecccccceEEEEEecCe----------EEEEEEEEec
Confidence            123332358888883  22 232224555667777999997331          3666666666


No 325
>KOG4227 consensus WD40 repeat protein [General function prediction only]
Probab=56.99  E-value=84  Score=37.85  Aligned_cols=125  Identities=16%  Similarity=0.228  Sum_probs=74.0

Q ss_pred             CceEEEeecCCcEEEEeCcchhhHhhc-----CCcc-------EE------------------EeecCC-CceeEEec-C
Q 001070          157 KHYVCYGLKGGNVRVLNLNTATRSLLR-----GHTK-------IK------------------IWEDSK-VAPLIILK-P  204 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t~ir~llr-----GH~q-------Vr------------------iWD~~~-g~pl~~le-p  204 (1165)
                      ...|++..+-|-+-||||....|.+++     |--|       ++                  .||..+ .|||-.+. -
T Consensus       207 P~Li~~~~~~~G~~~~D~R~~~~~~~~~~~~~~L~~~~~~~M~~~~~~~G~Q~msiRR~~~P~~~D~~S~R~~V~k~D~N  286 (609)
T KOG4227|consen  207 PALILVNSETGGPNVFDRRMQARPVYQRSMFKGLPQENTEWMGSLWSPSGNQFMSIRRGKCPLYFDFISQRCFVLKSDHN  286 (609)
T ss_pred             ceeEEeccccCCCCceeeccccchHHhhhccccCcccchhhhheeeCCCCCeehhhhccCCCEEeeeecccceeEeccCC
Confidence            344445567788999999986665543     3333       11                  345444 34555554 1


Q ss_pred             CCC----CCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe----ccC-------CC
Q 001070          205 HGG----QPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD----LKS-------SA  269 (1165)
Q Consensus       205 hdG----~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe----~~~-------s~  269 (1165)
                      .+|    .-+-|.+|.     .|.  -|.+||-+=-|-||.+        |.+.+.+-.+|.=.    .++       -.
T Consensus       287 ~~GY~N~~T~KS~~F~-----~D~--~v~tGSD~~~i~~Wkl--------P~~~ds~G~~~IG~~~~~~~~~~~i~~~~~  351 (609)
T KOG4227|consen  287 PNGYCNIKTIKSMTFI-----DDY--TVATGSDHWGIHIWKL--------PRANDSYGFTQIGHDEEEMPSEIFIEKELT  351 (609)
T ss_pred             CCcceeeeeeeeeeee-----cce--eeeccCcccceEEEec--------CCCccccCccccCcchhhCchhheecceeE
Confidence            123    367788884     231  3668999999999997        32222222111100    000       01


Q ss_pred             CCccccccEEEEEeecCCcEEEEeccC
Q 001070          270 KPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       270 ~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      ..+||..+.|||-++|...+|+-+-..
T Consensus       352 VLrGHRSv~NQVRF~~H~~~l~SSGVE  378 (609)
T KOG4227|consen  352 VLRGHRSVPNQVRFSQHNNLLVSSGVE  378 (609)
T ss_pred             EEecccccccceeecCCcceEeccchh
Confidence            346899999999999999888766543


No 326
>PF04100 Vps53_N:  Vps53-like, N-terminal ;  InterPro: IPR007234 Vps53 complexes with Vps52 and Vps54 to form a multi-subunit complex involved in regulating membrane trafficking events [].
Probab=56.12  E-value=3.5e+02  Score=32.55  Aligned_cols=85  Identities=19%  Similarity=0.249  Sum_probs=48.6

Q ss_pred             HHHHHhhccCcHHHHHHHHHhcCCHHHHHHHhhccCcccccccCCC-CcchhHH---HHHHHHHhhhccc--------Ch
Q 001070         1030 KELSRLVSDRKYEEAFTTALQRSDVSIVSWLCSQVDMHGLLSMVPL-PLSQGVL---LSLLQQLACDINK--------DT 1097 (1165)
Q Consensus      1030 ~eI~qLI~eGqyEEAF~kALqSsDlsLV~~LcsrvDP~~Lfsl~Pl-pLSQgVL---LSLIQQLSsDL~t--------dt 1097 (1165)
                      .++..++..++|.|+...      +..|..|+..+.|..  +.+.+ .|..-+-   =.|.+|+-.|+..        +.
T Consensus       122 ~qL~~~~~~r~Y~e~a~~------L~av~~L~~~F~~yk--si~~I~~L~~~i~~l~~~L~~qI~~df~~~f~~~~~~~~  193 (383)
T PF04100_consen  122 EQLKELAKKRQYKEIASL------LQAVKELLEHFKPYK--SIPQIAELSKRIDQLQNELKEQIFEDFEELFGSQGDESP  193 (383)
T ss_pred             HHHHHHHHcCCHHHHHHH------HHHHHHHHHHHHccc--CcHHHHHHHHHHHHHHHHHHHHHHHHHHHHhccCCcccc
Confidence            357778888888887654      456777777777643  22222 2222111   1245566555432        11


Q ss_pred             HHHHHHHHHHHHHcCCCCchhHHhH
Q 001070         1098 ARKLAWLTDVAAAINPADPMIAVHA 1122 (1165)
Q Consensus      1098 ~lKL~WLEeal~aLDpsDP~Irehv 1122 (1165)
                      .....=|.+|+..+|.-|+..|+.+
T Consensus       194 ~~~~~~l~~aC~vvd~L~~~~r~~l  218 (383)
T PF04100_consen  194 GQSSQQLSDACLVVDALGPDVREEL  218 (383)
T ss_pred             cchHhHHHHHHHHHHHcCchHHHHH
Confidence            2245667788888888776665544


No 327
>PF04286 DUF445:  Protein of unknown function (DUF445);  InterPro: IPR007383 This entry contains proteins of unknown function. They are predicted to be transmembrane proteins with 2 or 3 TM domains.
Probab=55.51  E-value=3.7e+02  Score=30.77  Aligned_cols=7  Identities=43%  Similarity=0.928  Sum_probs=3.0

Q ss_pred             hhHhhhh
Q 001070          606 VSENREK  612 (1165)
Q Consensus       606 ~~~~~e~  612 (1165)
                      +.++|++
T Consensus        35 ip~~r~~   41 (367)
T PF04286_consen   35 IPKNRER   41 (367)
T ss_pred             ccccHHH
Confidence            3444444


No 328
>KOG4497 consensus Uncharacterized conserved protein WDR8, contains WD repeats [General function prediction only]
Probab=55.20  E-value=28  Score=41.04  Aligned_cols=19  Identities=26%  Similarity=0.358  Sum_probs=16.7

Q ss_pred             CceEEEeecCCcEEEEeCc
Q 001070          157 KHYVCYGLKGGNVRVLNLN  175 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~  175 (1165)
                      +.||+-|+.|+.+||+|-=
T Consensus       222 ~qflavGsyD~~lrvlnh~  240 (447)
T KOG4497|consen  222 NQFLAVGSYDQMLRVLNHF  240 (447)
T ss_pred             cceEEeeccchhhhhhcee
Confidence            7899999999999998853


No 329
>KOG2315 consensus Predicted translation initiation factor related to eIF-3a [Translation, ribosomal structure and biogenesis]
Probab=54.63  E-value=1.1e+02  Score=38.38  Aligned_cols=187  Identities=20%  Similarity=0.315  Sum_probs=111.2

Q ss_pred             ceee-cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccE---eeecCceE-EEeecCCcEEEEeCc-----c-
Q 001070          108 GKRV-FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQ---IAVNKHYV-CYGLKGGNVRVLNLN-----T-  176 (1165)
Q Consensus       108 Gr~l-~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~---IAVn~~yI-ayG~kdg~IRVwdi~-----t-  176 (1165)
                      +-|| .++-..||.+. -.|...  .|-+.=|+.|.=-|    |-+   +||   |+ -.+..-+.+|||-.-     . 
T Consensus       140 ~arlv~nev~f~~~~~-f~~~~~--kl~~~~i~~f~lSp----gp~~~~vAv---yvPe~kGaPa~vri~~~~~~~~~~~  209 (566)
T KOG2315|consen  140 AARLVSNEVQFYDLGS-FKTIQH--KLSVSGITMLSLSP----GPEPPFVAV---YVPEKKGAPASVRIYKYPEEGQHQP  209 (566)
T ss_pred             hhhhhcceEEEEecCC-ccceee--eeeccceeeEEecC----CCCCceEEE---EccCCCCCCcEEEEeccccccccch
Confidence            4455 77778888877 444443  67777777776555    422   554   00 013334789999776     2 


Q ss_pred             -hhhHhhcCCccEEEee-------------cCC-Cc--------eeEEecCCC------CC-CcceeEeecCCCCCCceE
Q 001070          177 -ATRSLLRGHTKIKIWE-------------DSK-VA--------PLIILKPHG------GQ-PVNSAQYLTAPNQAGHII  226 (1165)
Q Consensus       177 -~ir~llrGH~qVriWD-------------~~~-g~--------pl~~lephd------G~-sV~SVaFl~aP~~~d~~~  226 (1165)
                       +.|+.|+.-.-..-|.             +.+ +.        .+-..++|+      ++ +||+|.|  .|++..  |
T Consensus       210 ~a~ksFFkadkvqm~WN~~gt~LLvLastdVDktn~SYYGEq~Lyll~t~g~s~~V~L~k~GPVhdv~W--~~s~~E--F  285 (566)
T KOG2315|consen  210 VANKSFFKADKVQMKWNKLGTALLVLASTDVDKTNASYYGEQTLYLLATQGESVSVPLLKEGPVHDVTW--SPSGRE--F  285 (566)
T ss_pred             hhhccccccceeEEEeccCCceEEEEEEEeecCCCccccccceEEEEEecCceEEEecCCCCCceEEEE--CCCCCE--E
Confidence             5566665544444453             222 11        122222332      22 9999999  576654  7


Q ss_pred             EEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccC--CCcEEEEE
Q 001070          227 LVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK--KNAIYSVH  304 (1165)
Q Consensus       227 lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~--r~aIYalh  304 (1165)
                      .|+-|-.=-++-|+|+               +|.--++|.--..   ...||     +|.+++||||---  +-.|=+.|
T Consensus       286 ~VvyGfMPAkvtifnl---------------r~~~v~df~egpR---N~~~f-----np~g~ii~lAGFGNL~G~mEvwD  342 (566)
T KOG2315|consen  286 AVVYGFMPAKVTIFNL---------------RGKPVFDFPEGPR---NTAFF-----NPHGNIILLAGFGNLPGDMEVWD  342 (566)
T ss_pred             EEEEecccceEEEEcC---------------CCCEeEeCCCCCc---cceEE-----CCCCCEEEEeecCCCCCceEEEe
Confidence            8888999999999998               8888888843221   23454     7999999998433  23444444


Q ss_pred             eecCCCccccccccccccccccceeeeeeccCCCCcce
Q 001070          305 LGYGNNSAATRIDYIAEFTVTMPVLSFTGTIDPPSEHI  342 (1165)
Q Consensus       305 l~~g~~~~~~r~dyiaeF~v~~PILSft~~~d~~ge~~  342 (1165)
                      +..        +.-|+.|.++---+   -.+-||||..
T Consensus       343 v~n--------~K~i~~~~a~~tt~---~eW~PdGe~f  369 (566)
T KOG2315|consen  343 VPN--------RKLIAKFKAANTTV---FEWSPDGEYF  369 (566)
T ss_pred             ccc--------hhhccccccCCceE---EEEcCCCcEE
Confidence            442        44556665543222   1345577764


No 330
>PF07464 ApoLp-III:  Apolipophorin-III precursor (apoLp-III);  InterPro: IPR010009 This family consists of several insect apolipoprotein-III sequences. Exchangeable apolipoproteins constitute a functionally important family of proteins that play critical roles in lipid transport and lipoprotein metabolism. Apolipophorin III (apoLp-III) is a prototypical exchangeable apolipoprotein found in many insect species that functions in transport of diacylglycerol (DAG) from the fat body lipid storage depot to flight muscles in the adult life stage [].; GO: 0008289 lipid binding, 0006869 lipid transport, 0005576 extracellular region; PDB: 1EQ1_A.
Probab=54.52  E-value=1.4e+02  Score=31.81  Aligned_cols=85  Identities=21%  Similarity=0.343  Sum_probs=46.5

Q ss_pred             HHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          753 TMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTA  832 (1165)
Q Consensus       753 ~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~  832 (1165)
                      ..++++++++..++..|-..|+.           ++|+...|.+...|++-...-+.+..+.-..+-.++.+     +..
T Consensus         7 e~~~~~~~~~~~~~~~~~~~Ev~-----------~aik~~sd~~~~~l~~~~~~l~eeik~~n~~~~e~l~~-----~~~   70 (155)
T PF07464_consen    7 EFQKEFQEQVNKLLGSQNQQEVV-----------KAIKEQSDSVAQQLQNVSSSLQEEIKDANPEAEEALKQ-----LKT   70 (155)
T ss_dssp             HHHHHHHHHHHHHTSS--SS-SS-----------HHHHHHHHHHHHHHHHHHHHHHHHHTT-SSTHHHHHHH-----HHH
T ss_pred             HHHHHHHHHHHHHhCCCcHHHHH-----------HHHHHhHHHHHHHHHHHHHHHHHHHHhcChhHHHHHHH-----HHH
Confidence            45788888888888777666654           45667777777777776666666666544334333333     444


Q ss_pred             HHHHHHHHHHHHhhhhhHhhhh
Q 001070          833 SLEKLVKKELAAVGPAIVRTIS  854 (1165)
Q Consensus       833 nLEk~LKkeV~sVvPAI~~~t~  854 (1165)
                      .|+++..+ |..--|.+...+.
T Consensus        71 kl~et~~~-L~k~~Pev~~qa~   91 (155)
T PF07464_consen   71 KLEETAEK-LRKANPEVEKQAN   91 (155)
T ss_dssp             HHHHHHHG-GGG-SHHHHHT-S
T ss_pred             HHHHHHHH-HHhcChHHHHHHH
Confidence            45544422 2222455554443


No 331
>PF02333 Phytase:  Phytase;  InterPro: IPR003431 Phytase (3.1.3.8 from EC) (phytate 3-phosphatase) is a secreted enzyme which hydrolyses phytate to release inorganic phosphate. This family appears to represent a novel enzyme that shows phytase activity () and has been shown to consist of a single structural unit with a six-bladed propeller folding architecture ().; GO: 0016158 3-phytase activity; PDB: 3AMS_A 3AMR_A 1QLG_A 2POO_A 1H6L_A 1CVM_A 1POO_A.
Probab=54.27  E-value=4.4e+02  Score=32.03  Aligned_cols=91  Identities=13%  Similarity=0.168  Sum_probs=58.5

Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccC-cCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCC
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASAS-EEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQA  287 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~-~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a  287 (1165)
                      .+|-+|+..+|.... .++++++. +.++..|.+.. +.|+      -..+-+++|.+.+..|         -+++|.+.
T Consensus       157 e~yGlcly~~~~~g~-~ya~v~~k-~G~~~Qy~L~~~~~g~------v~~~lVR~f~~~sQ~E---------GCVVDDe~  219 (381)
T PF02333_consen  157 EPYGLCLYRSPSTGA-LYAFVNGK-DGRVEQYELTDDGDGK------VSATLVREFKVGSQPE---------GCVVDDET  219 (381)
T ss_dssp             SEEEEEEEE-TTT---EEEEEEET-TSEEEEEEEEE-TTSS------EEEEEEEEEE-SS-EE---------EEEEETTT
T ss_pred             cceeeEEeecCCCCc-EEEEEecC-CceEEEEEEEeCCCCc------EeeEEEEEecCCCcce---------EEEEeccc
Confidence            589999987765433 34555554 46799999853 3232      2357789998855333         67899999


Q ss_pred             cEEEEeccCCCcEEEEEeecCCCccccccc
Q 001070          288 GLLLFANAKKNAIYSVHLGYGNNSAATRID  317 (1165)
Q Consensus       288 ~~ilLan~~r~aIYalhl~~g~~~~~~r~d  317 (1165)
                      ++|.++.-. ..|+.+..+.......+.++
T Consensus       220 g~LYvgEE~-~GIW~y~Aep~~~~~~~~v~  248 (381)
T PF02333_consen  220 GRLYVGEED-VGIWRYDAEPEGGNDRTLVA  248 (381)
T ss_dssp             TEEEEEETT-TEEEEEESSCCC-S--EEEE
T ss_pred             CCEEEecCc-cEEEEEecCCCCCCcceeee
Confidence            999999887 59999887765554333333


No 332
>KOG1645 consensus RING-finger-containing E3 ubiquitin ligase [Posttranslational modification, protein turnover, chaperones]
Probab=53.65  E-value=53  Score=39.66  Aligned_cols=170  Identities=16%  Similarity=0.178  Sum_probs=98.7

Q ss_pred             CceeecCCceEEeccc--CCCCCCCCCC---cccccccccCCCcccccccEe---ee---cCceEEEeecCCcEEEEeCc
Q 001070          107 YGKRVFGDYVAYDVDA--VEEGREPTQQ---LEVNPITKYGSDPELLIGRQI---AV---NKHYVCYGLKGGNVRVLNLN  175 (1165)
Q Consensus       107 ~Gr~l~g~~~~~dVd~--~~~ge~~~pq---lev~pIt~Y~sd~~~~~GR~I---AV---n~~yIayG~kdg~IRVwdi~  175 (1165)
                      .|.+|.|-...++.++  ++-|.+--|-   -.+++-+.--+++..-.|++|   |.   |.-.|..+..+..|.|.|+.
T Consensus       145 ~gcrli~y~~~~s~lv~sQks~qa~lpGvGv~~l~~~~fkssq~lp~~g~~IrdlafSp~~~GLl~~asl~nkiki~dle  224 (463)
T KOG1645|consen  145 AGCRLIGYDESSSTLVVSQKSGQALLPGVGVQKLESHDFKSSQILPGEGSFIRDLAFSPFNEGLLGLASLGNKIKIMDLE  224 (463)
T ss_pred             CCceEEecccccceeeeeccchhhcCCccceEEeccCCcchhhcccccchhhhhhccCccccceeeeeccCceEEEEecc
Confidence            5888866555555544  3333221010   123333444456655566664   32   23356678889999999999


Q ss_pred             c-hhhHhhcCCcc----------------------EEEeecCCC-ceeEEecC-CCCCCcceeEeecCCCC--CCceEEE
Q 001070          176 T-ATRSLLRGHTK----------------------IKIWEDSKV-APLIILKP-HGGQPVNSAQYLTAPNQ--AGHIILV  228 (1165)
Q Consensus       176 t-~ir~llrGH~q----------------------VriWD~~~g-~pl~~lep-hdG~sV~SVaFl~aP~~--~d~~~lv  228 (1165)
                      | .+-..+.-|.+                      |.|+|++.- .|+..+.. -.-++|-+|+.+. |+.  +.+-+|+
T Consensus       225 t~~~vssy~a~~~~wSC~wDlde~h~IYaGl~nG~VlvyD~R~~~~~~~e~~a~~t~~pv~~i~~~~-~n~~f~~gglLv  303 (463)
T KOG1645|consen  225 TSCVVSSYIAYNQIWSCCWDLDERHVIYAGLQNGMVLVYDMRQPEGPLMELVANVTINPVHKIAPVQ-PNKIFTSGGLLV  303 (463)
T ss_pred             cceeeeheeccCCceeeeeccCCcceeEEeccCceEEEEEccCCCchHhhhhhhhccCcceeecccC-ccccccccceEE
Confidence            8 55556666766                      888988752 34444432 1224777777762 221  1122233


Q ss_pred             eecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCC
Q 001070          229 TAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKK  297 (1165)
Q Consensus       229 tsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r  297 (1165)
                       +.+  .-+.-|+...        +.+.|.|+-.++-         ...|.+..+++..+.+|++-..+
T Consensus       304 -~~l--t~l~f~ei~~--------s~~~~p~vlele~---------pG~cismqy~~~snh~l~tyRs~  352 (463)
T KOG1645|consen  304 -FAL--TVLQFYEIVF--------SAECLPCVLELEP---------PGICISMQYHGVSNHLLLTYRSN  352 (463)
T ss_pred             -eee--hhhhhhhhhc--------cccCCCcccccCC---------CcceeeeeecCccceEEEEecCC
Confidence             222  2244566543        3467899777662         35677889999999998876554


No 333
>KOG2391 consensus Vacuolar sorting protein/ubiquitin receptor VPS23 [Posttranslational modification, protein turnover, chaperones; Intracellular trafficking, secretion, and vesicular transport]
Probab=53.52  E-value=24  Score=41.47  Aligned_cols=7  Identities=0%  Similarity=-0.130  Sum_probs=2.6

Q ss_pred             HHHHHHH
Q 001070          819 TGLITNL  825 (1165)
Q Consensus       819 L~LVS~~  825 (1165)
                      |++=.++
T Consensus       265 L~~niDI  271 (365)
T KOG2391|consen  265 LQKNIDI  271 (365)
T ss_pred             HHhhhHH
Confidence            3333333


No 334
>PF06152 Phage_min_cap2:  Phage minor capsid protein 2;  InterPro: IPR009319 This entry is represented by Bacteriophage A118, Gp4, the minor capsid protein. The characteristics of the protein distribution suggest prophage matches in addition to the phage matches.; GO: 0005198 structural molecule activity, 0019028 viral capsid
Probab=53.10  E-value=4.7e+02  Score=31.29  Aligned_cols=23  Identities=17%  Similarity=0.193  Sum_probs=17.6

Q ss_pred             chhhhHHHHHHHHHHHHHHHHHH
Q 001070          769 PVTKEGRRLEASLGRGIEKAVKA  791 (1165)
Q Consensus       769 plsKE~kklE~~L~~~ieK~lk~  791 (1165)
                      ++..-...||..|-..|-+.|++
T Consensus        14 ~i~~ly~~lE~~i~~~i~rri~~   36 (361)
T PF06152_consen   14 QIVDLYQELEQEIIADIIRRIKK   36 (361)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHh
Confidence            44555667888888888888887


No 335
>PF01690 PLRV_ORF5:  Potato leaf roll virus readthrough protein;  InterPro: IPR002929 This family consists mainly of the Potato leafroll virus (PLrV) read through protein otherwise known as the minor capsid protein. This is generated via a readthrough of open reading frame 3, the coat protein, allowing transcription of open reading frame 5 to give an extended coat protein with a large C-terminal addition or read through domain []. The read through protein is essential for the circulative aphid transmission of PLrV [] and Beet western yellows virus []. The N-terminal region of the luteovirus readthrough domain determines virus binding to Buchnera GroEL and is essential for virus persistence in the aphid [].; GO: 0019028 viral capsid
Probab=52.97  E-value=11  Score=45.94  Aligned_cols=26  Identities=27%  Similarity=0.507  Sum_probs=20.8

Q ss_pred             cCCcEEEEecc-CCCcEEEEEeecCCC
Q 001070          285 SQAGLLLFANA-KKNAIYSVHLGYGNN  310 (1165)
Q Consensus       285 p~a~~ilLan~-~r~aIYalhl~~g~~  310 (1165)
                      .+|.|.|+|-+ .|-.=|-.-+.||-+
T Consensus       192 ~~~~f~l~aPpi~K~~kYNY~VSYG~~  218 (465)
T PF01690_consen  192 DDASFFLVAPPIQKTSKYNYVVSYGGY  218 (465)
T ss_pred             CCceEEEecCCcccccccceEEEeccc
Confidence            78888888864 566778888888887


No 336
>PF13360 PQQ_2:  PQQ-like domain; PDB: 3HXJ_B 1YIQ_A 1KV9_A 3Q54_A 2YH3_A 3PRW_A 3P1L_A 3Q7M_A 3Q7O_A 3Q7N_A ....
Probab=51.99  E-value=2.6e+02  Score=29.37  Aligned_cols=25  Identities=20%  Similarity=0.392  Sum_probs=19.3

Q ss_pred             eecCCcEEEEeccCCCcEEEEEeecC
Q 001070          283 VLSQAGLLLFANAKKNAIYSVHLGYG  308 (1165)
Q Consensus       283 ~~p~a~~ilLan~~r~aIYalhl~~g  308 (1165)
                      ...+++.|++.+ +...||++.+.-|
T Consensus       208 ~~~~~~~l~~~~-~~~~l~~~d~~tG  232 (238)
T PF13360_consen  208 PSVDGGTLYVTS-SDGRLYALDLKTG  232 (238)
T ss_dssp             EECCCTEEEEEE-TTTEEEEEETTTT
T ss_pred             ceeeCCEEEEEe-CCCEEEEEECCCC
Confidence            357788888888 7789999887644


No 337
>COG4946 Uncharacterized protein related to the periplasmic component of the Tol biopolymer transport system [Function unknown]
Probab=51.70  E-value=38  Score=41.54  Aligned_cols=72  Identities=15%  Similarity=0.151  Sum_probs=48.8

Q ss_pred             ccccEeee----cCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc--------------------------EEEeecCCC
Q 001070          148 LIGRQIAV----NKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK--------------------------IKIWEDSKV  196 (1165)
Q Consensus       148 ~~GR~IAV----n~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q--------------------------VriWD~~~g  196 (1165)
                      .+|+-.||    ||||++-+-....|.|+||.+ ++|.+=+..+.                          ||++|+.+|
T Consensus       400 ~lg~I~av~vs~dGK~~vvaNdr~el~vididngnv~~idkS~~~lItdf~~~~nsr~iAYafP~gy~tq~Iklydm~~~  479 (668)
T COG4946         400 DLGNIEAVKVSPDGKKVVVANDRFELWVIDIDNGNVRLIDKSEYGLITDFDWHPNSRWIAYAFPEGYYTQSIKLYDMDGG  479 (668)
T ss_pred             CccceEEEEEcCCCcEEEEEcCceEEEEEEecCCCeeEecccccceeEEEEEcCCceeEEEecCcceeeeeEEEEecCCC
Confidence            35776665    799999999999999999998 66655444444                          888888877


Q ss_pred             ceeEEecCCCCCCcceeEeecCCCCCC
Q 001070          197 APLIILKPHGGQPVNSAQYLTAPNQAG  223 (1165)
Q Consensus       197 ~pl~~lephdG~sV~SVaFl~aP~~~d  223 (1165)
                      .-..+-.|. + -=||=||  .|++..
T Consensus       480 Kiy~vTT~t-a-~DfsPaF--D~d~ry  502 (668)
T COG4946         480 KIYDVTTPT-A-YDFSPAF--DPDGRY  502 (668)
T ss_pred             eEEEecCCc-c-cccCccc--CCCCcE
Confidence            544444433 1 2255566  466655


No 338
>PF03022 MRJP:  Major royal jelly protein;  InterPro: IPR003534 The major royal jelly proteins (MRJPs) comprise 12.5% of the mass, and 82-90% of the protein content [], of honeybee (Apis mellifera) royal jelly. Royal jelly is a substance secreted by the cephalic glands of nurse bees [] and it is used to trigger development of a queen bee from a bee larva. The biological function of the MRJPs is unknown, but they are believed to play a major role in nutrition due to their high essential amino acid content []. Two royal jelly proteins, MRJP3 and MRJP5, contain a tandem repeat that results from a high genetic variablility. This polymorphism may be useful for genotyping individual bees [].; PDB: 3Q6P_B 3Q6K_A 3Q6T_A 2QE8_B.
Probab=51.44  E-value=99  Score=35.42  Aligned_cols=113  Identities=16%  Similarity=0.193  Sum_probs=67.5

Q ss_pred             eEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCC-----cEEEEeccCCCcEEEEEeecCCC
Q 001070          236 EVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQA-----GLLLFANAKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       236 tIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a-----~~ilLan~~r~aIYalhl~~g~~  310 (1165)
                      .|-+||+.+.            +-+++++|+.+.-.  ...|++.++++...     +++.++|....+|.++-+..|..
T Consensus        35 KLv~~Dl~t~------------~li~~~~~p~~~~~--~~s~lndl~VD~~~~~~~~~~aYItD~~~~glIV~dl~~~~s  100 (287)
T PF03022_consen   35 KLVAFDLKTN------------QLIRRYPFPPDIAP--PDSFLNDLVVDVRDGNCDDGFAYITDSGGPGLIVYDLATGKS  100 (287)
T ss_dssp             EEEEEETTTT------------CEEEEEE--CCCS---TCGGEEEEEEECTTTTS-SEEEEEEETTTCEEEEEETTTTEE
T ss_pred             EEEEEECCCC------------cEEEEEECChHHcc--cccccceEEEEccCCCCcceEEEEeCCCcCcEEEEEccCCcE
Confidence            5666777544            78999999876542  46899999999853     69999999999999998887544


Q ss_pred             cc------------ccccccccccccccceeeeeecc-CCCCcc-------eEEEEEeehhhhhhhcccccc
Q 001070          311 SA------------ATRIDYIAEFTVTMPVLSFTGTI-DPPSEH-------IIKLYCVQTQAIQQYSLNLFQ  362 (1165)
Q Consensus       311 ~~------------~~r~dyiaeF~v~~PILSft~~~-d~~ge~-------~vq~yCvQtqAIQqy~l~~~~  362 (1165)
                      =.            ......--.|...-.|..+.... ++||+-       .-++|.|=|..++...+....
T Consensus       101 ~Rv~~~~~~~~p~~~~~~i~g~~~~~~dg~~gial~~~~~d~r~LYf~~lss~~ly~v~T~~L~~~~~~~~~  172 (287)
T PF03022_consen  101 WRVLHNSFSPDPDAGPFTIGGESFQWPDGIFGIALSPISPDGRWLYFHPLSSRKLYRVPTSVLRDPSLSDAQ  172 (287)
T ss_dssp             EEEETCGCTTS-SSEEEEETTEEEEETTSEEEEEE-TTSTTS-EEEEEETT-SEEEEEEHHHHCSTT--HHH
T ss_pred             EEEecCCcceeccccceeccCceEecCCCccccccCCCCCCccEEEEEeCCCCcEEEEEHHHhhCccccccc
Confidence            11            00001111233333332222222 235542       257899999998887665444


No 339
>PF04912 Dynamitin:  Dynamitin ;  InterPro: IPR006996 Dynamitin is a subunit of the microtubule-dependent motor complex, it is also implicated in cell adhesion by binding to macrophage-enriched myristoylated alanine-rice C kinase substrate (MacMARCKS) []. It is also thought to modulate cytoplasmic dynein binding to an organelle, and plays a role in prometaphase chromosome alignment and spindle organisation during mitosis. Dynamitin is also involved in anchoring microtubules to centrosomes and may play a role in synapse formation during brain development []. ; GO: 0007017 microtubule-based process, 0005869 dynactin complex
Probab=50.04  E-value=56  Score=38.88  Aligned_cols=51  Identities=20%  Similarity=0.309  Sum_probs=41.4

Q ss_pred             HHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHH
Q 001070          746 DMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHE  802 (1165)
Q Consensus       746 ~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dE  802 (1165)
                      ..|.+|=..|.+|+++|..     |.+-+++||..+..+++ .|+++|..|-.||+.
T Consensus       336 ~~l~~le~~q~~l~~~l~~-----~~~~L~~ve~~~~~N~~-~i~~n~~~le~Ri~~  386 (388)
T PF04912_consen  336 QTLSELESQQSDLQSQLKK-----WEELLNKVEEKFKENME-TIEKNVKKLEERIAK  386 (388)
T ss_pred             HHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHhc
Confidence            4677777888888888887     88888999999888887 477788888888764


No 340
>PF10691 DUF2497:  Protein of unknown function (DUF2497) ;  InterPro: IPR019632  Members of this family belong to the Alphaproteobacteria. The function of the family is not known. 
Probab=49.56  E-value=50  Score=31.06  Aligned_cols=28  Identities=18%  Similarity=0.549  Sum_probs=24.1

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHh
Q 001070          818 ITGLITNLINKDLTASLEKLVKKELAAV  845 (1165)
Q Consensus       818 LL~LVS~~LnktL~~nLEk~LKkeV~sV  845 (1165)
                      |-=|+.+-|++||+..||+.|++||..+
T Consensus        43 LRPmLkeWLD~nLP~lVErlVr~EIeRi   70 (73)
T PF10691_consen   43 LRPMLKEWLDENLPGLVERLVREEIERI   70 (73)
T ss_pred             HHHHHHHHHHhccHHHHHHHHHHHHHHH
Confidence            3348889999999999999999999843


No 341
>KOG4368 consensus Predicted RNA binding protein, contains SWAP, RPR and G-patch domains [General function prediction only]
Probab=49.37  E-value=6.8e+02  Score=32.08  Aligned_cols=30  Identities=17%  Similarity=0.154  Sum_probs=20.6

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHhhhc
Q 001070          929 CKAMFEQVDATFQKGMVEHTTATLQHFEST  958 (1165)
Q Consensus       929 cq~MFqQV~~~F~rGm~E~~~qlQqq~dSa  958 (1165)
                      .+..|++--.+++++..++.+++|++++..
T Consensus       255 ~~~~~~~~~~~~~~qh~~~~q~~q~q~~~~  284 (757)
T KOG4368|consen  255 VQLAFQQQIQTLKTQHEEFVQQQQQQMPQM  284 (757)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHhhHHH
Confidence            344566666777788888888887776543


No 342
>KOG1912 consensus WD40 repeat protein [General function prediction only]
Probab=49.02  E-value=1e+02  Score=40.06  Aligned_cols=56  Identities=14%  Similarity=0.164  Sum_probs=38.2

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE  246 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~  246 (1165)
                      |-|||...+.-+--+.+| .++|..++|+  |.+.+-+.++..=..-.+|.||+..+|+
T Consensus        91 Iil~d~~~~s~~~~l~~~-~~~~qdl~W~--~~rd~Srd~LlaIh~ss~lvLwntdtG~  146 (1062)
T KOG1912|consen   91 IILVDFVLASVINWLSHS-NDSVQDLCWV--PARDDSRDVLLAIHGSSTLVLWNTDTGE  146 (1062)
T ss_pred             EEEEEehhhhhhhhhcCC-Ccchhheeee--eccCcchheeEEecCCcEEEEEEccCCc
Confidence            889999988744455555 5799999998  4444432233334445689999887775


No 343
>KOG3621 consensus WD40 repeat-containing protein [General function prediction only]
Probab=48.07  E-value=67  Score=41.06  Aligned_cols=131  Identities=18%  Similarity=0.235  Sum_probs=86.6

Q ss_pred             cEeeecCceEEEeecCCcEEEEeCcc-hhhHhhc--CCcc---------------------EEEeecCCCce--eEEecC
Q 001070          151 RQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLR--GHTK---------------------IKIWEDSKVAP--LIILKP  204 (1165)
Q Consensus       151 R~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llr--GH~q---------------------VriWD~~~g~p--l~~lep  204 (1165)
                      +-++.+++|||-|+.-|.+-++++++ ..|.+--  +|..                     |-|+...++.|  +..+.|
T Consensus        39 Tc~dst~~~l~~GsS~G~lyl~~R~~~~~~~~~~~~~~~~~~~~~vs~~e~lvAagt~~g~V~v~ql~~~~p~~~~~~t~  118 (726)
T KOG3621|consen   39 TCVDATEEYLAMGSSAGSVYLYNRHTGEMRKLKNEGATGITCVRSVSSVEYLVAAGTASGRVSVFQLNKELPRDLDYVTP  118 (726)
T ss_pred             EEeecCCceEEEecccceEEEEecCchhhhcccccCccceEEEEEecchhHhhhhhcCCceEEeehhhccCCCcceeecc
Confidence            44677899999999999999999999 5555444  4555                     66666666544  444444


Q ss_pred             CC---CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcce-EEEEeccCCCCCccccccEEE
Q 001070          205 HG---GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKC-TQTLDLKSSAKPRVEEAFFNQ  280 (1165)
Q Consensus       205 hd---G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C-~QTLe~~~s~~~~~~~aff~s  280 (1165)
                      .|   +..|.+++|  .+|++-   +. +|.--.+|.+-.|++..         .+.| .|+|--        ++.-  -
T Consensus       119 ~d~~~~~rVTal~W--s~~~~k---~y-sGD~~Gkv~~~~L~s~~---------~~~~~~q~il~--------~ds~--I  173 (726)
T KOG3621|consen  119 CDKSHKCRVTALEW--SKNGMK---LY-SGDSQGKVVLTELDSRQ---------AFLSKSQEILS--------EDSE--I  173 (726)
T ss_pred             ccccCCceEEEEEe--cccccE---Ee-ecCCCceEEEEEechhh---------hhccccceeec--------cCcc--e
Confidence            43   568999999  466644   44 68777788877775521         1122 233331        1111  3


Q ss_pred             EEeecCCcEEEEeccCCCcEEEEEee
Q 001070          281 VVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       281 V~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      |.+|---++||+|+-+|--+.-.+.+
T Consensus       174 VQlD~~q~~LLVStl~r~~Lc~tE~e  199 (726)
T KOG3621|consen  174 VQLDYLQSYLLVSTLTRCILCQTEAE  199 (726)
T ss_pred             EEeecccceehHhhhhhhheeecchh
Confidence            56788889999999988777655444


No 344
>KOG4640 consensus Anaphase-promoting complex (APC), subunit 4 [Cell cycle control, cell division, chromosome partitioning; Posttranslational modification, protein turnover, chaperones]
Probab=47.40  E-value=16  Score=45.88  Aligned_cols=50  Identities=16%  Similarity=0.347  Sum_probs=35.0

Q ss_pred             Cceee---cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc
Q 001070          107 YGKRV---FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       107 ~Gr~l---~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t  176 (1165)
                      +|..|   ---+.+.+++.  |||      +|+  +-|-|.|          |||+||-|.+||.||+.|+.+
T Consensus        41 ~gelli~R~n~qRlwtip~--p~~------~v~--~sL~W~~----------DGkllaVg~kdG~I~L~Dve~   93 (665)
T KOG4640|consen   41 KGELLIHRLNWQRLWTIPI--PGE------NVT--ASLCWRP----------DGKLLAVGFKDGTIRLHDVEK   93 (665)
T ss_pred             CCcEEEEEeccceeEeccC--CCC------ccc--eeeeecC----------CCCEEEEEecCCeEEEEEccC
Confidence            67444   11577777765  344      344  6777877          677777899999999998765


No 345
>COG3851 UhpB Signal transduction histidine kinase, glucose-6-phosphate specific [Signal transduction mechanisms]
Probab=46.97  E-value=2e+02  Score=34.83  Aligned_cols=28  Identities=29%  Similarity=0.275  Sum_probs=18.9

Q ss_pred             HHHHHHHHHhHHHHHHHHHHHHHHHHHH
Q 001070          797 WARFHEENARNEKLLRDRTQQITGLITN  824 (1165)
Q Consensus       797 ~~R~dEerr~rEaa~~~RQ~qLL~LVS~  824 (1165)
                      -+|+.|-|.+-+++.+.||.=--++||.
T Consensus       271 IqrlrelnqrL~~EL~~~raLaeqList  298 (497)
T COG3851         271 IQRLRELNQRLQKELARNRALAEQLIST  298 (497)
T ss_pred             HHHHHHHHHHHHHHHHHhHHHHHHHHhh
Confidence            4567777777777777777655566666


No 346
>PRK14142 heat shock protein GrpE; Provisional
Probab=46.73  E-value=1.1e+02  Score=34.40  Aligned_cols=45  Identities=16%  Similarity=0.230  Sum_probs=30.1

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      ++.++|+++.+|.+.++..-      +.-.+-+++.++|  .+-+|||++|+.
T Consensus        58 R~~AEfEN~RKR~erE~e~~------~~~A~e~~~kdLL--pVlDnLERAL~~  102 (223)
T PRK14142         58 RVQADFANYRKRALRDQQAA------ADRAKASVVSQLL--GVLDDLERARKH  102 (223)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--chHhHHHHHHhc
Confidence            55688889988888766332      3444455555555  566889998854


No 347
>PRK14163 heat shock protein GrpE; Provisional
Probab=46.60  E-value=2.2e+02  Score=31.95  Aligned_cols=46  Identities=9%  Similarity=0.237  Sum_probs=29.5

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      .++.++|+++.+|.+.++..-      +.-.+-+++.++|  .+-++||+.|..
T Consensus        64 lR~~AEfeN~rkR~~kE~e~~------~~~a~~~~~~~LL--pVlDnLerAl~~  109 (214)
T PRK14163         64 QRLQAEYQNYRRRVERDRVTV------KEIAVANLLSELL--PVLDDVGRAREH  109 (214)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hhHhHHHHHHhc
Confidence            356689999999988876433      2333444444444  455888888764


No 348
>KOG0280 consensus Uncharacterized conserved protein [Amino acid transport and metabolism]
Probab=46.36  E-value=57  Score=38.07  Aligned_cols=78  Identities=12%  Similarity=0.164  Sum_probs=47.8

Q ss_pred             EEEeecCCcEEEEeCcc-hhhH--hhcCCcc-----------------------EEEeecC-CCceeEE-ecCCCCCCcc
Q 001070          160 VCYGLKGGNVRVLNLNT-ATRS--LLRGHTK-----------------------IKIWEDS-KVAPLII-LKPHGGQPVN  211 (1165)
Q Consensus       160 IayG~kdg~IRVwdi~t-~ir~--llrGH~q-----------------------VriWD~~-~g~pl~~-lephdG~sV~  211 (1165)
                      |+.+..+|.|-+.+... .+..  ..++|+-                       ++.||.| .+..+-+ -+-|+ --|.
T Consensus       136 i~vs~s~G~~~~v~~t~~~le~vq~wk~He~E~Wta~f~~~~pnlvytGgDD~~l~~~D~R~p~~~i~~n~kvH~-~GV~  214 (339)
T KOG0280|consen  136 IFVSDSRGSISGVYETEMVLEKVQTWKVHEFEAWTAKFSDKEPNLVYTGGDDGSLSCWDIRIPKTFIWHNSKVHT-SGVV  214 (339)
T ss_pred             EEEEcCCCcEEEEecceeeeeecccccccceeeeeeecccCCCceEEecCCCceEEEEEecCCcceeeecceeee-cceE
Confidence            44566677777666665 5555  6677765                       8888888 3322211 22332 1366


Q ss_pred             eeEeecCCCCCCceEEEeecCCCceEEEeEcc
Q 001070          212 SAQYLTAPNQAGHIILVTAGPLNREVKLWASA  243 (1165)
Q Consensus       212 SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a  243 (1165)
                      |+-=  +|..|.   .|..|+-|-+|++||.-
T Consensus       215 SI~s--s~~~~~---~I~TGsYDe~i~~~DtR  241 (339)
T KOG0280|consen  215 SIYS--SPPKPT---YIATGSYDECIRVLDTR  241 (339)
T ss_pred             EEec--CCCCCc---eEEEeccccceeeeehh
Confidence            6554  455444   34569999999999984


No 349
>PF15450 DUF4631:  Domain of unknown function (DUF4631)
Probab=45.98  E-value=7.2e+02  Score=31.41  Aligned_cols=82  Identities=17%  Similarity=0.259  Sum_probs=50.2

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHhhh---hcccchhhhHHHHHHHHHHH------HHHHHHHhHHHHHHHHHHHHHhHHHH
Q 001070          740 QVIAMQDMLNQLMTMQKELQKQMSN---LVTLPVTKEGRRLEASLGRG------IEKAVKASTDALWARFHEENARNEKL  810 (1165)
Q Consensus       740 q~~~mq~~l~ql~~~qke~qkqm~~---~v~~plsKE~kklE~~L~~~------ieK~lk~eld~L~~R~dEerr~rEaa  810 (1165)
                      .++.||.-++.+   =.||.+.|..   -.-.-+-|-+-.||.++.+.      .++.+..|++.-|++|++-...+=.+
T Consensus       168 E~arm~aqi~~l---~eEmS~r~l~reakl~~~lqk~f~alEk~mka~e~~rl~~E~~lreElE~rW~~lq~l~Ee~l~a  244 (531)
T PF15450_consen  168 EVARMQAQITKL---GEEMSLRFLKREAKLCSFLQKSFLALEKRMKAQESSRLRTERSLREELESRWQKLQELTEERLRA  244 (531)
T ss_pred             HHHHHHHHHHHH---HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            466777655554   3344443321   11123444444588888777      88888888999999888777666555


Q ss_pred             HHHHHHHHHHHHHH
Q 001070          811 LRDRTQQITGLITN  824 (1165)
Q Consensus       811 ~~~RQ~qLL~LVS~  824 (1165)
                      .+..++..++-++.
T Consensus       245 l~gq~ev~~~~~~~  258 (531)
T PF15450_consen  245 LQGQQEVGLGGIQS  258 (531)
T ss_pred             HHhhHhhhhhhhhH
Confidence            55556655555544


No 350
>KOG1064 consensus RAVE (regulator of V-ATPase assembly) complex subunit RAV1/DMX protein, WD repeat superfamily [General function prediction only]
Probab=45.97  E-value=29  Score=48.22  Aligned_cols=46  Identities=22%  Similarity=0.377  Sum_probs=31.9

Q ss_pred             EEEeecCCC---ceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEc
Q 001070          188 IKIWEDSKV---APLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWAS  242 (1165)
Q Consensus       188 VriWD~~~g---~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~  242 (1165)
                      |.+||.-..   .+++  .-||| .+..++|.     |-++.|| +|+-+.+|+|||+
T Consensus      2317 ~~lwDtl~~~~~s~v~--~~H~~-gaT~l~~~-----P~~qlli-sggr~G~v~l~D~ 2365 (2439)
T KOG1064|consen 2317 VCLWDTLLPPMNSLVH--TCHDG-GATVLAYA-----PKHQLLI-SGGRKGEVCLFDI 2365 (2439)
T ss_pred             ccchhcccCcccceee--eecCC-CceEEEEc-----CcceEEE-ecCCcCcEEEeeh
Confidence            667776431   2355  56664 78888994     4556445 7889999999996


No 351
>KOG2394 consensus WD40 protein DMR-N9 [General function prediction only]
Probab=45.96  E-value=26  Score=43.31  Aligned_cols=51  Identities=12%  Similarity=0.147  Sum_probs=36.1

Q ss_pred             CcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeec
Q 001070          209 PVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLS  285 (1165)
Q Consensus       209 sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p  285 (1165)
                      -.-+|+|.     ||++|+|||| -|-=|.+|.....+            -+  -++      -+|+..++.|++||
T Consensus       334 GLLCvcWS-----PDGKyIvtGG-EDDLVtVwSf~erR------------VV--ARG------qGHkSWVs~VaFDp  384 (636)
T KOG2394|consen  334 GLLCVCWS-----PDGKYIVTGG-EDDLVTVWSFEERR------------VV--ARG------QGHKSWVSVVAFDP  384 (636)
T ss_pred             ceEEEEEc-----CCccEEEecC-CcceEEEEEeccce------------EE--Eec------cccccceeeEeecc
Confidence            46789994     5557688855 67789999985542            11  112      27999999999997


No 352
>PF07569 Hira:  TUP1-like enhancer of split;  InterPro: IPR011494 The Hira proteins are found in a range of eukaryotes and are implicated in the assembly of repressive chromatin. These proteins also contain IPR001680 from INTERPRO.; GO: 0006355 regulation of transcription, DNA-dependent, 0005634 nucleus
Probab=45.18  E-value=57  Score=35.97  Aligned_cols=58  Identities=22%  Similarity=0.335  Sum_probs=38.7

Q ss_pred             ccccccE---eeecCceEEEeecCCcEEEEeCcc--------hhhHhhc--------CCccEEEeec-CCCceeEEec
Q 001070          146 ELLIGRQ---IAVNKHYVCYGLKGGNVRVLNLNT--------ATRSLLR--------GHTKIKIWED-SKVAPLIILK  203 (1165)
Q Consensus       146 ~~~~GR~---IAVn~~yIayG~kdg~IRVwdi~t--------~ir~llr--------GH~qVriWD~-~~g~pl~~le  203 (1165)
                      .+.+|-.   +..+|+||+--..+|+++|||+.+        .+-.+|.        .+..|+--.+ .+|.|+..+.
T Consensus         8 ~i~Lgs~~~~l~~~~~~Ll~iT~~G~l~vWnl~~~k~~~~~~Si~pll~~~~~~~~~~~~~i~~~~lt~~G~PiV~ls   85 (219)
T PF07569_consen    8 PIVLGSPVSFLECNGSYLLAITSSGLLYVWNLKKGKAVLPPVSIAPLLNSSPVSDKSSSPNITSCSLTSNGVPIVTLS   85 (219)
T ss_pred             cEecCCceEEEEeCCCEEEEEeCCCeEEEEECCCCeeccCCccHHHHhcccccccCCCCCcEEEEEEcCCCCEEEEEe
Confidence            3444444   455899999999999999999996        3334564        3333443333 4578888875


No 353
>PF07433 DUF1513:  Protein of unknown function (DUF1513);  InterPro: IPR008311 There are currently no experimental data for members of this group or their homologues, nor do they exhibit features indicative of any function.
Probab=44.48  E-value=1.2e+02  Score=35.53  Aligned_cols=85  Identities=11%  Similarity=0.132  Sum_probs=52.2

Q ss_pred             EEEeecCCCceeEEecCCCCCCcc-eeEeecCCCCCCceEEEee----cCCCceEEEeEccCcCCCCCCCCCCCcceEEE
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVN-SAQYLTAPNQAGHIILVTA----GPLNREVKLWASASEEGWSLPTHAESWKCTQT  262 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~-SVaFl~aP~~~d~~~lvts----GslnrtIKLW~~a~~~~~~~~~~~~~w~C~QT  262 (1165)
                      ..|||.++|..++++.+.+|.--| ..+|.     +|++.|.|+    ...-.-|-+||.+.           ...-+..
T Consensus        30 ~~v~D~~~g~~~~~~~a~~gRHFyGHg~fs-----~dG~~LytTEnd~~~g~G~IgVyd~~~-----------~~~ri~E   93 (305)
T PF07433_consen   30 ALVFDCRTGQLLQRLWAPPGRHFYGHGVFS-----PDGRLLYTTENDYETGRGVIGVYDAAR-----------GYRRIGE   93 (305)
T ss_pred             EEEEEcCCCceeeEEcCCCCCEEecCEEEc-----CCCCEEEEeccccCCCcEEEEEEECcC-----------CcEEEeE
Confidence            668999999888888877664222 34552     444556664    33345688899752           1233333


Q ss_pred             EeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          263 LDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       263 Le~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                      |....--   .|     ++.+.||+..|++||--
T Consensus        94 ~~s~GIG---PH-----el~l~pDG~tLvVANGG  119 (305)
T PF07433_consen   94 FPSHGIG---PH-----ELLLMPDGETLVVANGG  119 (305)
T ss_pred             ecCCCcC---hh-----hEEEcCCCCEEEEEcCC
Confidence            3321111   13     67789999999999864


No 354
>PF14583 Pectate_lyase22:  Oligogalacturonate lyase; PDB: 3C5M_C 3PE7_A.
Probab=44.30  E-value=88  Score=37.74  Aligned_cols=71  Identities=21%  Similarity=0.314  Sum_probs=38.7

Q ss_pred             Cceee------cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhh
Q 001070          107 YGKRV------FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATR  179 (1165)
Q Consensus       107 ~Gr~l------~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir  179 (1165)
                      +|++|      .|.+.+|-+|. .-||+-  |     +|...-+.  ..|-.++.++++|+|--.++.++-+|++| ..|
T Consensus        46 dG~kllF~s~~dg~~nly~lDL-~t~~i~--Q-----LTdg~g~~--~~g~~~s~~~~~~~Yv~~~~~l~~vdL~T~e~~  115 (386)
T PF14583_consen   46 DGRKLLFASDFDGNRNLYLLDL-ATGEIT--Q-----LTDGPGDN--TFGGFLSPDDRALYYVKNGRSLRRVDLDTLEER  115 (386)
T ss_dssp             TS-EEEEEE-TTSS-EEEEEET-TT-EEE--E--------SS-B---TTT-EE-TTSSEEEEEETTTEEEEEETTT--EE
T ss_pred             CCCEEEEEeccCCCcceEEEEc-ccCEEE--E-----CccCCCCC--ccceEEecCCCeEEEEECCCeEEEEECCcCcEE
Confidence            68777      24677888887 444443  4     34433222  22667888899999965567888899998 555


Q ss_pred             HhhcCCcc
Q 001070          180 SLLRGHTK  187 (1165)
Q Consensus       180 ~llrGH~q  187 (1165)
                      .+.+=.+.
T Consensus       116 ~vy~~p~~  123 (386)
T PF14583_consen  116 VVYEVPDD  123 (386)
T ss_dssp             EEEE--TT
T ss_pred             EEEECCcc
Confidence            55444443


No 355
>PF11768 DUF3312:  Protein of unknown function (DUF3312);  InterPro: IPR024511 This is a eukaryotic family of uncharacterised proteins that contain WD40 repeats.
Probab=44.25  E-value=46  Score=41.53  Aligned_cols=62  Identities=16%  Similarity=0.247  Sum_probs=40.1

Q ss_pred             cCceEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNR  235 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnr  235 (1165)
                      +...++-|.+||.|++||..+.+-.+.      +     .           +=.+..++|  .|+|   -+++ -|+.-.
T Consensus       270 ~E~kLvlGC~DgSiiLyD~~~~~t~~~------k-----a-----------~~~P~~iaW--Hp~g---ai~~-V~s~qG  321 (545)
T PF11768_consen  270 SEDKLVLGCEDGSIILYDTTRGVTLLA------K-----A-----------EFIPTLIAW--HPDG---AIFV-VGSEQG  321 (545)
T ss_pred             ccceEEEEecCCeEEEEEcCCCeeeee------e-----e-----------cccceEEEE--cCCC---cEEE-EEcCCc
Confidence            467788888899988888865422211      0     0           113556667  4444   3244 477889


Q ss_pred             eEEEeEccCc
Q 001070          236 EVKLWASASE  245 (1165)
Q Consensus       236 tIKLW~~a~~  245 (1165)
                      +|++||.|..
T Consensus       322 elQ~FD~ALs  331 (545)
T PF11768_consen  322 ELQCFDMALS  331 (545)
T ss_pred             eEEEEEeecC
Confidence            9999999875


No 356
>KOG4673 consensus Transcription factor TMF, TATA element modulatory factor [Transcription]
Probab=44.01  E-value=8.8e+02  Score=31.80  Aligned_cols=136  Identities=20%  Similarity=0.288  Sum_probs=78.4

Q ss_pred             HHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHH---HHH------HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHH
Q 001070          748 LNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGR---GIE------KAVKASTDALWARFHEENARNEKLLRDRTQQI  818 (1165)
Q Consensus       748 l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~---~ie------K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qL  818 (1165)
                      |.+.+.-..||.|+...-| --+.-|++|.+.-+++   .|.      .++.+.+|..|.-++.++|..+...++|++-+
T Consensus       507 lk~il~~Kee~Ek~~~E~I-~k~~ae~~rq~~~~~~sr~~~~~le~~~~a~qat~d~a~~Dlqk~nrlkQdear~~~~~l  585 (961)
T KOG4673|consen  507 LKSILRDKEETEKLLQETI-EKHQAELTRQKDYYSNSRALAAALEAQALAEQATNDEARSDLQKENRLKQDEARERESML  585 (961)
T ss_pred             HHHHhhhHHHHHHHHHHHH-HHHHHHHHHHHHhhhhHHHHHHHHHHHHHHHHHhhhhhhhhHHHHhhhhhhHHHHHHHHH
Confidence            3444555566666554421 1123344555544443   221      45677788888888888888877888888888


Q ss_pred             HHHHHHHHHHHHHH------HHHHHHHHHHH--------------HhhhhhHhhhhhhHHHHHHHHHHHHHhhcchhh--
Q 001070          819 TGLITNLINKDLTA------SLEKLVKKELA--------------AVGPAIVRTISPSIEKTITSAIVESFQRGVGDK--  876 (1165)
Q Consensus       819 L~LVS~~LnktL~~------nLEk~LKkeV~--------------sVvPAI~~~t~~avekqlss~l~eslq~~l~dk--  876 (1165)
                      ..-|++ |-.+|..      .=|-.++.||.              .++..|..+|.+-| .||     ++||.+++..  
T Consensus       586 vqqv~d-LR~~L~~~Eq~aarrEd~~R~Ei~~LqrRlqaaE~R~eel~q~v~~TTrPLl-RQI-----E~lQ~tl~~~~t  658 (961)
T KOG4673|consen  586 VQQVED-LRQTLSKKEQQAARREDMFRGEIEDLQRRLQAAERRCEELIQQVPETTRPLL-RQI-----EALQETLSKAAT  658 (961)
T ss_pred             HHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhccccccHHH-HHH-----HHHHHHHhhhhh
Confidence            887777 4444433      33444555554              34555556666544 333     2355555422  


Q ss_pred             hHHHHHHHHHHHhHH
Q 001070          877 AVNQLERSVNSRLEA  891 (1165)
Q Consensus       877 ~vnqLeK~V~s~Lp~  891 (1165)
                      +-+..|+.|..+|-+
T Consensus       659 awereE~~l~~rL~d  673 (961)
T KOG4673|consen  659 AWEREERSLNERLSD  673 (961)
T ss_pred             HHHHHHHHHHHhhhh
Confidence            256777888888773


No 357
>KOG1334 consensus WD40 repeat protein [General function prediction only]
Probab=43.17  E-value=61  Score=39.92  Aligned_cols=99  Identities=13%  Similarity=0.229  Sum_probs=67.0

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      |-+||..++.++.+|+...-+.|.-.-|+  |...+.- ++ +.+-|+.+++-.+.           +++.|..|..+  
T Consensus       166 vv~WdW~~~~~~l~f~SGH~~NvfQaKFi--P~s~d~t-i~-~~s~dgqvr~s~i~-----------~t~~~e~t~rl--  228 (559)
T KOG1334|consen  166 VVVWDWVSGSPKLSFESGHCNNVFQAKFI--PFSGDRT-IV-TSSRDGQVRVSEIL-----------ETGYVENTKRL--  228 (559)
T ss_pred             EEeehhhccCcccccccccccchhhhhcc--CCCCCcC-ce-eccccCceeeeeec-----------cccceecceec--
Confidence            56677777877777764222378888885  6665533 45 45678888865542           33466666664  


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                          ..|+.-++..++.|+.-+-|+++..-.++.-+-+.-
T Consensus       229 ----~~h~g~vhklav~p~sp~~f~S~geD~~v~~~Dlr~  264 (559)
T KOG1334|consen  229 ----APHEGPVHKLAVEPDSPKPFLSCGEDAVVFHIDLRQ  264 (559)
T ss_pred             ----ccccCccceeeecCCCCCcccccccccceeeeeecc
Confidence                135666779999999999999999888776555443


No 358
>TIGR03300 assembly_YfgL outer membrane assembly lipoprotein YfgL. Members of this protein family are YfgL, a lipoprotein component of a complex that acts protein insertion into the bacterial outer membrane. Other members of this complex are NlpB, YfiO, and YaeT. This protein contains multiple copies of a repeat that, in other contexts, are associated with binding of the coenzyme PQQ.
Probab=43.15  E-value=73  Score=36.72  Aligned_cols=63  Identities=14%  Similarity=0.055  Sum_probs=39.9

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc-hhhH---hhcCCcc------------------EEEeecCCCceeEEecCCCCCCc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT-ATRS---LLRGHTK------------------IKIWEDSKVAPLIILKPHGGQPV  210 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t-~ir~---llrGH~q------------------VriWD~~~g~pl~~lephdG~sV  210 (1165)
                      .++++.+|..+..||.|..||..+ .+..   -+.+...                  |++||..+|..+.+++.+++.-.
T Consensus       275 p~~~~~~vyv~~~~G~l~~~d~~tG~~~W~~~~~~~~~~ssp~i~g~~l~~~~~~G~l~~~d~~tG~~~~~~~~~~~~~~  354 (377)
T TIGR03300       275 PAVDDNRLYVTDADGVVVALDRRSGSELWKNDELKYRQLTAPAVVGGYLVVGDFEGYLHWLSREDGSFVARLKTDGSGIA  354 (377)
T ss_pred             ceEeCCEEEEECCCCeEEEEECCCCcEEEccccccCCccccCEEECCEEEEEeCCCEEEEEECCCCCEEEEEEcCCCccc
Confidence            456677888888899999999987 3322   1222111                  77888888877777776543233


Q ss_pred             ceeEe
Q 001070          211 NSAQY  215 (1165)
Q Consensus       211 ~SVaF  215 (1165)
                      ++-++
T Consensus       355 ~sp~~  359 (377)
T TIGR03300       355 SPPVV  359 (377)
T ss_pred             cCCEE
Confidence            44444


No 359
>KOG4190 consensus Uncharacterized conserved protein [Function unknown]
Probab=43.06  E-value=30  Score=42.80  Aligned_cols=77  Identities=14%  Similarity=0.254  Sum_probs=50.1

Q ss_pred             eEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccE
Q 001070          199 LIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFF  278 (1165)
Q Consensus       199 l~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff  278 (1165)
                      |..|.+|. +.|..++-+|.-+.      ..|+|.|||+|||.+-.+..     .-++..|.-|+.        .|+.-+
T Consensus       728 L~nf~GH~-~~iRai~AidNENS------FiSASkDKTVKLWSik~EgD-----~~~tsaCQfTY~--------aHkk~i  787 (1034)
T KOG4190|consen  728 LCNFTGHQ-EKIRAIAAIDNENS------FISASKDKTVKLWSIKPEGD-----EIGTSACQFTYQ--------AHKKPI  787 (1034)
T ss_pred             eecccCcH-HHhHHHHhcccccc------eeeccCCceEEEEEeccccC-----ccccceeeeEhh--------hccCcc
Confidence            45555552 47777766644433      34799999999999854410     113467988887        477777


Q ss_pred             EEEEeecCCcEEEEecc
Q 001070          279 NQVVVLSQAGLLLFANA  295 (1165)
Q Consensus       279 ~sV~~~p~a~~ilLan~  295 (1165)
                      +.+.+.-+-++|+-.|.
T Consensus       788 ~~igfL~~lr~i~ScD~  804 (1034)
T KOG4190|consen  788 HDIGFLADLRSIASCDG  804 (1034)
T ss_pred             cceeeeeccceeeeccC
Confidence            77777777766665554


No 360
>PF05879 RHD3:  Root hair defective 3 GTP-binding protein (RHD3);  InterPro: IPR008803 This family consists of several eukaryotic root hair defective 3 like GTP-binding proteins. It has been speculated that the RHD3 protein is a member of a novel class of GTP-binding proteins that is widespread in eukaryotes and required for regulated cell enlargement []. The family also contains the homologous Saccharomyces cerevisiae synthetic construct enhancement of YOP1 (SEY1) protein which is involved in membrane trafficking [].; GO: 0016817 hydrolase activity, acting on acid anhydrides
Probab=43.01  E-value=9.1e+02  Score=31.73  Aligned_cols=51  Identities=14%  Similarity=0.223  Sum_probs=40.6

Q ss_pred             hhhHHHHHHHHHHhHhhcchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          904 SGKHALQDALKSSVEASVIPAFEKSCKAMFEQVDATFQKGMVEHTTATLQH  954 (1165)
Q Consensus       904 sv~qaIqdavr~af~stLIPAFE~scq~MFqQV~~~F~rGm~E~~~qlQqq  954 (1165)
                      .+...+.+.++..|...|...|++....|.++|...|+.-+.+....+...
T Consensus       425 ~l~~~~eK~l~~~l~e~v~~~l~~~~~d~Wd~I~~~f~~~~~~~~~~~~~~  475 (742)
T PF05879_consen  425 ELVARIEKKLKSELKEPVESLLENPSPDMWDRIRKLFESATESAVSKFSDR  475 (742)
T ss_pred             HHHHHHHHHHHHHHhHHHHHHHhCCChhhHHHHHHHHHHHHHHHHHHHHHH
Confidence            345556667788888888999999999999999999998888777766443


No 361
>PF09726 Macoilin:  Transmembrane protein;  InterPro: IPR019130  This entry represents the multi-pass transmembrane protein Macoilin, which is highly conserved in eukaryotes. ; GO: 0016021 integral to membrane
Probab=41.64  E-value=9.4e+02  Score=31.50  Aligned_cols=37  Identities=16%  Similarity=0.123  Sum_probs=27.3

Q ss_pred             CchHHHHHHHHHHHHHHHHHHHH---HHHHHHHHhhhhhh
Q 001070          959 HSPLALVLRESVNSVSSMAQTLS---GEFVDGQRKLFDLA  995 (1165)
Q Consensus       959 KtsLv~~L~etIssmaa~q~~Lq---sEll~lQrQL~~~a  995 (1165)
                      |-.|...|-++-+.+.-++.++.   .||.+++.++.++-
T Consensus       617 KldLfsaLg~akrq~ei~~~~~~~~d~ei~~lk~ki~~~~  656 (697)
T PF09726_consen  617 KLDLFSALGDAKRQLEIAQGQLRKKDKEIEELKAKIAQLL  656 (697)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            46678888888888887777664   56888888766543


No 362
>KOG3397 consensus Acetyltransferases [General function prediction only]
Probab=41.45  E-value=21  Score=38.64  Aligned_cols=9  Identities=22%  Similarity=0.065  Sum_probs=3.6

Q ss_pred             CCCCCCCCC
Q 001070           30 SSSAAGDNF   38 (1165)
Q Consensus        30 ~~~~~~~~~   38 (1165)
                      .++|+..+.
T Consensus       174 ~~~a~~~~~  182 (225)
T KOG3397|consen  174 QPSASSTVS  182 (225)
T ss_pred             CcccccccC
Confidence            344443343


No 363
>PF10498 IFT57:  Intra-flagellar transport protein 57  ;  InterPro: IPR019530  Eukaryotic cilia and flagella are specialised organelles found at the periphery of cells of diverse organisms. Intra-flagellar transport (IFT) is required for the assembly and maintenance of eukaryotic cilia and flagella, and consists of the bi-directional movement of large protein particles between the base and the distal tip of the organelle. IFT particles contain multiple copies of two distinct protein complexes, A and B, which contain at least 6 and 11 protein subunits. IFT57 is part of complex B but is not, however, required for the core subunits to stay associated []. This protein is known as Huntington-interacting protein-1 in humans. 
Probab=40.38  E-value=7.3e+02  Score=29.88  Aligned_cols=103  Identities=15%  Similarity=0.242  Sum_probs=54.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHH---HHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHH
Q 001070          738 FSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEAS---LGRGIEKAVKASTDALWARFHEENARNEKLLRDR  814 (1165)
Q Consensus       738 ~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~---L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~R  814 (1165)
                      -.++..|+.....+-.+-.+...+|.- +...|+|-+.||+.+   |++.|+..+. ++.....++.+.+.+        
T Consensus       219 R~hleqm~~~~~~I~~~~~~~~~~L~k-l~~~i~~~lekI~sREk~iN~qle~l~~-eYr~~~~~ls~~~~~--------  288 (359)
T PF10498_consen  219 RSHLEQMKQHKKSIESALPETKSQLDK-LQQDISKTLEKIESREKYINNQLEPLIQ-EYRSAQDELSEVQEK--------  288 (359)
T ss_pred             HHHHHHHHHHHHHHHHhhhHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHhHHHHH-HHHHHHHHHHHHHHH--------
Confidence            455666666666666666666666665 445777777777655   6666665443 344444444443322        


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHH--HHHHHHHHhhhhhHh
Q 001070          815 TQQITGLITNLINKDLTASLEK--LVKKELAAVGPAIVR  851 (1165)
Q Consensus       815 Q~qLL~LVS~~LnktL~~nLEk--~LKkeV~sVvPAI~~  851 (1165)
                      ..+...-|+. +++.|+..-|.  .+|.+|..=+..+.+
T Consensus       289 y~~~s~~V~~-~t~~L~~IseeLe~vK~emeerg~~mtD  326 (359)
T PF10498_consen  289 YKQASEGVSE-RTRELAEISEELEQVKQEMEERGSSMTD  326 (359)
T ss_pred             HHHHhhHHHH-HHHHHHHHHHHHHHHHHHHHHhcCCCCC
Confidence            2233333333 33333333332  256777644445544


No 364
>PF06003 SMN:  Survival motor neuron protein (SMN);  InterPro: IPR010304 This family consists of several eukaryotic survival motor neuron (SMN) proteins. The Survival of Motor Neurons (SMN) protein, the product of the spinal muscular atrophy-determining gene, is part of a large macromolecular complex (SMN complex) that functions in the assembly of spliceosomal small nuclear ribonucleoproteins (snRNPs). The SMN complex functions as a specificity factor essential for the efficient assembly of Sm proteins on U snRNAs and likely protects cells from illicit, and potentially deleterious, non-specific binding of Sm proteins to RNAs.; GO: 0003723 RNA binding, 0006397 mRNA processing, 0005634 nucleus, 0005737 cytoplasm; PDB: 1MHN_A 4A4G_A 3S6N_M 4A4E_A 1G5V_A 4A4H_A 4A4F_A 2D9T_A.
Probab=39.31  E-value=9.9  Score=43.13  Aligned_cols=14  Identities=50%  Similarity=1.177  Sum_probs=0.0

Q ss_pred             cCCCCCCCCCCCCC
Q 001070           23 FPPYPPPSSSAAGD   36 (1165)
Q Consensus        23 ~~~~~~~~~~~~~~   36 (1165)
                      |+|.|||..|..|.
T Consensus       172 ~Pp~PPpp~P~lg~  185 (264)
T PF06003_consen  172 FPPPPPPPPPGLGK  185 (264)
T ss_dssp             --------------
T ss_pred             CCCCCCCCCCCcCc
Confidence            44444444444433


No 365
>KOG2180 consensus Late Golgi protein sorting complex, subunit Vps53 [Intracellular trafficking, secretion, and vesicular transport]
Probab=39.19  E-value=5.4e+02  Score=33.69  Aligned_cols=40  Identities=25%  Similarity=0.327  Sum_probs=25.0

Q ss_pred             HHHHHHHhhhccc--------ChHHHHHHHHHHHHHcCCCCchhHHhH
Q 001070         1083 LSLLQQLACDINK--------DTARKLAWLTDVAAAINPADPMIAVHA 1122 (1165)
Q Consensus      1083 LSLIQQLSsDL~t--------dt~lKL~WLEeal~aLDpsDP~Irehv 1122 (1165)
                      -+|.+|+-.|+..        +...-+..|++++..+|.-||.+|+-+
T Consensus       186 ~~l~~qi~~df~~~F~~~~~~~~~~~l~~l~daC~v~d~lepsvreel  233 (793)
T KOG2180|consen  186 KSLLSQIFQDFKAAFSGGETHEEALLLQKLSDACLVVDALEPSVREEL  233 (793)
T ss_pred             HHHHHHHHHHHHHhcCCCCCCCCccHHHHHHHHHHHHHHhCCccHHHH
Confidence            3455566666632        334567778888877777776666544


No 366
>KOG2079 consensus Vacuolar assembly/sorting protein VPS8 [Intracellular trafficking, secretion, and vesicular transport]
Probab=39.18  E-value=37  Score=45.02  Aligned_cols=74  Identities=14%  Similarity=0.195  Sum_probs=49.2

Q ss_pred             CCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc------EEEeecCCC
Q 001070          124 EEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK------IKIWEDSKV  196 (1165)
Q Consensus       124 ~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q------VriWD~~~g  196 (1165)
                      ..||--  +..|++++             +.-||+++|-|.-+|+|.|||+++ .+-..|.-|.+      +-.|+-+..
T Consensus       124 ~~ne~v--~~~Vtsva-------------fn~dg~~l~~G~~~G~V~v~D~~~~k~l~~i~e~~ap~t~vi~v~~t~~nS  188 (1206)
T KOG2079|consen  124 HQNERV--QGPVTSVA-------------FNQDGSLLLAGLGDGHVTVWDMHRAKILKVITEHGAPVTGVIFVGRTSQNS  188 (1206)
T ss_pred             hcCCcc--CCcceeeE-------------ecCCCceeccccCCCcEEEEEccCCcceeeeeecCCccceEEEEEEeCCCc
Confidence            446654  66777655             445799999999999999999999 66666655555      334443322


Q ss_pred             ceeEEecCCCCCCcceeEe
Q 001070          197 APLIILKPHGGQPVNSAQY  215 (1165)
Q Consensus       197 ~pl~~lephdG~sV~SVaF  215 (1165)
                         -.+....|-+||...|
T Consensus       189 ---~llt~D~~Gsf~~lv~  204 (1206)
T KOG2079|consen  189 ---KLLTSDTGGSFWKLVF  204 (1206)
T ss_pred             ---EEEEccCCCceEEEEe
Confidence               2344444446777777


No 367
>PLN03229 acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha; Provisional
Probab=38.60  E-value=1.1e+03  Score=31.29  Aligned_cols=38  Identities=26%  Similarity=0.377  Sum_probs=21.7

Q ss_pred             HHHH---Hhhhhcccchhhh-HHHHHHHHHHHHHH-----HHHHhHHHH
Q 001070          757 ELQK---QMSNLVTLPVTKE-GRRLEASLGRGIEK-----AVKASTDAL  796 (1165)
Q Consensus       757 e~qk---qm~~~v~~plsKE-~kklE~~L~~~ieK-----~lk~eld~L  796 (1165)
                      |+.|   +..-|-  |+-+| +.||..-+..+|..     .|+.-||.|
T Consensus       494 E~sKa~~~~~~~~--~~L~eK~~kLk~Efnkkl~ea~n~p~lk~Kle~L  540 (762)
T PLN03229        494 EFSKANSQDQLMH--PVLMEKIEKLKDEFNKRLSRAPNYLSLKYKLDML  540 (762)
T ss_pred             HHHhccccccccc--HHHHHHHHHHHHHHHHhhhcccccHHHHHHHHHH
Confidence            7777   332222  55555 77777666666665     555555554


No 368
>PRK14143 heat shock protein GrpE; Provisional
Probab=37.68  E-value=3e+02  Score=31.35  Aligned_cols=44  Identities=16%  Similarity=0.229  Sum_probs=29.3

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|...++..      .|...+-+++.++|  .+-+|||++|.
T Consensus        92 R~~AdfeN~RKR~~kE~e~------~~~~a~~~~~~~lL--pV~DnLerAl~  135 (238)
T PRK14143         92 RIAADFDNFRKRTSREQED------LRLQLKCNTLSEIL--PVVDNFERARQ  135 (238)
T ss_pred             HHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHH--HHHhHHHHHHh
Confidence            5668888888888776633      23344555555555  56688998886


No 369
>PRK09866 hypothetical protein; Provisional
Probab=37.54  E-value=1.1e+03  Score=31.08  Aligned_cols=45  Identities=20%  Similarity=0.194  Sum_probs=30.5

Q ss_pred             HHhHhhcchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhcC
Q 001070          915 SSVEASVIPAFEKSCKAMFEQVDATFQKGMVEHTTATLQHFESTH  959 (1165)
Q Consensus       915 ~af~stLIPAFE~scq~MFqQV~~~F~rGm~E~~~qlQqq~dSaK  959 (1165)
                      ..+...+=--|....+++..||+..+..||...+.++...++..+
T Consensus       644 ~~~~~~~~~~~~~~~~~~~~~v~~~v~~~~~~ff~~f~~~~~~~~  688 (741)
T PRK09866        644 RALSAEVDLYCQQMAKVLAEQVDESVTAGMNTFFAEFASCLTELQ  688 (741)
T ss_pred             HHHHHHHHHHHHHHHHHHHHhcCchHHHHHHHHHHHHHHHHHHHH
Confidence            344444445567777788888888888999888887754443333


No 370
>PRK14164 heat shock protein GrpE; Provisional
Probab=37.37  E-value=1.9e+02  Score=32.52  Aligned_cols=46  Identities=17%  Similarity=0.179  Sum_probs=29.7

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      .++.++|+++.+|.+.++..      .+.-.+-+++.++|  .+-++||+.++.
T Consensus        94 lR~~AE~eN~RkR~~rE~e~------~~~~a~~~~~~~LL--pVlDnLerAl~~  139 (218)
T PRK14164         94 QRVTAEYANYRRRTERERQA------IIETAKAGVATDLL--PILDDLDLAEQH  139 (218)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hHHhHHHHHHhc
Confidence            46678999999998766533      23334444555554  456888888863


No 371
>PF09731 Mitofilin:  Mitochondrial inner membrane protein;  InterPro: IPR019133  Mitofilin controls mitochondrial cristae morphology. Mitofilin is enriched in the narrow space between the inner boundary and the outer membranes, where it forms a homotypic interaction and assembles into a large multimeric protein complex []. The first 78 amino acids contain a typical amino-terminal-cleavable mitochondrial presequence (residues 1-43) rich in positive-charged and hydroxylated residues and a membrane anchor domain (residues 47-66). In addition, it has three centrally located coiled coil domains (residues 200-240,280-310 and 400-420) []. ; GO: 0031305 integral to mitochondrial inner membrane
Probab=37.18  E-value=9.3e+02  Score=30.17  Aligned_cols=165  Identities=15%  Similarity=0.207  Sum_probs=0.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHH
Q 001070          743 AMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLI  822 (1165)
Q Consensus       743 ~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LV  822 (1165)
                      .++..-.+|-.++.+.++.+...+-.--.+.+++++..+..+++..+.+..+.+-..|+.++...++...++.++-|+.-
T Consensus       259 ~i~~L~~~l~~l~~~~~~~l~~~L~~q~~e~~~~~~~~~~~~le~~~~~~~~~~~~e~~~~~~~l~~~~~~~L~~eL~~~  338 (582)
T PF09731_consen  259 RIDALQKELAELKEEEEEELERALEEQREELLSKLREELEQELEEKRAELEEELREEFEREREELEEKYEEELRQELKRQ  338 (582)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHhhhhhHhhhhhhHHHHHHHHHHHHHhhcchhhhHHHHHHHHHHHhHHHHHHHHHHhhh
Q 001070          823 TNLINKDLTASLEKLVKKELAAVGPAIVRTISPSIEKTITSAIVESFQRGVGDKAVNQLERSVNSRLEATVGRQIQAQFQ  902 (1165)
Q Consensus       823 S~~LnktL~~nLEk~LKkeV~sVvPAI~~~t~~avekqlss~l~eslq~~l~dk~vnqLeK~V~s~Lp~aVaraIq~~vq  902 (1165)
                      ..    .+...++..|+..=....=...+.+...|++.=...+.. |..-  ..-++.||+.+...-.......-.+++.
T Consensus       339 ~~----~~~~~l~~~l~~~~~e~~~~~~~~i~~~v~~Er~~~~~~-l~~~--~~~~~~le~~~~~~~~~~~~~~~~~~l~  411 (582)
T PF09731_consen  339 EE----AHEEHLKNELREQAIELQREFEKEIKEKVEQERNGRLAK-LAEL--NSRLKALEEALDARSEAEDENRRAQQLW  411 (582)
T ss_pred             HH----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHHH


Q ss_pred             hhhhHHHHHHHHH
Q 001070          903 TSGKHALQDALKS  915 (1165)
Q Consensus       903 tsv~qaIqdavr~  915 (1165)
                      -. ..+|.+++..
T Consensus       412 ~a-~~~l~~~l~~  423 (582)
T PF09731_consen  412 LA-VDALKSALDS  423 (582)
T ss_pred             HH-HHHHHHHHHc


No 372
>PF08553 VID27:  VID27 cytoplasmic protein;  InterPro: IPR013863  This entry represents fungal and plant proteins and contains many hypothetical proteins. Vid27p is a cytoplasmic protein of unknown function, possibly regulates import of fructose-1,6-bisphosphatase into Vacuolar Import and Degradation (Vid) vesicles and is not essential for proteasome-dependent degradation of fructose-1,6-bisphosphatase (FBPase) [, ].
Probab=36.82  E-value=1.2e+02  Score=39.83  Aligned_cols=62  Identities=13%  Similarity=0.114  Sum_probs=44.2

Q ss_pred             ecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEeecCC
Q 001070          230 AGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGN  309 (1165)
Q Consensus       230 sGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~  309 (1165)
                      -|+.+..|||+|--+            -++.-.|.+        =.+-+..|.++.||.|||.+.-+--.||..-+.-|.
T Consensus       593 vgs~~G~IRLyd~~g------------~~AKT~lp~--------lG~pI~~iDvt~DGkwilaTc~tyLlLi~t~~~~g~  652 (794)
T PF08553_consen  593 VGSNKGDIRLYDRLG------------KRAKTALPG--------LGDPIIGIDVTADGKWILATCKTYLLLIDTLIKDGK  652 (794)
T ss_pred             EEeCCCcEEeecccc------------hhhhhcCCC--------CCCCeeEEEecCCCcEEEEeecceEEEEEEeeecCC
Confidence            399999999999311            133333332        124456899999999999999998888888777665


Q ss_pred             Cc
Q 001070          310 NS  311 (1165)
Q Consensus       310 ~~  311 (1165)
                      +.
T Consensus       653 ~~  654 (794)
T PF08553_consen  653 NS  654 (794)
T ss_pred             cc
Confidence            53


No 373
>PF03938 OmpH:  Outer membrane protein (OmpH-like);  InterPro: IPR005632 This entry includes outer membrane proteins such as OmpH (Skp) among others. OmpH (outer membrane protein H) is a major structural protein of the outer membrane. In Pasteurella multocida it acts as a channel-forming transmembrane porin []. Porins act as molecular sieves to allow the diffusion of small hydrophilic solutes through the outer membrane and also acts as a receptor for bacteriophages and bacteriocins. Porins are highly immunogenic and are conserved in bacterial families, making them attractive vaccine candidates []. The 17kDa protein (Skp, OmpH) of Escherichia coli is a homotrimeric periplasmic chaperone for newly synthesised outer-membrane proteins, the X-ray structure of which has been reported at resolutions of 2.35 A and 2.30 A [, ]. Three hairpin-shaped alpha-helical extensions reach out by approximately 60 A from a trimerisation domain, which is composed of three intersubunit beta-sheets that wind around a central axis. The alpha-helical extensions approach each other at their distal turns, resulting in a fold that resembles a 'three-pronged grasping forcep'. The overall shape of Skp is reminiscent of the cytosolic chaperone prefoldin (IPR009053 from INTERPRO), although it is based on a radically different topology. The peculiar architecture, with apparent plasticity of the prongs and distinct electrostatic and hydrophobic surface properties, supports the recently proposed biochemical mechanism of this chaperone: formation of a Skp(3)-Omp complex protects the outer membrane protein from aggregation during passage through the bacterial periplasm. The ability of Skp to prevent the aggregation of model substrates in vitro is independent of ATP. Skp can interact directly with membrane lipids and lipopolysaccharide. These interactions are needed for efficient Skp-assisted folding of membrane proteins [].; GO: 0051082 unfolded protein binding; PDB: 1SG2_C 1U2M_C.
Probab=36.52  E-value=3.9e+02  Score=27.31  Aligned_cols=13  Identities=8%  Similarity=0.204  Sum_probs=7.3

Q ss_pred             HhHHHHHHHHHHH
Q 001070          791 ASTDALWARFHEE  803 (1165)
Q Consensus       791 ~eld~L~~R~dEe  803 (1165)
                      +++.+++++|+..
T Consensus        57 ~el~~~~~~l~~~   69 (158)
T PF03938_consen   57 KELQKLQQKLQSQ   69 (158)
T ss_dssp             HHHHHHHHHHTTS
T ss_pred             HHHHHHHHHHHHH
Confidence            4555566665554


No 374
>COG1770 PtrB Protease II [Amino acid transport and metabolism]
Probab=36.13  E-value=8.9e+02  Score=31.59  Aligned_cols=115  Identities=13%  Similarity=0.193  Sum_probs=61.1

Q ss_pred             eeecCceEEE-----eecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEE
Q 001070          153 IAVNKHYVCY-----GLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIIL  227 (1165)
Q Consensus       153 IAVn~~yIay-----G~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~l  227 (1165)
                      |+-|.+||||     |.+...|||-|+.|..          .+||.-++            -+.+++|  ++|+.. .|.
T Consensus       136 ~s~D~~~la~s~D~~G~e~y~lr~kdL~tg~----------~~~d~i~~------------~~~~~~W--a~d~~~-lfY  190 (682)
T COG1770         136 ISPDHNLLAYSVDVLGDEQYTLRFKDLATGE----------ELPDEITN------------TSGSFAW--AADGKT-LFY  190 (682)
T ss_pred             eCCCCceEEEEEecccccEEEEEEEeccccc----------ccchhhcc------------cccceEE--ecCCCe-EEE
Confidence            5557777777     4555566666665521          12222221            3556666  344332 344


Q ss_pred             EeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccccccEEEEEeecCCcEEEEec--cCCCcEEEEEe
Q 001070          228 VTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFAN--AKKNAIYSVHL  305 (1165)
Q Consensus       228 vtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan--~~r~aIYalhl  305 (1165)
                      +..-...|.=|+|-...+.-          .-...|-|+   |  ....||.+|..+.+..|||+.-  ....-|+.+..
T Consensus       191 t~~d~~~rp~kv~~h~~gt~----------~~~d~lvye---E--~d~~f~~~v~~s~s~~yi~i~~~~~~tsE~~ll~a  255 (682)
T COG1770         191 TRLDENHRPDKVWRHRLGTP----------GSSDELVYE---E--KDDRFFLSVGRSRSEAYIVISLGSHITSEVRLLDA  255 (682)
T ss_pred             EEEcCCCCcceEEEEecCCC----------CCcceEEEE---c--CCCcEEEEeeeccCCceEEEEcCCCcceeEEEEec
Confidence            44444446666666544310          011112221   1  2357999999999999888764  45556666665


Q ss_pred             ec
Q 001070          306 GY  307 (1165)
Q Consensus       306 ~~  307 (1165)
                      +-
T Consensus       256 ~~  257 (682)
T COG1770         256 DD  257 (682)
T ss_pred             CC
Confidence            54


No 375
>PF13360 PQQ_2:  PQQ-like domain; PDB: 3HXJ_B 1YIQ_A 1KV9_A 3Q54_A 2YH3_A 3PRW_A 3P1L_A 3Q7M_A 3Q7O_A 3Q7N_A ....
Probab=36.11  E-value=5.4e+02  Score=27.07  Aligned_cols=27  Identities=26%  Similarity=0.197  Sum_probs=21.3

Q ss_pred             ee-cCceEEEeecCCcEEEEeCcc-hhhH
Q 001070          154 AV-NKHYVCYGLKGGNVRVLNLNT-ATRS  180 (1165)
Q Consensus       154 AV-n~~yIayG~kdg~IRVwdi~t-~ir~  180 (1165)
                      ++ ++.+|..+..++.|..||+.| .+..
T Consensus        32 ~~~~~~~v~~~~~~~~l~~~d~~tG~~~W   60 (238)
T PF13360_consen   32 AVPDGGRVYVASGDGNLYALDAKTGKVLW   60 (238)
T ss_dssp             EEEETTEEEEEETTSEEEEEETTTSEEEE
T ss_pred             EEEeCCEEEEEcCCCEEEEEECCCCCEEE
Confidence            44 788888888999999999977 4443


No 376
>COG4913 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=35.22  E-value=1.2e+03  Score=30.91  Aligned_cols=23  Identities=17%  Similarity=0.078  Sum_probs=12.5

Q ss_pred             HHHHHHHhhhhcccchhhhHHHHHHHHHH
Q 001070          755 QKELQKQMSNLVTLPVTKEGRRLEASLGR  783 (1165)
Q Consensus       755 qke~qkqm~~~v~~plsKE~kklE~~L~~  783 (1165)
                      +--|+|+|..      -.|..|+|..+.+
T Consensus       633 ~~~~~~i~~~------q~e~~klqeq~~A  655 (1104)
T COG4913         633 DFYMIKIMRQ------QGEYIKLQEQANA  655 (1104)
T ss_pred             HHHhhHHHHH------HHHHHHHHHHHHH
Confidence            3344555544      4566667666544


No 377
>PF07433 DUF1513:  Protein of unknown function (DUF1513);  InterPro: IPR008311 There are currently no experimental data for members of this group or their homologues, nor do they exhibit features indicative of any function.
Probab=35.21  E-value=2.9e+02  Score=32.61  Aligned_cols=33  Identities=3%  Similarity=0.119  Sum_probs=29.2

Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      .-|+-+|+++.++++|.++..+.+.+.....+-
T Consensus       216 ~~Y~gSIa~~~~g~~ia~tsPrGg~~~~~d~~t  248 (305)
T PF07433_consen  216 NGYIGSIAADRDGRLIAVTSPRGGRVAVWDAAT  248 (305)
T ss_pred             CCceEEEEEeCCCCEEEEECCCCCEEEEEECCC
Confidence            468999999999999999999999998886554


No 378
>PRK10115 protease 2; Provisional
Probab=35.16  E-value=4.5e+02  Score=33.94  Aligned_cols=25  Identities=20%  Similarity=0.267  Sum_probs=20.0

Q ss_pred             EeeecCceEEE-----eecCCcEEEEeCcc
Q 001070          152 QIAVNKHYVCY-----GLKGGNVRVLNLNT  176 (1165)
Q Consensus       152 ~IAVn~~yIay-----G~kdg~IRVwdi~t  176 (1165)
                      .++.||+||+|     |.+...|+|.|+.+
T Consensus       133 ~~Spdg~~la~~~d~~G~E~~~l~v~d~~t  162 (686)
T PRK10115        133 AITPDNTIMALAEDFLSRRQYGIRFRNLET  162 (686)
T ss_pred             EECCCCCEEEEEecCCCcEEEEEEEEECCC
Confidence            36668999999     55567899999987


No 379
>KOG3973 consensus Uncharacterized conserved glycine-rich protein [Function unknown]
Probab=35.10  E-value=8.9e+02  Score=29.32  Aligned_cols=12  Identities=17%  Similarity=0.268  Sum_probs=8.3

Q ss_pred             hhHHHHHHHHHH
Q 001070          772 KEGRRLEASLGR  783 (1165)
Q Consensus       772 KE~kklE~~L~~  783 (1165)
                      +|+.|+|+.|.+
T Consensus        52 r~L~k~eE~V~q   63 (465)
T KOG3973|consen   52 RELYKIEEYVRQ   63 (465)
T ss_pred             HHHHHHHHHhcC
Confidence            456677877766


No 380
>PHA01972 structural protein
Probab=34.40  E-value=1.3e+03  Score=30.96  Aligned_cols=33  Identities=9%  Similarity=0.264  Sum_probs=24.7

Q ss_pred             HHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhH
Q 001070          754 MQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKAST  793 (1165)
Q Consensus       754 ~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~el  793 (1165)
                      ..+...|||+.       .|++.||+++...|...-.++-
T Consensus         9 V~~Aagr~L~a-------~E~~~Ie~ri~~~~r~~ar~d~   41 (828)
T PHA01972          9 VAQAAGRQLTA-------DEIKGIEDRIKEAMRSVARKDP   41 (828)
T ss_pred             HHHHhcCCCch-------HHHHHHHHHHHHHHHHHHhhCc
Confidence            34556666665       8999999999998887666655


No 381
>PF10168 Nup88:  Nuclear pore component;  InterPro: IPR019321  Nup88 can be divided into two structural domains; the N-terminal two-thirds of the protein have no obvious structural motifs. It is, however, where it binds to Nup98; one of the components of the nuclear pore. The C-terminal end is a predicted coiled-coil domain []. Nup88 is over expressed in tumour cells []. 
Probab=34.22  E-value=1.2e+03  Score=30.61  Aligned_cols=151  Identities=12%  Similarity=0.243  Sum_probs=0.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHH
Q 001070          740 QVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQIT  819 (1165)
Q Consensus       740 q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL  819 (1165)
                      +-.+..+.-..+-..+.++++|+..         ++++++..     +.|....+.|..||++ -..+++....|.+.|+
T Consensus       556 ~~~ar~ei~~rv~~Lk~~~e~Ql~~---------L~~l~e~~-----~~l~~~ae~LaeR~e~-a~d~Qe~L~~R~~~vl  620 (717)
T PF10168_consen  556 QDLAREEIQRRVKLLKQQKEQQLKE---------LQELQEER-----KSLRESAEKLAERYEE-AKDKQEKLMKRVDRVL  620 (717)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHH---------HHHHHHHH-----HHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHH


Q ss_pred             HHHHH---HHH---HHHHHHHHHHHHHHHHHhhhhhHhhhhhhHHHHHHHHHHHHHhhc---chhhhHHHHHHHHHHHhH
Q 001070          820 GLITN---LIN---KDLTASLEKLVKKELAAVGPAIVRTISPSIEKTITSAIVESFQRG---VGDKAVNQLERSVNSRLE  890 (1165)
Q Consensus       820 ~LVS~---~Ln---ktL~~nLEk~LKkeV~sVvPAI~~~t~~avekqlss~l~eslq~~---l~dk~vnqLeK~V~s~Lp  890 (1165)
                      +++..   .|+   +.+.+-|+ .++.++..+-++|...-.+.=..+..-.-.+.-++.   +++++...|...| +..-
T Consensus       621 ~~l~~~~P~LS~AEr~~~~EL~-~~~~~l~~l~~si~~lk~k~~~Q~~~i~~~~~~~~~s~~L~~~Q~~~I~~iL-~~~~  698 (717)
T PF10168_consen  621 QLLNSQLPVLSEAEREFKKELE-RMKDQLQDLKASIEQLKKKLDYQQRQIESQKSPKKKSIVLSESQKRTIKEIL-KQQG  698 (717)
T ss_pred             HHHhccCCCCCHHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHhccccccCCCccCCHHHHHHHHHHH-HHHH


Q ss_pred             HHHHHHHHHhhhhhhhHHHHHHH
Q 001070          891 ATVGRQIQAQFQTSGKHALQDAL  913 (1165)
Q Consensus       891 ~aVaraIq~~vqtsv~qaIqdav  913 (1165)
                      .-|.+.|+.      .+.|...|
T Consensus       699 ~~I~~~v~~------ik~i~~~~  715 (717)
T PF10168_consen  699 EEIDELVKQ------IKNIKKIV  715 (717)
T ss_pred             HHHHHHHHH------HHHHHHhh


No 382
>KOG0972 consensus Huntingtin interacting protein 1 (Hip1) interactor Hippi [Signal transduction mechanisms]
Probab=34.09  E-value=8.6e+02  Score=28.83  Aligned_cols=68  Identities=18%  Similarity=0.313  Sum_probs=38.6

Q ss_pred             chhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH--HHHHHHH
Q 001070          769 PVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEK--LVKKELA  843 (1165)
Q Consensus       769 plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk--~LKkeV~  843 (1165)
                      .++|-+.||+.|     +|.++.++..|.++|.+....+ ...++|+.|.-.=|+. =+++|..+.+.  .+|.|+.
T Consensus       256 eit~~LEkI~SR-----EK~lNnqL~~l~q~fr~a~~~l-se~~e~y~q~~~gv~~-rT~~L~eVm~e~E~~KqemE  325 (384)
T KOG0972|consen  256 EITKALEKIASR-----EKSLNNQLASLMQKFRRATDTL-SELREKYKQASVGVSS-RTETLDEVMDEIEQLKQEME  325 (384)
T ss_pred             HHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHhcccHHH-HHHHHHHHHHHHHHHHHHHH
Confidence            455555556544     6788888888877666554443 3455666666555554 24445544432  2444554


No 383
>PF09726 Macoilin:  Transmembrane protein;  InterPro: IPR019130  This entry represents the multi-pass transmembrane protein Macoilin, which is highly conserved in eukaryotes. ; GO: 0016021 integral to membrane
Probab=34.00  E-value=1.2e+03  Score=30.54  Aligned_cols=8  Identities=63%  Similarity=0.970  Sum_probs=4.5

Q ss_pred             cccccCCC
Q 001070          360 LFQCLPPP  367 (1165)
Q Consensus       360 ~~~c~pp~  367 (1165)
                      +.+-||+.
T Consensus       197 l~~~lp~~  204 (697)
T PF09726_consen  197 LQQALPPE  204 (697)
T ss_pred             HHHhCCCc
Confidence            34556665


No 384
>PRK11138 outer membrane biogenesis protein BamB; Provisional
Probab=33.21  E-value=2.7e+02  Score=32.67  Aligned_cols=24  Identities=17%  Similarity=0.115  Sum_probs=17.9

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t  176 (1165)
                      +++++.+|..+..+|.+..+|..+
T Consensus       290 ~~~~~~~vy~~~~~g~l~ald~~t  313 (394)
T PRK11138        290 FAVDGGRIYLVDQNDRVYALDTRG  313 (394)
T ss_pred             cEEECCEEEEEcCCCeEEEEECCC
Confidence            456667777777888888888876


No 385
>TIGR03185 DNA_S_dndD DNA sulfur modification protein DndD. This model describes the DndB protein encoded by an operon associated with a sulfur-containing modification to DNA. The operon is sporadically distributed in bacteria, much like some restriction enzyme operons. DndD is described as a putative ATPase. The small number of examples known so far include species from among the Firmicutes, Actinomycetes, Proteobacteria, and Cyanobacteria.
Probab=32.89  E-value=1.2e+03  Score=29.98  Aligned_cols=11  Identities=36%  Similarity=0.377  Sum_probs=5.9

Q ss_pred             HHHHHHHHHhh
Q 001070         1081 VLLSLLQQLAC 1091 (1165)
Q Consensus      1081 VLLSLIQQLSs 1091 (1165)
                      +.|+|+--|+.
T Consensus       560 ~~la~~~al~~  570 (650)
T TIGR03185       560 LAIALLWGLAK  570 (650)
T ss_pred             HHHHHHHHHHH
Confidence            34565555553


No 386
>PRK14157 heat shock protein GrpE; Provisional
Probab=31.81  E-value=2.6e+02  Score=31.66  Aligned_cols=44  Identities=18%  Similarity=0.251  Sum_probs=28.8

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|.+.++..      .|.-.+-+++.++|  .+-++||+.|.
T Consensus       102 R~~AEfeNyRKR~~rE~e~------~~~~a~~~~~~dLL--pvlDnLeRAl~  145 (227)
T PRK14157        102 RERAEFINYRNRTQKEQDR------FRQHGIIDVLTALL--PALDDIDRIRE  145 (227)
T ss_pred             HHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hhhhhHHHHHh
Confidence            5668899999888876633      23344455555555  45577888875


No 387
>KOG4673 consensus Transcription factor TMF, TATA element modulatory factor [Transcription]
Probab=31.48  E-value=1.3e+03  Score=30.27  Aligned_cols=65  Identities=14%  Similarity=0.203  Sum_probs=35.9

Q ss_pred             CCCChhhHHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhH
Q 001070          731 LPSAPAAFSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARN  807 (1165)
Q Consensus       731 ~~~~~~~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~r  807 (1165)
                      .+..+...-+|++..+-.+-+.--.-.+.++|+.            |...|.+.+-+-.=++-|.+.+.+..+-.+.
T Consensus       401 ssl~~e~~QRva~lEkKvqa~~kERDalr~e~ks------------lk~ela~~l~~DeLaEkdE~I~~lm~EGEkL  465 (961)
T KOG4673|consen  401 SSLREEYHQRVATLEKKVQALTKERDALRREQKS------------LKKELAAALLKDELAEKDEIINQLMAEGEKL  465 (961)
T ss_pred             cchHHHHHHHHHHHHHHHHHHHHhHHHHHHHHHH------------HHHHHHHhhhhHHHHHHHHHHHHHHHHHHHh
Confidence            3444455556666666655555444444555544            5566666666633345566666666555443


No 388
>PRK14628 hypothetical protein; Provisional
Probab=31.00  E-value=64  Score=32.88  Aligned_cols=22  Identities=32%  Similarity=0.569  Sum_probs=18.5

Q ss_pred             HHHHHHHHHHHHHHHHHHHhhh
Q 001070          743 AMQDMLNQLMTMQKELQKQMSN  764 (1165)
Q Consensus       743 ~mq~~l~ql~~~qke~qkqm~~  764 (1165)
                      .|.+++.|++.||++||+.|..
T Consensus        16 ~~~~lm~q~~k~qq~mq~k~~e   37 (118)
T PRK14628         16 KQEKLLKDFAKMQEELQKKIQE   37 (118)
T ss_pred             hHHHHHHHHHHHHHHHHHHHHH
Confidence            3678899999999999988776


No 389
>PRK14155 heat shock protein GrpE; Provisional
Probab=30.85  E-value=2.8e+02  Score=30.98  Aligned_cols=46  Identities=15%  Similarity=0.147  Sum_probs=26.6

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      .++.++|+++.+|.+.++...      +...+-+++.+.|  .+-++||++|..
T Consensus        37 lR~~AefeN~RKR~~kE~e~~------~~~a~~~~~~~LL--pV~DnLerAl~~   82 (208)
T PRK14155         37 LRYAAEAENTKRRAEREMNDA------RAYAIQKFARDLL--GAADNLGRATAA   82 (208)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhhHHHHHhc
Confidence            355678888888887766432      2233333333433  344777777753


No 390
>KOG1897 consensus Damage-specific DNA binding complex, subunit DDB1 [Replication, recombination and repair]
Probab=30.72  E-value=7.8e+02  Score=33.41  Aligned_cols=187  Identities=16%  Similarity=0.198  Sum_probs=108.5

Q ss_pred             EEecccCCCCCCCCCCcccccccccCCCcccccccEeeec--CceEEEeecCCcEEEEeCcch----hhHhhcCCccEEE
Q 001070          117 AYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVN--KHYVCYGLKGGNVRVLNLNTA----TRSLLRGHTKIKI  190 (1165)
Q Consensus       117 ~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn--~~yIayG~kdg~IRVwdi~t~----ir~llrGH~qVri  190 (1165)
                      .++|=++.-|+++      -++. -.++.    |.-.+||  ++-|+--+.+|...|..|.+.    .+++++|      
T Consensus        94 ~~~vv~~a~~~v~------dr~g-r~s~~----g~~~~VDp~~R~Igl~~yqgl~~vIp~d~~~sht~~s~l~~------  156 (1096)
T KOG1897|consen   94 SIQVVTRAHGDVS------DRSG-RPSDN----GQILLVDPKGRVIGLHLYQGLFKVIPIDSDESHTGGSLLKA------  156 (1096)
T ss_pred             cceEEEEeccccc------cccc-ccCCC----ceEEEECCCCcEEEEEeecCeEEEEEecccccccCcccccc------
Confidence            4555566666665      1222 44444    7778887  678998999999999888873    3333332      


Q ss_pred             eecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcC------CC------------CCCC
Q 001070          191 WEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEE------GW------------SLPT  252 (1165)
Q Consensus       191 WD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~------~~------------~~~~  252 (1165)
                            .+++--+    .-||.++|+..-..|...++- ..+.+|.+|-+++...+      -|            .+|+
T Consensus       157 ------fn~rfde----l~v~Di~fly~~s~pt~~vly-~Ds~~~Hv~~yelnl~~ke~~~~~w~~~v~~~a~~li~VP~  225 (1096)
T KOG1897|consen  157 ------FNVRFDE----LNVYDIKFLYGCSDPTLAVLY-KDSDGRHVKTYELNLRDKEFVKGPWSNNVDNGASMLIPVPS  225 (1096)
T ss_pred             ------cccccCc----ceEEEEEEEcCCCCCceEEEE-EcCCCcEEEEEEeccchhhccccccccccccCCceeeecCC
Confidence                  2222222    358888888766666643333 46688888888887652      13            1121


Q ss_pred             CCC-CcceEEEEeccCCC------CC--ccccccEEEEEeecCCcEEEEeccCCCc--EEEEEeecCCCccccccccccc
Q 001070          253 HAE-SWKCTQTLDLKSSA------KP--RVEEAFFNQVVVLSQAGLLLFANAKKNA--IYSVHLGYGNNSAATRIDYIAE  321 (1165)
Q Consensus       253 ~~~-~w~C~QTLe~~~s~------~~--~~~~aff~sV~~~p~a~~ilLan~~r~a--IYalhl~~g~~~~~~r~dyiae  321 (1165)
                      .-. ...|-.-+-.-.+.      .+  .-..-+...-.++.++...||+|.....  +|.-|.+........+.+|+-|
T Consensus       226 ~~gGvlV~ge~~I~Y~~~~~~~ai~p~~~~~~t~~~~~~v~~~~~~yLl~d~~G~Lf~l~l~~~~e~~s~~~lkve~lge  305 (1096)
T KOG1897|consen  226 PIGGVLVIGEEFIVYMSGDNFVAIAPLTAEQSTIVCYGRVDLQGSRYLLGDEDGMLFKLLLSHTGETVSGLDLKVEYLGE  305 (1096)
T ss_pred             CCceEEEEeeeEEEEeeCCceeEecccccCCceEEEcccccCCccEEEEecCCCcEEEEEeecccccccceEEEEEecCC
Confidence            111 12222222110000      00  0011233344588899999999987653  4445555555544579999999


Q ss_pred             cccccceeee
Q 001070          322 FTVTMPVLSF  331 (1165)
Q Consensus       322 F~v~~PILSf  331 (1165)
                      |.++.-|-.+
T Consensus       306 ~siassi~~L  315 (1096)
T KOG1897|consen  306 TSIASSINYL  315 (1096)
T ss_pred             cchhhhhhcc
Confidence            9999887655


No 391
>PRK14140 heat shock protein GrpE; Provisional
Probab=30.66  E-value=4.7e+02  Score=28.87  Aligned_cols=54  Identities=17%  Similarity=0.248  Sum_probs=30.8

Q ss_pred             hHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          773 EGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       773 E~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      |++.++..+     .+..++|+++.+|.+.++...      +.-.+-+++.++|  .+-++||++|+
T Consensus        52 ei~elkd~~-----lR~~Ae~eN~rkR~~rE~~~~------~~~a~~~~~~~LL--pvlDnLerAl~  105 (191)
T PRK14140         52 KLDELEERY-----LRLQADFENYKRRIQKENEAA------EKYRAQSLASDLL--PALDNFERALQ  105 (191)
T ss_pred             HHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHH--HHHHHHHHHHh
Confidence            344455544     355578888888877766332      2333334444444  35577888776


No 392
>PRK14148 heat shock protein GrpE; Provisional
Probab=30.60  E-value=4.1e+02  Score=29.43  Aligned_cols=43  Identities=21%  Similarity=0.315  Sum_probs=19.6

Q ss_pred             HHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          789 VKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       789 lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      +.++|+++.+|.+.++..      .+...+-+++.+.|  .+-++||++|.
T Consensus        66 ~~Ae~eN~rKR~~rE~e~------~~~~a~~~~~~~LL--pV~DnlerAl~  108 (195)
T PRK14148         66 AKAEMENIRKRAERDVSN------ARKFGIEKFAKELL--PVIDSIEQALK  108 (195)
T ss_pred             HHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            344555555555444322      22223333333333  34466776665


No 393
>PF12868 DUF3824:  Domain of unknwon function (DUF3824);  InterPro: IPR024436 This repeating domain is proline-rich but its function is unknown.
Probab=30.56  E-value=1.1e+02  Score=31.88  Aligned_cols=13  Identities=38%  Similarity=0.851  Sum_probs=7.3

Q ss_pred             ccccCCCCCCCCC
Q 001070           20 RNWFPPYPPPSSS   32 (1165)
Q Consensus        20 ~~~~~~~~~~~~~   32 (1165)
                      .|.|+|+|...+.
T Consensus        76 ~n~~ppPP~~~p~   88 (137)
T PF12868_consen   76 SNYFPPPPGSTPY   88 (137)
T ss_pred             cccCCCCCCCCCC
Confidence            4666666655444


No 394
>cd09236 V_AnPalA_UmRIM20_like Protein-interacting V-domains of Aspergillus nidulans PalA/RIM20, Ustilago maydis RIM20, and related proteins. This family belongs to the V_Alix_like superfamily which includes the V-shaped (V) domains of Bro1 and Rim20 from Saccharomyces cerevisiae, mammalian Alix (apoptosis-linked gene-2 interacting protein X), His-Domain type N23 protein tyrosine phosphatase (HD-PTP, also known as PTPN23), and related domains. Aspergillus nidulas PalA/RIM20 and Ustilago maydis RIM20, like Saccharomyces cerevisiae Rim20, participate in the response to the external pH via the Pal/Rim101 pathway; however, Saccharomyces cerevisiae Rim20 does not belong to this family. This pathway is a signaling cascade resulting in the activation of the transcription factor PacC/Rim101. The mammalian Alix V-domain (belonging to a different family) contains a binding site, partially conserved in the superfamily, for the retroviral late assembly (L) domain YPXnL motif. Aspergillus nidulas Pa
Probab=30.50  E-value=9.1e+02  Score=28.61  Aligned_cols=81  Identities=16%  Similarity=0.177  Sum_probs=43.4

Q ss_pred             hhHHHHHHHHHHHHHHHHHHHHHHHHhhhh--------cccchhhhHHHHHHHH-----H-HHHHHHHHHhH---HHHHH
Q 001070          736 AAFSQVIAMQDMLNQLMTMQKELQKQMSNL--------VTLPVTKEGRRLEASL-----G-RGIEKAVKAST---DALWA  798 (1165)
Q Consensus       736 ~~~~q~~~mq~~l~ql~~~qke~qkqm~~~--------v~~plsKE~kklE~~L-----~-~~ieK~lk~el---d~L~~  798 (1165)
                      ..-.+|..+.+.|++|-.|.++=.+=+..+        ++.-+-.+.+++|..-     . +.|+..|.++|   |.+-.
T Consensus       189 ~~~~~i~~Lr~~l~~l~~l~~eR~~~~~~Lk~k~~~DDI~~~ll~~~~~~~~~~~~~~i~~~~fe~lf~~eL~kf~~~~~  268 (353)
T cd09236         189 ELERHVRALRVSLEELDRLESRRRRKVERARTKARADDIRPEILREAARLEREYPATEVAPAHFEDLFDKRLAKYDKDLD  268 (353)
T ss_pred             hhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcCchHHHHHHHHhhhcccccccccHHHHHHHHHHHHHHhhHHHH
Confidence            445788888889999988887755533322        1123344444444431     1 23454444444   33333


Q ss_pred             HHHHHHHhHHHHHHHHHHHHHHHHHH
Q 001070          799 RFHEENARNEKLLRDRTQQITGLITN  824 (1165)
Q Consensus       799 R~dEerr~rEaa~~~RQ~qLL~LVS~  824 (1165)
                      ++++        ...+|+.|++=|..
T Consensus       269 ~l~~--------~~~~Q~~ll~~i~~  286 (353)
T cd09236         269 AVSE--------EAQEQEEILQQIEV  286 (353)
T ss_pred             HHHH--------HHHHHHHHHHHHHH
Confidence            3333        34556677775554


No 395
>PRK14141 heat shock protein GrpE; Provisional
Probab=30.31  E-value=5.9e+02  Score=28.53  Aligned_cols=45  Identities=18%  Similarity=0.360  Sum_probs=28.3

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      ++.++|+++.+|.+.++..      .|.-.+-+++.+.|  .+-++||++|..
T Consensus        56 R~~Ae~eN~RKR~~kE~e~------~~~~a~~~~~~dLL--pViDnLerAl~~  100 (209)
T PRK14141         56 RLAAEMENLRKRTQRDVAD------ARAYGIAGFARDML--SVSDNLRRALDA  100 (209)
T ss_pred             HHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hhHhHHHHHHhc
Confidence            5567888888888766533      23334444455544  455888888753


No 396
>PHA01750 hypothetical protein
Probab=29.98  E-value=1.9e+02  Score=27.08  Aligned_cols=33  Identities=15%  Similarity=0.343  Sum_probs=27.6

Q ss_pred             HHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHH
Q 001070          776 RLEASLGRGIEKAVKASTDALWARFHEENARNE  808 (1165)
Q Consensus       776 klE~~L~~~ieK~lk~eld~L~~R~dEerr~rE  808 (1165)
                      |+...|...++.-+++|+|+|...+++-+.++|
T Consensus        27 KIKq~lkdAvkeIV~~ELdNL~~ei~~~kikqD   59 (75)
T PHA01750         27 KIKQALKDAVKEIVNSELDNLKTEIEELKIKQD   59 (75)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhHH
Confidence            577788888888999999999999998875555


No 397
>KOG1922 consensus Rho GTPase effector BNI1 and related formins [Signal transduction mechanisms; Cytoskeleton]
Probab=29.84  E-value=91  Score=40.63  Aligned_cols=7  Identities=0%  Similarity=-0.249  Sum_probs=2.5

Q ss_pred             HHHHHHH
Q 001070          934 EQVDATF  940 (1165)
Q Consensus       934 qQV~~~F  940 (1165)
                      +.|...+
T Consensus       735 ~~l~~~~  741 (833)
T KOG1922|consen  735 KLLISEE  741 (833)
T ss_pred             HHHHHHH
Confidence            3333333


No 398
>PRK15362 pathogenicity island 2 effector protein SseC; Provisional
Probab=29.75  E-value=1.2e+03  Score=29.14  Aligned_cols=12  Identities=50%  Similarity=0.753  Sum_probs=5.8

Q ss_pred             CcccccCCCCCC
Q 001070          446 TNVVCVASPPLP  457 (1165)
Q Consensus       446 ~~~~~~~s~p~~  457 (1165)
                      .+++|.+|-+||
T Consensus        20 ~~~~~~~s~~l~   31 (473)
T PRK15362         20 SNVSCVSSGSLG   31 (473)
T ss_pred             cccccccCCCCC
Confidence            455555554433


No 399
>PRK14156 heat shock protein GrpE; Provisional
Probab=29.72  E-value=6.2e+02  Score=27.65  Aligned_cols=44  Identities=16%  Similarity=0.203  Sum_probs=25.6

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++-+|.+.++...      +....-+++.+.|  .+-++||++|.
T Consensus        52 R~~AEfeN~rKR~~rE~e~~------~~~a~~~~~~~LL--pVlDnLerAl~   95 (177)
T PRK14156         52 RAHAEMQNIQRRANEERQQL------QRYRSQDLAKAIL--PSLDNLERALA   95 (177)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            45577777777777665332      2333334444444  45578888875


No 400
>PF08450 SGL:  SMP-30/Gluconolaconase/LRE-like region;  InterPro: IPR013658 This family describes a region that is found in proteins expressed by a variety of eukaryotic and prokaryotic species. These proteins include various enzymes, such as senescence marker protein 30 (SMP-30, Q15493 from SWISSPROT), gluconolactonase (Q01578 from SWISSPROT) and luciferin-regenerating enzyme (LRE, Q86DU5 from SWISSPROT). SMP-30 is known to hydrolyse diisopropyl phosphorofluoridate in the liver, and has been noted as having sequence similarity, in the region described in this family, with PON1 (P52430 from SWISSPROT) and LRE. ; PDB: 2GHS_A 2DG0_L 2DG1_D 2DSO_D 3E5Z_A 2IAT_A 2IAV_A 2GVV_A 3HLI_A 2GVU_A ....
Probab=29.70  E-value=7.5e+02  Score=26.77  Aligned_cols=92  Identities=15%  Similarity=0.160  Sum_probs=47.6

Q ss_pred             EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccC
Q 001070          188 IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKS  267 (1165)
Q Consensus       188 VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~  267 (1165)
                      |..||..++. ...+.-. +  ..+++|. .   ++++++|+.   ...+.++|..++            +-...++...
T Consensus        24 i~~~~~~~~~-~~~~~~~-~--~~G~~~~-~---~~g~l~v~~---~~~~~~~d~~~g------------~~~~~~~~~~   80 (246)
T PF08450_consen   24 IYRVDPDTGE-VEVIDLP-G--PNGMAFD-R---PDGRLYVAD---SGGIAVVDPDTG------------KVTVLADLPD   80 (246)
T ss_dssp             EEEEETTTTE-EEEEESS-S--EEEEEEE-C---TTSEEEEEE---TTCEEEEETTTT------------EEEEEEEEET
T ss_pred             EEEEECCCCe-EEEEecC-C--CceEEEE-c---cCCEEEEEE---cCceEEEecCCC------------cEEEEeeccC
Confidence            4455555544 2223211 2  6677773 2   235656653   244455576443            3333444321


Q ss_pred             CCCCccccccEEEEEeecCCcEEEEeccCC--------CcEEEEEee
Q 001070          268 SAKPRVEEAFFNQVVVLSQAGLLLFANAKK--------NAIYSVHLG  306 (1165)
Q Consensus       268 s~~~~~~~aff~sV~~~p~a~~ilLan~~r--------~aIYalhl~  306 (1165)
                      ..   ....++|-++++|+++ |.+++...        ..||.+..+
T Consensus        81 ~~---~~~~~~ND~~vd~~G~-ly~t~~~~~~~~~~~~g~v~~~~~~  123 (246)
T PF08450_consen   81 GG---VPFNRPNDVAVDPDGN-LYVTDSGGGGASGIDPGSVYRIDPD  123 (246)
T ss_dssp             TC---SCTEEEEEEEE-TTS--EEEEEECCBCTTCGGSEEEEEEETT
T ss_pred             CC---cccCCCceEEEcCCCC-EEEEecCCCccccccccceEEECCC
Confidence            11   1357899999999998 55565544        357777665


No 401
>PRK14154 heat shock protein GrpE; Provisional
Probab=29.57  E-value=2.5e+02  Score=31.38  Aligned_cols=45  Identities=27%  Similarity=0.235  Sum_probs=29.4

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      .++.++|+++.+|.+.++..      .+...+-+++.++|  .+-++||++|.
T Consensus        76 lRl~ADfeNyRKR~~kE~e~------~~~~a~e~~~~~LL--pVlDnLeRAL~  120 (208)
T PRK14154         76 LRAQAEMDNLRKRIEREKAD------IIKFGSKQLITDLL--PVADSLIHGLE  120 (208)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            35568999998888876643      23344444555555  46688888875


No 402
>PF12252 SidE:  Dot/Icm substrate protein;  InterPro: IPR021014 This entry represents bacterial proteins that are typically between 397 and 1543 amino acids in length including SidE protein in the Dot/Icm pathway of Legionella pneumophila bacteria. There is little literature describing the family.
Probab=29.40  E-value=1.7e+03  Score=30.84  Aligned_cols=79  Identities=25%  Similarity=0.324  Sum_probs=40.7

Q ss_pred             HHHHHHHHHHHHHHH-----hhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHH
Q 001070          747 MLNQLMTMQKELQKQ-----MSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGL  821 (1165)
Q Consensus       747 ~l~ql~~~qke~qkq-----m~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~L  821 (1165)
                      +|+-|+--|..+.||     +.+.=.-|-.||+-+|-..|--+|-+ ++.+|..|.+-+----...++..+.|.+.|+.-
T Consensus      1029 ~L~~L~qCqdALeKqnIa~AL~ALn~IPSdKEms~Is~eLReQIq~-~KQ~LesLQRAV~TPVvtd~eKvr~rYe~LI~~ 1107 (1439)
T PF12252_consen 1029 VLQALTQCQDALEKQNIAGALQALNNIPSDKEMSKISSELREQIQS-VKQDLESLQRAVVTPVVTDAEKVRVRYETLITD 1107 (1439)
T ss_pred             HHHHHHHHHHHHHhhhHHHHHHHHhcCCchhhhhhhhHHHHHHHHH-HHHHHHHHHHhhcccccccHHHHHHHHHHHHHH
Confidence            455566667777774     44455556677766633333333332 222333332211111122456667788888887


Q ss_pred             HHHHH
Q 001070          822 ITNLI  826 (1165)
Q Consensus       822 VS~~L  826 (1165)
                      |+.-|
T Consensus      1108 iTKrI 1112 (1439)
T PF12252_consen 1108 ITKRI 1112 (1439)
T ss_pred             HHHHH
Confidence            76644


No 403
>PF05096 Glu_cyclase_2:  Glutamine cyclotransferase;  InterPro: IPR007788 This family of enzymes 2.3.2.5 from EC catalyse the cyclization of free L-glutamine and N-terminal glutaminyl residues in proteins to pyroglutamate (5-oxoproline) and pyroglutamyl residues respectively []. This family includes plant and bacterial enzymes and seems unrelated to the mammalian enzymes.; PDB: 3NOK_B 2FAW_A 2IWA_A 3NOM_A 3NOL_A 3MBR_X.
Probab=29.17  E-value=5.7e+02  Score=29.66  Aligned_cols=53  Identities=17%  Similarity=0.206  Sum_probs=37.0

Q ss_pred             CCCcceEEEEeccCC-------CCCccccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          254 AESWKCTQTLDLKSS-------AKPRVEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       254 ~~~w~C~QTLe~~~s-------~~~~~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      .++++|+-.+.+..-       .......++.|-+|++|.++-++|.--.=+-+|-|++.
T Consensus       202 p~tG~V~~~iDls~L~~~~~~~~~~~~~~dVLNGIAyd~~~~~l~vTGK~Wp~lyeV~l~  261 (264)
T PF05096_consen  202 PETGKVVGWIDLSGLRPEVGRDKSRQPDDDVLNGIAYDPETDRLFVTGKLWPKLYEVKLV  261 (264)
T ss_dssp             TTT-BEEEEEE-HHHHHHHTSTTST--TTS-EEEEEEETTTTEEEEEETT-SEEEEEEEE
T ss_pred             CCCCeEEEEEEhhHhhhcccccccccccCCeeEeEeEeCCCCEEEEEeCCCCceEEEEEE
Confidence            355688888876331       11112368999999999999999999999999999885


No 404
>PF07250 Glyoxal_oxid_N:  Glyoxal oxidase N-terminus;  InterPro: IPR009880 This entry represents the N terminus (approximately 300 residues) of a number of plant and fungal glyoxal oxidase enzymes. Glyoxal oxidase catalyses the oxidation of aldehydes to carboxylic acids, coupled with reduction of dioxygen to hydrogen peroxide. It is an essential component of the extracellular lignin degradation pathways of the wood-rot fungus Phanerochaete chrysosporium [].
Probab=28.89  E-value=1.8e+02  Score=32.95  Aligned_cols=94  Identities=10%  Similarity=0.235  Sum_probs=52.3

Q ss_pred             cCCccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCC--ceEEEeEccCcCCCCCCCCCCCcceE
Q 001070          183 RGHTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLN--REVKLWASASEEGWSLPTHAESWKCT  260 (1165)
Q Consensus       183 rGH~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGsln--rtIKLW~~a~~~~~~~~~~~~~w~C~  260 (1165)
                      .|+..=-+||..++. +.-+....--.--+=+||     +|++.|++||..+  +.|++++....          ...|.
T Consensus        43 d~~a~s~~yD~~tn~-~rpl~v~td~FCSgg~~L-----~dG~ll~tGG~~~G~~~ir~~~p~~~----------~~~~~  106 (243)
T PF07250_consen   43 DGPAHSVEYDPNTNT-FRPLTVQTDTFCSGGAFL-----PDGRLLQTGGDNDGNKAIRIFTPCTS----------DGTCD  106 (243)
T ss_pred             CceEEEEEEecCCCc-EEeccCCCCCcccCcCCC-----CCCCEEEeCCCCccccceEEEecCCC----------CCCCC
Confidence            333335688887764 111211111111222343     5567799999866  66877774331          11221


Q ss_pred             EEEeccCCCCCccccccEEEEEeecCCcEEEEeccC
Q 001070          261 QTLDLKSSAKPRVEEAFFNQVVVLSQAGLLLFANAK  296 (1165)
Q Consensus       261 QTLe~~~s~~~~~~~aff~sV~~~p~a~~ilLan~~  296 (1165)
                       -.+....-   ...-.|-++...||++.|+++-..
T Consensus       107 -w~e~~~~m---~~~RWYpT~~~L~DG~vlIvGG~~  138 (243)
T PF07250_consen  107 -WTESPNDM---QSGRWYPTATTLPDGRVLIVGGSN  138 (243)
T ss_pred             -ceECcccc---cCCCccccceECCCCCEEEEeCcC
Confidence             11211111   245789999999999999999888


No 405
>KOG1275 consensus PAB-dependent poly(A) ribonuclease, subunit PAN2 [Replication, recombination and repair]
Probab=28.86  E-value=26  Score=45.71  Aligned_cols=34  Identities=21%  Similarity=0.233  Sum_probs=31.6

Q ss_pred             eecCceEEEeecCCcEEEEeCcc-hhhHhhcCCcc
Q 001070          154 AVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHTK  187 (1165)
Q Consensus       154 AVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~q  187 (1165)
                      -=|++|+|.|--.|.|-+-|.++ ..-+.|.-|+.
T Consensus       184 R~Nnr~lf~G~t~G~V~LrD~~s~~~iht~~aHs~  218 (1118)
T KOG1275|consen  184 RYNNRNLFCGDTRGTVFLRDPNSFETIHTFDAHSG  218 (1118)
T ss_pred             EecCcEEEeecccceEEeecCCcCceeeeeecccc
Confidence            34899999999999999999999 88899999998


No 406
>PF10737 GerPC:  Spore germination protein GerPC;  InterPro: IPR019673  GerPC is required for the formation of functionally normal spores. The gerP locus encodes a number of proteins which are thought to be involved in the establishment of normal spore coat structure and/or permeability, which allows the access of germinants to their receptor []. 
Probab=28.73  E-value=3.7e+02  Score=29.43  Aligned_cols=71  Identities=15%  Similarity=0.164  Sum_probs=48.9

Q ss_pred             hHHHHHHHHHHHhHHHHHHHHHHhhhhhhhHHHHHHHHHHhHhhc-----chhHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          877 AVNQLERSVNSRLEATVGRQIQAQFQTSGKHALQDALKSSVEASV-----IPAFEKSCKAMFEQVDATFQKGMVEHTTAT  951 (1165)
Q Consensus       877 ~vnqLeK~V~s~Lp~aVaraIq~~vqtsv~qaIqdavr~af~stL-----IPAFE~scq~MFqQV~~~F~rGm~E~~~ql  951 (1165)
                      .+.++|+.....|-++-.+.|.    .++++-|.+.++-.+++.=     -|..+......+++|..++.+++..+++++
T Consensus        99 ~l~~~e~~~~~~ld~~y~~~Ii----eDIrKQl~~RI~~YlqQ~~~~~~~~~~~~~~~~~I~~kvK~DI~~ai~~FL~hL  174 (176)
T PF10737_consen   99 RLEQLEQQYNVPLDDSYRSFII----EDIRKQLPQRIQFYLQQVQPNEQMPPNEEAWEQQIIQKVKRDIDKAIDHFLQHL  174 (176)
T ss_pred             HHHHHHHHhCCCCcHHHHHHHH----HHHHHHhHHHHHHHHhcCCCCCCCCCChHHHHHHHHHHHHHHHHHHHHHHHHhC
Confidence            3456666666666666555554    4777788888777766532     244556678889999999999998877653


No 407
>PF04003 Utp12:  Dip2/Utp12 Family;  InterPro: IPR007148 A large ribonuclear protein complex is required for the processing of the small-ribosomal-subunit rRNA - the small-subunit (SSU) processome [, ]. This preribosomal complex contains the U3 snoRNA and at least 40 proteins, which have the following properties:   They are nucleolar. They are able to coimmunoprecipitate with the U3 snoRNA and Mpp10 (a protein specific to the SSU processome).  They are required for 18S rRNA biogenesis.  There appears to be a linkage between polymerase I transcription and the formation of the SSU processome; as some, but not all, of the SSU processome components are required for pre-rRNA transcription initiation. These SSU processome components have been termed t-Utps. They form a pre-complex with pre-18S rRNA in the absence of snoRNA U3 and other SSU processome components. It has been proposed that the t-Utp complex proteins are both rDNA and rRNA binding proteins that are involved in the initiation of pre18S rRNA transcription. Initially binding to rDNA then associating with the 5' end of the nascent pre18S rRNA. The t-Utpcomplex forms the nucleus around which the rest of the SSU processome components, including snoRNA U3, assemble []. From electron microscopy the SSU processome may correspond to the terminal knobs visualized at the 5' ends of nascent 18S rRNA.  This domain is found at the C terminus of proteins containing WD40 repeats. These proteins are part of the U3 ribonucleoprotein. In yeast, these proteins are called Utp5, Utp1 or Pwp2, Utp12 or DIP2 Q12220 from SWISSPROT. They interact with snoRNA U3 and with MPP10 []. Pwp2 is an essential Saccharomyces cerevisiae (Baker's yeast) protein involved in cell separation. 
Probab=28.69  E-value=97  Score=29.82  Aligned_cols=99  Identities=16%  Similarity=0.224  Sum_probs=61.8

Q ss_pred             CHHHHHHHhhccCcccccccCCCCcchhHHHHHHHHHhhhcc----cChHHHHHHHHHHHHH----cCCCCchhHHhHHH
Q 001070         1053 DVSIVSWLCSQVDMHGLLSMVPLPLSQGVLLSLLQQLACDIN----KDTARKLAWLTDVAAA----INPADPMIAVHARP 1124 (1165)
Q Consensus      1053 DlsLV~~LcsrvDP~~Lfsl~PlpLSQgVLLSLIQQLSsDL~----tdt~lKL~WLEeal~a----LDpsDP~IrehvPk 1124 (1165)
                      |..++..++.+.+++.|-...- .|+..-+.-|++-|+.-+.    .+.+.=+.||...+..    |-..++..+..+..
T Consensus         2 d~~ll~~vl~~~~~~~I~~tv~-~Lp~~~~~~LL~~l~~~l~~~~~~~~e~~l~Wl~~ll~~H~~~l~~~~~~~~~~L~~   80 (110)
T PF04003_consen    2 DEELLLEVLERIPPSDIENTVR-SLPFSYAERLLQFLSERLQTRKSPHVEFLLRWLKALLKTHGSYLSSSSPELRPVLRS   80 (110)
T ss_pred             HHHHHHHHHhhCCHHHHHHHHH-hCCHHHHHHHHHHHHHHhcccCCCchhHHHHHHHHHHHHHHHHHHhcCHHHHHHHHH
Confidence            4557777777777766533111 3445567778888888554    2568899999998875    33335677777777


Q ss_pred             HHHHHHHHHHhhhcCCCCccccchhHHHHHH
Q 001070         1125 IFEQVYQRLHHQRSSPTISGAELSSIRLLIH 1155 (1165)
Q Consensus      1125 IL~~L~qrL~~~~slp~~s~~d~~~lRLl~h 1155 (1165)
                      +...+.++++.+..+-+   .....|+++..
T Consensus        81 L~~~l~~~~~~l~~l~~---~n~~~L~~l~~  108 (110)
T PF04003_consen   81 LQKILRERLQNLSKLLD---LNLGRLDYLLS  108 (110)
T ss_pred             HHHHHHHHHHHHHHHHH---HhHHHHHHHHH
Confidence            77777777665443322   11245555543


No 408
>PF10154 DUF2362:  Uncharacterized conserved protein (DUF2362);  InterPro: IPR019311  This is a family of proteins conserved from nematodes to humans. The function is not known. 
Probab=28.35  E-value=5.4e+02  Score=32.48  Aligned_cols=77  Identities=25%  Similarity=0.343  Sum_probs=55.9

Q ss_pred             ChhhHHHHHHH---HHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHH--------hHHHHHHHHHH
Q 001070          734 APAAFSQVIAM---QDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKA--------STDALWARFHE  802 (1165)
Q Consensus       734 ~~~~~~q~~~m---q~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~--------eld~L~~R~dE  802 (1165)
                      .+..|+++.--   ...|..||.+...+-++|+.|+. --..|++||+.+-..+|++.+++        +++.+.+|.-|
T Consensus        89 ~ee~Fa~vyH~LiHSpaletLL~LE~~Ya~~vseli~-~Rd~el~kl~~rq~~Eme~a~q~Lg~~ltd~dIN~laaqH~E  167 (510)
T PF10154_consen   89 DEEDFAQVYHQLIHSPALETLLQLEHNYAKAVSELIQ-ARDQELKKLQERQTEEMEKAMQKLGISLTDRDINHLAAQHFE  167 (510)
T ss_pred             hhHHHHHHHHhhhccHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHhcCCCCCchhHHHHHHHHHH
Confidence            34445555421   23788899999999999999874 45788999999999999999887        57778777666


Q ss_pred             HHHhHHHHH
Q 001070          803 ENARNEKLL  811 (1165)
Q Consensus       803 err~rEaa~  811 (1165)
                      +++.-++.-
T Consensus       168 e~q~ie~kw  176 (510)
T PF10154_consen  168 EQQRIESKW  176 (510)
T ss_pred             HHHHHHHHH
Confidence            555544333


No 409
>PF06248 Zw10:  Centromere/kinetochore Zw10;  InterPro: IPR009361 Zeste white 10 (ZW10) was initially identified as a mitotic checkpoint protein involved in chromosome segregation, and then implicated in targeting cytoplasmic dynein and dynactin to mitotic kinetochores, but it is also important in non-dividing cells. These include cytoplasmic dynein targeting to Golgi and other membranes, and SNARE-mediated ER-Golgi trafficking [, ]. Dominant-negative ZW10, anti-ZW10 antibody, and ZW10 RNA interference (RNAi) cause Golgi dispersal. ZW10 RNAi also disperse endosomes and lysosomes []. Drosophila kinetochore components Rough deal (Rod) and Zw10 are required for the proper functioning of the metaphase checkpoint in flies []. The eukaryotic spindle assembly checkpoint (SAC) monitors microtubule attachment to kinetochores and prevents anaphase onset until all kinetochores are aligned on the metaphase plate. It is an essential surveillance mechanism that ensures high fidelity chromosome segregation during mitosis. In higher eukaryotes, cytoplasmic dynein is involved in silencing the SAC by removing the checkpoint proteins Mad2 and the Rod-Zw10-Zwilch complex (RZZ) from aligned kinetochores [, , ].; GO: 0007067 mitosis, 0000775 chromosome, centromeric region, 0005634 nucleus
Probab=27.88  E-value=1.3e+03  Score=29.08  Aligned_cols=26  Identities=12%  Similarity=0.195  Sum_probs=14.6

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHhhh
Q 001070          966 LRESVNSVSSMAQTLSGEFVDGQRKLF  992 (1165)
Q Consensus       966 L~etIssmaa~q~~LqsEll~lQrQL~  992 (1165)
                      |.+.+..|... ..|...+.++.+.|.
T Consensus       210 L~~vl~AL~~l-g~L~~~l~~~~~~Ll  235 (593)
T PF06248_consen  210 LQDVLQALEIL-GILDYKLKKFSKFLL  235 (593)
T ss_pred             HHHHHHHHHHh-CchhHHHHHHHHHHH
Confidence            77777777632 344444555555443


No 410
>PF14817 HAUS5:  HAUS augmin-like complex subunit 5
Probab=27.75  E-value=1.5e+03  Score=29.54  Aligned_cols=57  Identities=21%  Similarity=0.290  Sum_probs=35.9

Q ss_pred             HHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH---HHHHHH-HhhhhhHhh
Q 001070          790 KASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKL---VKKELA-AVGPAIVRT  852 (1165)
Q Consensus       790 k~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~---LKkeV~-sVvPAI~~~  852 (1165)
                      -+++.+-|+||++.+...+    ++|++|-.||..  |.+...-+++.   +..-++ .|+|+-..+
T Consensus       388 ~~~Lq~K~q~I~~frqlv~----e~QeqIr~LiK~--Nsaakt~L~q~~~E~~~~~~~kl~P~~~~V  448 (632)
T PF14817_consen  388 LRSLQAKWQRILDFRQLVS----EKQEQIRALIKG--NSAAKTQLEQSPAEAQEFVQRKLVPQFEAV  448 (632)
T ss_pred             HHHHHHHHHHHHHHHHHHH----HHHHHHHHHHHh--hHHHHHHHHhChHHHHHHHhcccCCcHHHH
Confidence            3677788888988776654    788889888887  44555555442   222222 566765433


No 411
>PF06657 Cep57_MT_bd:  Centrosome microtubule-binding domain of Cep57;  InterPro: IPR010597  This entry is thought to represent a centrosomal protein of 57 kDa (Cep57-related protein). It is required for spindle microtubule attachment to both kinetochores and centrosomes and functions to tether minus-ends of spindle microtubules to centrosomes. It may act by forming ring-like structures around microtubules, or by serving as a cross-linker or scaffold at the attachment site [].
Probab=27.64  E-value=3.5e+02  Score=25.73  Aligned_cols=54  Identities=22%  Similarity=0.376  Sum_probs=37.7

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHH
Q 001070          738 FSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEE  803 (1165)
Q Consensus       738 ~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEe  803 (1165)
                      -.=|.++|+=+.|+-.-+.+++-+++.            |..+++.+..+.|..+++.+-.+|+.-
T Consensus        16 s~vl~~LqDE~~hm~~e~~~L~~~~~~------------~d~s~~~~~R~~L~~~l~~lv~~mE~K   69 (79)
T PF06657_consen   16 SEVLKALQDEFGHMKMEHQELQDEYKQ------------MDPSLGRRKRRDLEQELEELVKRMEAK   69 (79)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHh------------cccccChHHHHHHHHHHHHHHHHHHHH
Confidence            344567888888888888877665555            555666666777777777777777653


No 412
>PRK13616 lipoprotein LpqB; Provisional
Probab=27.64  E-value=7.6e+02  Score=31.55  Aligned_cols=138  Identities=13%  Similarity=0.170  Sum_probs=74.0

Q ss_pred             EeeecCceEEEee------cC--CcEEEEeCcchhhHhhcCCcc---------------------EEEeecC-CCceeEE
Q 001070          152 QIAVNKHYVCYGL------KG--GNVRVLNLNTATRSLLRGHTK---------------------IKIWEDS-KVAPLII  201 (1165)
Q Consensus       152 ~IAVn~~yIayG~------kd--g~IRVwdi~t~ir~llrGH~q---------------------VriWD~~-~g~pl~~  201 (1165)
                      .|+-||++|+|-.      .|  .+|.|++.....+.++.|..-                     +++.+.. ++. +.+
T Consensus       356 aiSpdG~~vA~v~~~~~~~~d~~s~Lwv~~~gg~~~~lt~g~~~t~PsWspDG~~lw~v~dg~~~~~v~~~~~~gq-l~~  434 (591)
T PRK13616        356 ALSRSGRQVAAVVTLGRGAPDPASSLWVGPLGGVAVQVLEGHSLTRPSWSLDADAVWVVVDGNTVVRVIRDPATGQ-LAR  434 (591)
T ss_pred             eECCCCCEEEEEEeecCCCCCcceEEEEEeCCCcceeeecCCCCCCceECCCCCceEEEecCcceEEEeccCCCce-EEE
Confidence            4777899998876      23  377788876655667777643                     1222111 111 111


Q ss_pred             ecCCC-------CCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEeccCCCCCccc
Q 001070          202 LKPHG-------GQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLKSSAKPRVE  274 (1165)
Q Consensus       202 lephd-------G~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~~s~~~~~~  274 (1165)
                      +.-..       +..|.++.|  +|||.- ..+|+.    ..|.+--..-.      .+++ -+++...++....     
T Consensus       435 ~~vd~ge~~~~~~g~Issl~w--SpDG~R-iA~i~~----g~v~Va~Vvr~------~~G~-~~l~~~~~l~~~l-----  495 (591)
T PRK13616        435 TPVDASAVASRVPGPISELQL--SRDGVR-AAMIIG----GKVYLAVVEQT------EDGQ-YALTNPREVGPGL-----  495 (591)
T ss_pred             EeccCchhhhccCCCcCeEEE--CCCCCE-EEEEEC----CEEEEEEEEeC------CCCc-eeecccEEeeccc-----
Confidence            11100       236999999  677754 323332    23333222111      1111 2343333332221     


Q ss_pred             cccEEEEEeecCCcEEEEeccCCCcEEEEEeecCCC
Q 001070          275 EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGYGNN  310 (1165)
Q Consensus       275 ~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~g~~  310 (1165)
                      .+-..++.-..++.++++++.....+|.+.++ |+.
T Consensus       496 ~~~~~~l~W~~~~~L~V~~~~~~~~v~~v~vD-G~~  530 (591)
T PRK13616        496 GDTAVSLDWRTGDSLVVGRSDPEHPVWYVNLD-GSN  530 (591)
T ss_pred             CCccccceEecCCEEEEEecCCCCceEEEecC-Ccc
Confidence            12224667778888998888777889999999 444


No 413
>PRK02888 nitrous-oxide reductase; Validated
Probab=27.63  E-value=5.4e+02  Score=33.25  Aligned_cols=162  Identities=16%  Similarity=0.146  Sum_probs=89.1

Q ss_pred             Cceee-cCCceEEecccCCCCCCCCCCcccccccccCCCcccccccEeeecCceEEEeec-CCcEEEEeCcchhhHhhcC
Q 001070          107 YGKRV-FGDYVAYDVDAVEEGREPTQQLEVNPITKYGSDPELLIGRQIAVNKHYVCYGLK-GGNVRVLNLNTATRSLLRG  184 (1165)
Q Consensus       107 ~Gr~l-~g~~~~~dVd~~~~ge~~~pqlev~pIt~Y~sd~~~~~GR~IAVn~~yIayG~k-dg~IRVwdi~t~ir~llrG  184 (1165)
                      .|++. .+.+.|-=||.+.-..+      ...++.|---+..+.|=-++-||+||+..-+ +..+-|+|+++ ++.+|.|
T Consensus       287 dGK~~~V~gn~V~VID~~t~~~~------~~~v~~yIPVGKsPHGV~vSPDGkylyVanklS~tVSVIDv~k-~k~~~~~  359 (635)
T PRK02888        287 AGKFKTIGGSKVPVVDGRKAANA------GSALTRYVPVPKNPHGVNTSPDGKYFIANGKLSPTVTVIDVRK-LDDLFDG  359 (635)
T ss_pred             CCCEEEECCCEEEEEECCccccC------CcceEEEEECCCCccceEECCCCCEEEEeCCCCCcEEEEEChh-hhhhhhc
Confidence            56655 44444445555441100      1256788888888889889999999877555 89999999976 3344544


Q ss_pred             CccEEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEe
Q 001070          185 HTKIKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLD  264 (1165)
Q Consensus       185 H~qVriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe  264 (1165)
                      -  +   |.++-   .+-++.=|.-....+|  .++|   . ..|+=-+|..|--|+++..-.. + .+.+.|.-++.+.
T Consensus       360 ~--~---~~~~~---vvaevevGlGPLHTaF--Dg~G---~-aytslf~dsqv~kwn~~~a~~~-~-~g~~~~~v~~k~d  423 (635)
T PRK02888        360 K--I---KPRDA---VVAEPELGLGPLHTAF--DGRG---N-AYTTLFLDSQIVKWNIEAAIRA-Y-KGEKVDPIVQKLD  423 (635)
T ss_pred             c--C---Cccce---EEEeeccCCCcceEEE--CCCC---C-EEEeEeecceeEEEehHHHHHH-h-ccccCCcceeccc
Confidence            3  1   22221   1111222444555666  2222   2 5566777888888999763110 0 1112466666665


Q ss_pred             ccCCCCCccccccEEEE--EeecCCcEEEEeccC
Q 001070          265 LKSSAKPRVEEAFFNQV--VVLSQAGLLLFANAK  296 (1165)
Q Consensus       265 ~~~s~~~~~~~aff~sV--~~~p~a~~ilLan~~  296 (1165)
                      .+-..   +|  .+-+.  -..|++.||+..|--
T Consensus       424 V~y~p---gh--~~~~~g~t~~~dgk~l~~~nk~  452 (635)
T PRK02888        424 VHYQP---GH--NHASMGETKEADGKWLVSLNKF  452 (635)
T ss_pred             CCCcc---ce--eeecCCCcCCCCCCEEEEcccc
Confidence            42211   11  00000  136888888877743


No 414
>PF11101 DUF2884:  Protein of unknown function (DUF2884);  InterPro: IPR021307  Some members in this bacterial family of proteins are annotated as YggN which currently has no known function. 
Probab=27.59  E-value=9.1e+02  Score=27.08  Aligned_cols=19  Identities=21%  Similarity=0.270  Sum_probs=8.3

Q ss_pred             HHHHHHHHHHHHHHHHHHH
Q 001070          964 LVLRESVNSVSSMAQTLSG  982 (1165)
Q Consensus       964 ~~L~etIssmaa~q~~Lqs  982 (1165)
                      ..|=+.+.+|...-++|+.
T Consensus       199 ~~lC~~l~~L~~~E~~L~~  217 (229)
T PF11101_consen  199 QALCDSLQQLDQQEQQLQQ  217 (229)
T ss_pred             HHHHHHHHHHHHHHHHHHH
Confidence            3344444444444444433


No 415
>PRK14151 heat shock protein GrpE; Provisional
Probab=27.52  E-value=5.9e+02  Score=27.69  Aligned_cols=46  Identities=13%  Similarity=0.180  Sum_probs=28.4

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      .++.++|+++.+|.+.|+...      +.-.+-+++.+.|  .+-++||++|..
T Consensus        44 lR~~Ae~eN~rkR~~kE~e~~------~~~a~~~~~~~LL--pv~DnlerAl~~   89 (176)
T PRK14151         44 LRAAADLQNVRRRAEQDVEKA------HKFALEKFAGDLL--PVVDSLERGLEL   89 (176)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHhc
Confidence            355678888888877766332      3334444445554  456888888753


No 416
>COG1283 NptA Na+/phosphate symporter [Inorganic ion transport and metabolism]
Probab=27.26  E-value=1.4e+03  Score=29.15  Aligned_cols=13  Identities=38%  Similarity=0.452  Sum_probs=5.3

Q ss_pred             chhhhHHHHHHHH
Q 001070          769 PVTKEGRRLEASL  781 (1165)
Q Consensus       769 plsKE~kklE~~L  781 (1165)
                      ...|+++|+|+.+
T Consensus       363 ~~~~~i~~~e~~v  375 (533)
T COG1283         363 KKVKEIRKLEDAV  375 (533)
T ss_pred             HHHHHHHHHHHHH
Confidence            3344444444333


No 417
>PF09903 DUF2130:  Uncharacterized protein conserved in bacteria (DUF2130);  InterPro: IPR019219  This entry, found in various hypothetical bacterial proteins, has no known function. 
Probab=27.21  E-value=5.2e+02  Score=29.79  Aligned_cols=47  Identities=19%  Similarity=0.287  Sum_probs=37.7

Q ss_pred             HHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHH
Q 001070          777 LEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITN  824 (1165)
Q Consensus       777 lE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~  824 (1165)
                      .|..+...+++ +..+++.+...|+.+.+.-+++-..|+.++-+++.+
T Consensus       192 fe~~~~~~~~~-~~~~~~~~~~~l~ke~~~i~k~~~k~ek~~e~l~~~  238 (267)
T PF09903_consen  192 FEEEFRQFIEA-IVENFEDMSKDLDKEIKAIDKAWKKREKQIEKLLSS  238 (267)
T ss_pred             HHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            45555555554 446889999999999999999999999999998844


No 418
>KOG2203 consensus GTP-binding protein [General function prediction only]
Probab=27.19  E-value=1.5e+03  Score=29.39  Aligned_cols=187  Identities=14%  Similarity=0.194  Sum_probs=0.0

Q ss_pred             HHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          759 QKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLV  838 (1165)
Q Consensus       759 qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~L  838 (1165)
                      ||+|.+-|         |-|+-.+-.|+.-+..+   =|..+.|.-.-.             ++|+ +.+-|...+|+.|
T Consensus       283 qqvlvAt~---------rceEIanE~~e~fitne---~~~e~~e~l~g~-------------l~s~-l~~kL~~i~e~~l  336 (772)
T KOG2203|consen  283 QQVLVATV---------RCEEIANEKLEEFITNE---KWLELIEALQGN-------------LVSG-LGKKLSSILEECL  336 (772)
T ss_pred             hhhHHhhh---------hHHHHHHHHHHHhhhhh---hHHHHHhhhcCC-------------Cccc-hhHHHHHHHHHHH


Q ss_pred             HHHHHHhhhhhHhhhhhhHHHHHHHHHHHHHhhcchhhhHHHHHHHHHHHhHHHHHHHHHH--hhhhhhhHHHHHH---H
Q 001070          839 KKELAAVGPAIVRTISPSIEKTITSAIVESFQRGVGDKAVNQLERSVNSRLEATVGRQIQA--QFQTSGKHALQDA---L  913 (1165)
Q Consensus       839 KkeV~sVvPAI~~~t~~avekqlss~l~eslq~~l~dk~vnqLeK~V~s~Lp~aVaraIq~--~vqtsv~qaIqda---v  913 (1165)
                       .+-..=.--..+-+...=..+|..++...+.-.+. .++++|-+.+-+.+-.++..++.+  .|..++.--.+..   +
T Consensus       337 -seYD~qAs~y~~~V~~~KrqqL~~kl~s~v~~~fq-~~L~~L~~~lle~fk~~~~~~~~~~~gF~es~~~~~~~~~~~f  414 (772)
T KOG2203|consen  337 -SEYDEQASRYDEGVYSEKRQQLNEKLLSHVYPTFQ-DVLGHLREGLLESFKLAFEKALKATEGFSESVADGKQSCEKKF  414 (772)
T ss_pred             -HHHhhHHHHHHHHHHHHHHHHHHHHHHHHhhHHHH-HHHHHHHHHHHHHHHHHHHhccccccchHHHHHHHHHHHHHHH


Q ss_pred             HHHhHhhcchhHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHhhhcCchHHHHHHHHHHHH
Q 001070          914 KSSVEASVIPAFEKSCKAMFEQVDATFQKGMVEHTT-ATLQHFESTHSPLALVLRESVNSV  973 (1165)
Q Consensus       914 r~af~stLIPAFE~scq~MFqQV~~~F~rGm~E~~~-qlQqq~dSaKtsLv~~L~etIssm  973 (1165)
                      .+..+...++...=.....-.++.++++..+..... ++.....--++.++-.|.+-|..+
T Consensus       415 de~~E~~~~~~~~wd~ski~~Kls~diea~i~~lr~akLke~~~~~e~~l~~else~Ve~l  475 (772)
T KOG2203|consen  415 DEECETAKIEQALWDTSKIREKLSRDIEAHISSLRTAKLKEKTGLYEKKLVPELSEPVEAL  475 (772)
T ss_pred             HhhhHhhcccccccchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcccHhhhHHHHHH


No 419
>PRK14144 heat shock protein GrpE; Provisional
Probab=26.76  E-value=5.9e+02  Score=28.36  Aligned_cols=45  Identities=22%  Similarity=0.295  Sum_probs=29.8

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      ++.++|+++.+|.+.++..      .|...+-+++.+.|  .+-+|||.+|..
T Consensus        70 R~~AefeN~RKR~~kE~e~------~~~~a~~~~~~~LL--pV~DnLerAl~~  114 (199)
T PRK14144         70 RALAELENVRRRMEREVAN------AHKYGVEKLISALL--PVVDSLEQALQL  114 (199)
T ss_pred             HHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hHHhHHHHHHHc
Confidence            4567888888888776533      34445555555555  566888888753


No 420
>KOG2444 consensus WD40 repeat protein [General function prediction only]
Probab=26.52  E-value=42  Score=37.83  Aligned_cols=21  Identities=24%  Similarity=0.588  Sum_probs=18.5

Q ss_pred             cCceEEEeecCCcEEEEeCcc
Q 001070          156 NKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t  176 (1165)
                      ++.|.|+|+.||.||-|++.-
T Consensus       113 ~~~~~c~~~~dg~ir~~n~~p  133 (238)
T KOG2444|consen  113 DSSLGCVGAQDGRIRACNIKP  133 (238)
T ss_pred             ccceeEEeccCCceeeecccc
Confidence            355899999999999999985


No 421
>PF09477 Type_III_YscG:  Bacterial type II secretion system chaperone protein (type_III_yscG);  InterPro: IPR013348  YscG is a molecular chaperone for YscE, where both are part of the type III secretion system that in Yersinia is designated Ysc (Yersinia secretion). The secretion system delivers effector proteins, designated Yops (Yersinia outer proteins), in Yersinia. This entry consists of YscG from Yersinia, and functionally equivalent type III secretion proteins in other species: e.g. AscG in Aeromonas and LscG in Photorhabdus luminescens.; GO: 0009405 pathogenesis; PDB: 3PH0_D 2UWJ_G 2P58_C.
Probab=26.47  E-value=60  Score=33.01  Aligned_cols=31  Identities=23%  Similarity=0.345  Sum_probs=22.2

Q ss_pred             HHHHHHhhccCcHHHHHHHHHhcCCHHHHHH
Q 001070         1029 TKELSRLVSDRKYEEAFTTALQRSDVSIVSW 1059 (1165)
Q Consensus      1029 ~~eI~qLI~eGqyEEAF~kALqSsDlsLV~~ 1059 (1165)
                      +..+..||+.|+|++|+...+...-..|.-|
T Consensus        44 lIr~~sLmNrG~Yq~ALl~~~~~~~pdL~p~   74 (116)
T PF09477_consen   44 LIRLSSLMNRGDYQEALLLPQCHCYPDLEPW   74 (116)
T ss_dssp             HHHHHHHHHTT-HHHHHHHHTTS--GGGHHH
T ss_pred             HHHHHHHHhhHHHHHHHHhcccCCCccHHHH
Confidence            5678889999999999888877766655444


No 422
>PRK14158 heat shock protein GrpE; Provisional
Probab=26.47  E-value=6.3e+02  Score=27.99  Aligned_cols=45  Identities=13%  Similarity=0.199  Sum_probs=29.0

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      ++.++|+++.+|.+.++...      +.-.+-+++.++|  .+-+|||++|..
T Consensus        65 R~~AefeN~RkR~~kE~e~~------~~~a~~~~~~~lL--pV~DnLerAl~~  109 (194)
T PRK14158         65 RERADLENYRKRVQKEKEEL------LKYGNESLILEIL--PAVDNMERALDH  109 (194)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHH--hHHhHHHHHHhc
Confidence            56689999999988776443      2333444444444  455888888853


No 423
>PRK10325 heat shock protein GrpE; Provisional
Probab=26.45  E-value=3.4e+02  Score=29.93  Aligned_cols=45  Identities=20%  Similarity=0.295  Sum_probs=28.3

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      .++.++|+++.+|.+.++..--      .-.+-+++.+.|  .+-++||.+|.
T Consensus        63 lR~~Ae~eN~rkR~~ke~~~~~------~~a~~~~~~~lL--pv~DnlerAl~  107 (197)
T PRK10325         63 LRVKAEMENLRRRTELDIEKAH------KFALEKFINELL--PVIDSLDRALE  107 (197)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHh--hHHhHHHHHHh
Confidence            3667899999999888764332      223333444444  45588888875


No 424
>PF14712 Snapin_Pallidin:  Snapin/Pallidin
Probab=26.27  E-value=5.5e+02  Score=24.22  Aligned_cols=27  Identities=22%  Similarity=0.287  Sum_probs=22.9

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHhhh
Q 001070          738 FSQVIAMQDMLNQLMTMQKELQKQMSN  764 (1165)
Q Consensus       738 ~~q~~~mq~~l~ql~~~qke~qkqm~~  764 (1165)
                      -|-+-.+.+.++.|..-|.++..+|..
T Consensus        13 ~P~l~~~~~~l~el~~sQ~~L~~~i~~   39 (92)
T PF14712_consen   13 EPDLDRLDQQLQELRQSQEELLQQIDR   39 (92)
T ss_pred             hhhHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            477778888999999999999888876


No 425
>smart00135 LY Low-density lipoprotein-receptor YWTD domain. Type "B" repeats in low-density lipoprotein (LDL) receptor that  plays a central role in mammalian cholesterol metabolism. Also present in a variety of molecules similar to gp300/megalin.
Probab=26.06  E-value=94  Score=24.10  Aligned_cols=31  Identities=19%  Similarity=0.126  Sum_probs=27.8

Q ss_pred             ccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          276 AFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       276 aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      ...+.+++++..++|.-+|..++.||+..++
T Consensus         9 ~~~~~la~d~~~~~lYw~D~~~~~I~~~~~~   39 (43)
T smart00135        9 GHPNGLAVDWIEGRLYWTDWGLDVIEVANLD   39 (43)
T ss_pred             CCcCEEEEeecCCEEEEEeCCCCEEEEEeCC
Confidence            4566789999999999999999999998876


No 426
>PF13570 PQQ_3:  PQQ-like domain; PDB: 3HXJ_B 3Q54_A.
Probab=26.04  E-value=85  Score=25.09  Aligned_cols=24  Identities=33%  Similarity=0.313  Sum_probs=18.8

Q ss_pred             eeecCceEEEeecCCcEEEEeCcc
Q 001070          153 IAVNKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       153 IAVn~~yIayG~kdg~IRVwdi~t  176 (1165)
                      ++|.+.+|..|..||++..+|.+|
T Consensus        17 ~~v~~g~vyv~~~dg~l~ald~~t   40 (40)
T PF13570_consen   17 PAVAGGRVYVGTGDGNLYALDAAT   40 (40)
T ss_dssp             -EECTSEEEEE-TTSEEEEEETT-
T ss_pred             CEEECCEEEEEcCCCEEEEEeCCC
Confidence            577788888899999999999875


No 427
>PF05960 DUF885:  Bacterial protein of unknown function (DUF885);  InterPro: IPR010281 This family consists of hypothetical bacterial proteins.; PDB: 3O0Y_B 3U24_A 3IUK_A.
Probab=25.79  E-value=5.1e+02  Score=31.93  Aligned_cols=30  Identities=13%  Similarity=0.284  Sum_probs=18.9

Q ss_pred             HHHHHHHHHHHHHHHHhhhhcccchhhhHH
Q 001070          746 DMLNQLMTMQKELQKQMSNLVTLPVTKEGR  775 (1165)
Q Consensus       746 ~~l~ql~~~qke~qkqm~~~v~~plsKE~k  775 (1165)
                      +.+.+....-+...+++..+...-|+.+-+
T Consensus        23 ~~~~~~~~~~~~~l~~L~~id~~~Ls~~~~   52 (549)
T PF05960_consen   23 EAIEQRLAELRKLLKRLEAIDRASLSPEQQ   52 (549)
T ss_dssp             HHHHHHHHHHHHHHHHHHTS-GSC-SHHHH
T ss_pred             HHHHHHHHHHHHHHHHHhCcCcccCCHHHH
Confidence            355666666777777888877777766543


No 428
>cd00179 SynN Syntaxin N-terminus domain; syntaxins are nervous system-specific proteins implicated in the docking of synaptic vesicles with the presynaptic plasma membrane; they are a family of receptors for intracellular transport vesicles; each target membrane may be identified by a specific member of the syntaxin family; syntaxins contain a moderately well conserved amino-terminal domain, called Habc, whose structure is an antiparallel three-helix bundle; a linker of about 30 amino acids connects this to the carboxy-terminal region, designated H3 (t_SNARE), of the syntaxin cytoplasmic domain; the highly conserved H3 region forms a single, long alpha-helix when it is part of the core SNARE complex and anchors the protein on the cytoplasmic surface of cellular membranes; H3 is not included in defining this domain
Probab=25.69  E-value=4.7e+02  Score=26.41  Aligned_cols=9  Identities=11%  Similarity=0.265  Sum_probs=3.5

Q ss_pred             HHHHHHHHH
Q 001070          740 QVIAMQDML  748 (1165)
Q Consensus       740 q~~~mq~~l  748 (1165)
                      .+-.+...|
T Consensus         7 ~v~~I~~~i   15 (151)
T cd00179           7 EVEEIRGNI   15 (151)
T ss_pred             HHHHHHHHH
Confidence            333344433


No 429
>PF01025 GrpE:  GrpE;  InterPro: IPR000740  Molecular chaperones are a diverse family of proteins that function to protect proteins in the intracellular milieu from irreversible aggregation during synthesis and in times of cellular stress. The bacterial molecular chaperone DnaK is an enzyme that couples cycles of ATP binding, hydrolysis, and ADP release by an N-terminal ATP-hydrolysing domain to cycles of sequestration and release of unfolded proteins by a C-terminal substrate binding domain. In prokaryotes the grpE protein. Dimeric GrpE is the co-chaperone for DnaK, and acts as a nucleotide exchange factor, stimulating the rate of ADP release 5000-fold []. DnaK is itself a weak ATPase; ATP hydrolysis by DnaK is stimulated by its interaction with another co-chaperone, DnaJ. Thus the co-chaperones DnaJ and GrpE are capable of tightly regulating the nucleotide-bound and substrate-bound state of DnaK in ways that are necessary for the normal housekeeping functions and stress-related functions of the DnaK molecular chaperone cycle.  The X-ray crystal structure of GrpE in complex with the ATPase domain of DnaK revealed that GrpE is an asymmetric homodimer, bent in a manner that favours extensive contacts with only one DnaKATPase monomer []. GrpE does not actively compete for the atomic positions occupied by the nucleotide. GrpE and ADP mutually reduce one another's affinity for DnaK 200-fold, and ATP instantly dissociates GrpE from DnaK.; GO: 0000774 adenyl-nucleotide exchange factor activity, 0042803 protein homodimerization activity, 0051087 chaperone binding, 0006457 protein folding; PDB: 3A6M_A 4ANI_A 1DKG_B.
Probab=25.65  E-value=2.4e+02  Score=29.27  Aligned_cols=30  Identities=23%  Similarity=0.266  Sum_probs=16.9

Q ss_pred             hhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHH
Q 001070          771 TKEGRRLEASLGRGIEKAVKASTDALWARFHEENA  805 (1165)
Q Consensus       771 sKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr  805 (1165)
                      .+++++++..+.     ...++++++++|++.+..
T Consensus        24 ~~~~~~l~~~~~-----r~~ae~en~~~r~~~e~~   53 (165)
T PF01025_consen   24 EKEIEELKERLL-----RLQAEFENYRKRLEKEKE   53 (165)
T ss_dssp             HHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHH
T ss_pred             HHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHH
Confidence            344444444443     344677788877766543


No 430
>KOG2444 consensus WD40 repeat protein [General function prediction only]
Probab=25.56  E-value=1.1e+02  Score=34.75  Aligned_cols=17  Identities=35%  Similarity=0.460  Sum_probs=13.9

Q ss_pred             eEEEeecCCcEEEEeCc
Q 001070          159 YVCYGLKGGNVRVLNLN  175 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~  175 (1165)
                      -++-|..+|.|.+|+-+
T Consensus        72 ~~~vG~~dg~v~~~n~n   88 (238)
T KOG2444|consen   72 KLMVGTSDGAVYVFNWN   88 (238)
T ss_pred             eEEeecccceEEEecCC
Confidence            34458899999999888


No 431
>PF00780 CNH:  CNH domain;  InterPro: IPR001180 Based on sequence similarities a domain of homology has been identified in the following proteins []:  Citron and Citron kinase. These two proteins interact with the GTP-bound forms of the small GTPases Rho and Rac but not with Cdc42. Myotonic dystrophy kinase-related Cdc42-binding kinase (MRCKalpha). This serine/threonine kinase interacts with the GTP-bound form of the small GTPase Cdc42 and to a lesser extent with that of Rac. NCK Interacting Kinase (NIK), a serine/threonine protein kinase. ROM-1 and ROM-2, from yeast. These proteins are GDP/GTP exchange proteins (GEPs) for the small GTP binding protein Rho1.  This domain, called the citron homology domain, is often found after cysteine rich and pleckstrin homology (PH) domains at the C-terminal end of the proteins []. It acts as a regulatory domain and could be involved in macromolecular interactions [, ].; GO: 0005083 small GTPase regulator activity
Probab=25.31  E-value=4.8e+02  Score=28.59  Aligned_cols=100  Identities=22%  Similarity=0.356  Sum_probs=52.8

Q ss_pred             EeeecCceEEEeecCCcEEEEeCcc-hhhHhhcCCc------------c-EEEeecCCCce------eEEecCCCCCCcc
Q 001070          152 QIAVNKHYVCYGLKGGNVRVLNLNT-ATRSLLRGHT------------K-IKIWEDSKVAP------LIILKPHGGQPVN  211 (1165)
Q Consensus       152 ~IAVn~~yIayG~kdg~IRVwdi~t-~ir~llrGH~------------q-VriWD~~~g~p------l~~lephdG~sV~  211 (1165)
                      .|+.-+.+||.|.+++ .-+.|+.+ ....++.-..            + +.+++..++.-      +..|--.+|+.+.
T Consensus       143 ~i~~~~~~i~v~~~~~-f~~idl~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~Ll~~~~~g~fv~~~G~~~r  221 (275)
T PF00780_consen  143 SIAFLGNKICVGTSKG-FYLIDLNTGSPSELLDPSDSSSSFKSRNSSSKPLGIFQLSDNEFLLCYDNIGVFVNKNGEPSR  221 (275)
T ss_pred             EEEEeCCEEEEEeCCc-eEEEecCCCCceEEeCccCCcchhhhcccCCCceEEEEeCCceEEEEecceEEEEcCCCCcCc
Confidence            3555588899998665 77788886 5665552111            1 33333322211      2223333454332


Q ss_pred             --eeEeecCCCC--CCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          212 --SAQYLTAPNQ--AGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       212 --SVaFl~aP~~--~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                        .+.|-..|..  =..-||++-++  +.|-+|++.++            +++|++.++
T Consensus       222 ~~~i~W~~~p~~~~~~~pyli~~~~--~~iEV~~~~~~------------~lvQ~i~~~  266 (275)
T PF00780_consen  222 KSTIQWSSAPQSVAYSSPYLIAFSS--NSIEVRSLETG------------ELVQTIPLP  266 (275)
T ss_pred             ccEEEcCCchhEEEEECCEEEEECC--CEEEEEECcCC------------cEEEEEECC
Confidence              3333222221  01123664444  66999999555            899999973


No 432
>PF11715 Nup160:  Nucleoporin Nup120/160;  InterPro: IPR021717  Nup120 is conserved from fungi to plants to humans, and is homologous with the Nup160 of vertebrates. The nuclear core complex, or NPC, mediates macromolecular transport across the nuclear envelope. Deletion of the NUP120 gene causes clustering of NPCs at one side of the nuclear envelope, moderate nucleolar fragmentation and slower cell growth []. The vertebrate NPC is estimated to contain between 30 and 60 different proteins. most of which are not known. Two important ones in creating the nucleoporin basket are Nup98 and Nup153, and Nup120, in conjunction with Nup 133, interacts with these two and itself plays a role in mRNA export []. Nup160, Nup133, Nup96, and Nup107 are all targets of phosphorylation. The phosphorylation sites are clustered mainly at the N-terminal regions of these proteins, which are predicted to be natively disordered. The entire Nup107-160 subcomplex is stable throughout the cell cycle, thus it seems unlikely that phosphorylation affects interactions within the Nup107-160 subcomplex, but rather that it regulates the association of the subcomplex with the NPC and other proteins []. ; PDB: 3F7F_D 3H7N_D 3HXR_A.
Probab=25.30  E-value=55  Score=40.15  Aligned_cols=24  Identities=13%  Similarity=0.245  Sum_probs=21.1

Q ss_pred             cCceEEEeecCCcEEEEeCcchhh
Q 001070          156 NKHYVCYGLKGGNVRVLNLNTATR  179 (1165)
Q Consensus       156 n~~yIayG~kdg~IRVwdi~t~ir  179 (1165)
                      +..||++-.+|+++||||+.+..+
T Consensus       229 ~~~~l~tl~~D~~LRiW~l~t~~~  252 (547)
T PF11715_consen  229 DDTFLFTLSRDHTLRIWSLETGQC  252 (547)
T ss_dssp             TTTEEEEEETTSEEEEEETTTTCE
T ss_pred             CCCEEEEEeCCCeEEEEECCCCeE
Confidence            689999999999999999998443


No 433
>KOG1832 consensus HIV-1 Vpr-binding protein [Cell cycle control, cell division, chromosome partitioning]
Probab=25.22  E-value=99  Score=40.76  Aligned_cols=42  Identities=10%  Similarity=0.308  Sum_probs=31.3

Q ss_pred             cccccccCCCcccccccEeeecCceEEEeecCCcEEEEeCcc
Q 001070          135 VNPITKYGSDPELLIGRQIAVNKHYVCYGLKGGNVRVLNLNT  176 (1165)
Q Consensus       135 v~pIt~Y~sd~~~~~GR~IAVn~~yIayG~kdg~IRVwdi~t  176 (1165)
                      ..|+-.+-.+-.++.---++++..+|+-|+-.|.|+++|..+
T Consensus      1091 Fr~w~~frd~~~~fTc~afs~~~~hL~vG~~~Geik~~nv~s 1132 (1516)
T KOG1832|consen 1091 FRSWRSFRDETALFTCIAFSGGTNHLAVGSHAGEIKIFNVSS 1132 (1516)
T ss_pred             cccchhhhccccceeeEEeecCCceEEeeeccceEEEEEccC
Confidence            345555555554444445778899999999999999999987


No 434
>PF14644 DUF4456:  Domain of unknown function (DUF4456)
Probab=25.13  E-value=9.4e+02  Score=26.44  Aligned_cols=76  Identities=12%  Similarity=0.120  Sum_probs=38.1

Q ss_pred             HHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHh-----------------
Q 001070          744 MQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENAR-----------------  806 (1165)
Q Consensus       744 mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~-----------------  806 (1165)
                      .++.=+|+......+.+-...++..-..++.++++.++....     ..|..++++.++.+..                 
T Consensus        53 ~~elR~qv~~l~~~l~~v~~lv~~~~~~~~~~~~~~~~~~i~-----~~f~~~~~~~~~~k~~h~~~LrP~LghP~~~~e  127 (208)
T PF14644_consen   53 LQELRNQVERLEELLPKVPELVFESLLKRHWQKLCEAMKAIQ-----EEFEQQQKQWEQQKDQHEQQLRPNLGHPDNRQE  127 (208)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHhCCCcCCCCCCHHH
Confidence            444555555555555555555444444444455544433222     2344444444444433                 


Q ss_pred             ---HHHHHHHHHHHHHHHHHH
Q 001070          807 ---NEKLLRDRTQQITGLITN  824 (1165)
Q Consensus       807 ---rEaa~~~RQ~qLL~LVS~  824 (1165)
                         ..+++.+||.....+|.+
T Consensus       128 L~~L~~~E~~R~~~~~~~I~~  148 (208)
T PF14644_consen  128 LESLCEREEKRQKEHQEAIQN  148 (208)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH
Confidence               334556677666666666


No 435
>PF15469 Sec5:  Exocyst complex component Sec5
Probab=25.08  E-value=8.3e+02  Score=25.81  Aligned_cols=62  Identities=19%  Similarity=0.182  Sum_probs=40.2

Q ss_pred             hHHHHHHHHHHhhhhhhhHHHHHHHHHHhHhhcchhHHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHhhhcC
Q 001070          889 LEATVGRQIQAQFQTSGKHALQDALKSSVEASVIPAFEKS--CKAMFEQVDATFQKGMVEHTTATLQHFESTH  959 (1165)
Q Consensus       889 Lp~aVaraIq~~vqtsv~qaIqdavr~af~stLIPAFE~s--cq~MFqQV~~~F~rGm~E~~~qlQqq~dSaK  959 (1165)
                      ||..+.++|+.   .+--.+|.+--      ..-..|+..  -..+|++|-.+++.-+.++...+.+++....
T Consensus        89 LP~~L~~~i~~---~dy~~~i~dY~------kak~l~~~~~~~~~vf~~v~~eve~ii~~~r~~l~~~L~~~~  152 (182)
T PF15469_consen   89 LPSNLRECIKK---GDYDQAINDYK------KAKSLFEKYKQQVPVFQKVWSEVEKIIEEFREKLWEKLLSPP  152 (182)
T ss_pred             hHHHHHHHHHc---CcHHHHHHHHH------HHHHHHHHhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHhCCC
Confidence            77777777776   55555555541      122333333  4567777888888888888888877666554


No 436
>KOG0119 consensus Splicing factor 1/branch point binding protein (RRM superfamily) [RNA processing and modification]
Probab=25.08  E-value=1.9e+02  Score=36.00  Aligned_cols=71  Identities=31%  Similarity=0.462  Sum_probs=0.0

Q ss_pred             ccCCCCCCCCCCCCCCCCCCCCCCCC-CCCC-------------------------------CCCCCCCCCCCCCCCCCC
Q 001070           22 WFPPYPPPSSSAAGDNFFPYPPPPPP-PPPE-------------------------------PHANMHPHPYPHGPHRLL   69 (1165)
Q Consensus        22 ~~~~~~~~~~~~~~~~~~~~~~ppp~-p~p~-------------------------------~~~~~~~~~~~~~~~~~~   69 (1165)
                      +.++||+-+...-|+-+.|+..|.|| ||+|                               |..+++.-.++.+|...-
T Consensus       436 ~~P~~Pp~~~~~p~~~~~ppg~p~pP~~p~Pg~~s~~~s~~P~q~s~~~~pp~~r~a~~~a~Pg~p~~~~~~~~vPpp~g  515 (554)
T KOG0119|consen  436 LAPAYPPTSYAPPPQSGQPPGIPLPPHPPPPGMQSAQSSSLPQQASTTSIPPGDRQAQAAAPPGAPFHGGNYNAVPPPPG  515 (554)
T ss_pred             cCCCCCCccCCCCCccCCCCCCCCCCCCCCCCccccccccCCcccccccCCcccccccccCCCCCCCCCCCCCCCCCCCC


Q ss_pred             CCCCCCCCCCCCCCChHHHHHhhcC
Q 001070           70 PYTPLPTTTVVSPNAGPQILALLNN   94 (1165)
Q Consensus        70 ~~~~~~~~~~~~~~~~~~~~~~l~~   94 (1165)
                      .+|..+|.+++.+++  -||-+|+.
T Consensus       516 ~~p~~pPgap~P~~~--~~~s~~~~  538 (554)
T KOG0119|consen  516 LQPANPPGAPPPPPS--PLFSLLNL  538 (554)
T ss_pred             CCCCCCCCCCCCCCc--chhccccc


No 437
>PF08703 PLC-beta_C:  PLC-beta C terminal;  InterPro: IPR014815 This domain corresponds to the alpha helical C-terminal domain of phospholipase C beta. ; GO: 0004435 phosphatidylinositol phospholipase C activity, 0005509 calcium ion binding, 0016042 lipid catabolic process; PDB: 1JAD_A.
Probab=25.05  E-value=9.6e+02  Score=26.52  Aligned_cols=87  Identities=22%  Similarity=0.316  Sum_probs=50.4

Q ss_pred             HHHHHHHhhhh----cccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          755 QKELQKQMSNL----VTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDL  830 (1165)
Q Consensus       755 qke~qkqm~~~----v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL  830 (1165)
                      .|||+|.|..=    |....+|+=-.+| ++-++|.++.-.++=..-.||.+...++.+....+|+.+|.-|.+. .+.+
T Consensus        69 ~KElkK~L~~kr~e~I~~k~~~dK~e~e-r~KrEin~s~I~e~V~~ikrL~~~qekrqekL~~kh~e~lq~i~ee-~~k~  146 (185)
T PF08703_consen   69 TKELKKKLDRKRLESIKEKKTKDKDEQE-RLKREINRSHIQEVVQEIKRLEEKQEKRQEKLEEKHEEVLQQIEEE-EKKL  146 (185)
T ss_dssp             HHHHHHHHHHHHHHHHHHTT---HHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHH
T ss_pred             HHHHHHHHhHHHHHHHHHhhcccHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHH
Confidence            45666654431    1123333333333 5666666665556656678888888888888888888888888774 2334


Q ss_pred             HHHHHHHHHHHHH
Q 001070          831 TASLEKLVKKELA  843 (1165)
Q Consensus       831 ~~nLEk~LKkeV~  843 (1165)
                      ...+++-....+.
T Consensus       147 q~~l~~eye~k~~  159 (185)
T PF08703_consen  147 QAELEQEYEEKMK  159 (185)
T ss_dssp             HHHHHHHHHHHHH
T ss_pred             HHHHHHHHHHHHH
Confidence            4444444444443


No 438
>PRK14162 heat shock protein GrpE; Provisional
Probab=24.89  E-value=6.9e+02  Score=27.67  Aligned_cols=44  Identities=16%  Similarity=0.246  Sum_probs=28.4

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|.+.++...      +.-.+-+++.++|  .+-+|||++|.
T Consensus        64 R~~AEfeN~rkR~~kE~e~~------~~~a~~~~~~~LL--pV~DnLerAl~  107 (194)
T PRK14162         64 RSQAEIQNMQNRYAKERAQL------IKYESQSLAKDVL--PAMDNLERALA  107 (194)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            55678899888887766433      3333444455554  45688888885


No 439
>smart00502 BBC B-Box C-terminal domain. Coiled coil region C-terminal to (some) B-Box domains
Probab=24.73  E-value=6.2e+02  Score=24.16  Aligned_cols=20  Identities=20%  Similarity=0.483  Sum_probs=8.1

Q ss_pred             HHHHHHHHHHHHHHHHHHhh
Q 001070          744 MQDMLNQLMTMQKELQKQMS  763 (1165)
Q Consensus       744 mq~~l~ql~~~qke~qkqm~  763 (1165)
                      +...|+.+....++++..+.
T Consensus         5 L~~~l~~l~~~~~~~~~~~~   24 (127)
T smart00502        5 LEELLTKLRKKAAELEDALK   24 (127)
T ss_pred             HHHHHHHHHHhhHHHHHHHH
Confidence            33344444444444444333


No 440
>PRK14160 heat shock protein GrpE; Provisional
Probab=24.70  E-value=7.6e+02  Score=27.75  Aligned_cols=45  Identities=16%  Similarity=0.173  Sum_probs=28.0

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      .++.++|+++.+|...++...      +...+-+++.+.|  .+-++||++|.
T Consensus        85 lR~~AefeN~RKR~~kE~e~~------~~~a~e~~~~~LL--pVlDnLerAl~  129 (211)
T PRK14160         85 LRTVAEYDNYRKRTAKEKEGI------YSDACEDVLKELL--PVLDNLERAAA  129 (211)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            345678888888887765332      3334444444444  45588888875


No 441
>COG0576 GrpE Molecular chaperone GrpE (heat shock protein) [Posttranslational modification, protein turnover, chaperones]
Probab=24.40  E-value=4.4e+02  Score=28.92  Aligned_cols=45  Identities=18%  Similarity=0.256  Sum_probs=25.8

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      .++.++|+++.+|.+.++..--  .++    +-+++.+.|  .+-+|||++|.
T Consensus        60 lr~~Ae~eN~rkR~~re~e~~~--k~a----~e~~~~dlL--pviDnlerAl~  104 (193)
T COG0576          60 LRAQAEFENLRKRTEREREEAK--KYA----IEKFAKDLL--PVIDNLERALE  104 (193)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH--HHH----HHHHHHHHH--HHHHHHHHHHH
Confidence            3556888999998887664332  222    222333333  34477777764


No 442
>KOG4640 consensus Anaphase-promoting complex (APC), subunit 4 [Cell cycle control, cell division, chromosome partitioning; Posttranslational modification, protein turnover, chaperones]
Probab=24.35  E-value=1.4e+02  Score=37.89  Aligned_cols=62  Identities=18%  Similarity=0.306  Sum_probs=40.2

Q ss_pred             eEEEeecCCcEEEEeCcchhhHhhcCCccEEEeecCCCceeEEecCCCCCCcc-eeEeecCCCCCCceEEEeecCCCceE
Q 001070          159 YVCYGLKGGNVRVLNLNTATRSLLRGHTKIKIWEDSKVAPLIILKPHGGQPVN-SAQYLTAPNQAGHIILVTAGPLNREV  237 (1165)
Q Consensus       159 yIayG~kdg~IRVwdi~t~ir~llrGH~qVriWD~~~g~pl~~lephdG~sV~-SVaFl~aP~~~d~~~lvtsGslnrtI  237 (1165)
                      .|||+.++|.|-+.=.+ .          =|||++-.          -|+.|. |++|  .||   ++.|+ =|=-|+||
T Consensus        34 LiA~~t~~gelli~R~n-~----------qRlwtip~----------p~~~v~~sL~W--~~D---Gklla-Vg~kdG~I   86 (665)
T KOG4640|consen   34 LIATRTEKGELLIHRLN-W----------QRLWTIPI----------PGENVTASLCW--RPD---GKLLA-VGFKDGTI   86 (665)
T ss_pred             hhheeccCCcEEEEEec-c----------ceeEeccC----------CCCccceeeee--cCC---CCEEE-EEecCCeE
Confidence            35566666655543222 1          47887741          266677 9999  454   56455 48888999


Q ss_pred             EEeEccCcCC
Q 001070          238 KLWASASEEG  247 (1165)
Q Consensus       238 KLW~~a~~~~  247 (1165)
                      +|-|...+.+
T Consensus        87 ~L~Dve~~~~   96 (665)
T KOG4640|consen   87 RLHDVEKGGR   96 (665)
T ss_pred             EEEEccCCCc
Confidence            9999977643


No 443
>PRK14149 heat shock protein GrpE; Provisional
Probab=24.28  E-value=3.5e+02  Score=29.87  Aligned_cols=44  Identities=14%  Similarity=0.179  Sum_probs=26.3

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|++.++...      +--.+-+++.+.|  .+-++||++|+
T Consensus        61 R~~AefEN~rKR~~kE~e~~------~~~a~~~~~~~LL--pVlDnLerAl~  104 (191)
T PRK14149         61 RVHADFENVKKRLERDKSMA------LEYAYEKIALDLL--PVIDALLGALK  104 (191)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            55678888888887765332      2233334444444  34577787775


No 444
>KOG0804 consensus Cytoplasmic Zn-finger protein BRAP2 (BRCA1 associated protein) [General function prediction only]
Probab=24.08  E-value=3.8e+02  Score=33.20  Aligned_cols=62  Identities=24%  Similarity=0.323  Sum_probs=41.4

Q ss_pred             HHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHH
Q 001070          743 AMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGL  821 (1165)
Q Consensus       743 ~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~L  821 (1165)
                      .|...+.|+=.-.|+++|++..            ++     ++++.+.++.+....++.+......++-.++.++|..|
T Consensus       379 ~~e~k~~q~q~k~~k~~kel~~------------~~-----E~n~~l~knq~vw~~kl~~~~e~~~~~~~s~d~~I~dL  440 (493)
T KOG0804|consen  379 IVERKLQQLQTKLKKCQKELKE------------ER-----EENKKLIKNQDVWRGKLKELEEREKEALGSKDEKITDL  440 (493)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH------------HH-----HHHHHHHhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            3445666666666666666554            21     66777777777777777777777777777777777654


No 445
>PRK14147 heat shock protein GrpE; Provisional
Probab=23.95  E-value=3.5e+02  Score=29.23  Aligned_cols=44  Identities=16%  Similarity=0.181  Sum_probs=27.1

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++-+|++.++...      +...+-+++.+.|  .+-++||.+|.
T Consensus        43 R~~Ad~eN~rkR~~kE~e~~------~~~a~~~~~~~lL--pv~DnlerAl~   86 (172)
T PRK14147         43 RERADLENQRKRIARDVEQA------RKFANEKLLGELL--PVFDSLDAGLT   86 (172)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hhhhHHHHHHh
Confidence            45588889988888776442      2233333444444  35578888875


No 446
>PRK14150 heat shock protein GrpE; Provisional
Probab=23.88  E-value=4.4e+02  Score=28.96  Aligned_cols=44  Identities=11%  Similarity=0.287  Sum_probs=24.9

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|.+.++..      .+.-.+-+++.+.|  .+-++||++|.
T Consensus        63 R~~AefeN~rkR~~kE~~~------~~~~a~~~~~~~lL--~v~DnlerAl~  106 (193)
T PRK14150         63 RARAEVENIRRRAEQDVEK------AHKFALEKFANELL--PVIDNLERALQ  106 (193)
T ss_pred             HHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHH--hHHhHHHHHHh
Confidence            4556777777776665532      23334444444444  45577777774


No 447
>KOG3859 consensus Septins (P-loop GTPases) [Cell cycle control, cell division, chromosome partitioning]
Probab=23.87  E-value=5.8e+02  Score=30.21  Aligned_cols=74  Identities=15%  Similarity=0.153  Sum_probs=44.2

Q ss_pred             HHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHH
Q 001070          743 AMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQI  818 (1165)
Q Consensus       743 ~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qL  818 (1165)
                      ..++.+.++-.-..||. ||=+.---.-.-|+|+-|..|+..|++ +++.-..-.+++++.+|..++.-.+-|.+.
T Consensus       327 Kr~e~~~e~qrkEee~r-qmFvqrvkekE~elke~Ekel~~kf~~-lkr~h~eEk~kle~~rr~Leee~~~f~~rk  400 (406)
T KOG3859|consen  327 KRNEFLGELQRKEEEMR-QMFVQRVKEKEAELKEAEKELHEKFDR-LKRLHQEEKKKLEEKRKQLEEEVNAFQRRK  400 (406)
T ss_pred             HHHHHHHHHHHhHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            46678888776666664 443322112234568888888888874 445545555667777766665555544443


No 448
>PRK14139 heat shock protein GrpE; Provisional
Probab=23.75  E-value=3.7e+02  Score=29.54  Aligned_cols=56  Identities=23%  Similarity=0.312  Sum_probs=33.1

Q ss_pred             hhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          771 TKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       771 sKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      -+|++.++..+     .++.++|+++.+|.+.++....      .-.+-+++.+.|  .+-++||+.|.
T Consensus        45 e~e~~elkd~~-----lR~~AefeN~rKR~~kE~e~~~------~~a~~~~~~~LL--pv~DnLerAl~  100 (185)
T PRK14139         45 EAKAAELQDSF-----LRAKAETENVRRRAQEDVAKAH------KFAIESFAESLL--PVKDSLEAALA  100 (185)
T ss_pred             HHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHh--hHHhHHHHHHh
Confidence            33444455444     3566899999999888764432      223333344444  45578888774


No 449
>PF10241 KxDL:  Uncharacterized conserved protein;  InterPro: IPR019371  This entry represents a conserved region of 80 residues which defines a family of short proteins. There is a characteristic KxDL motif towards the C terminus. The function is unknown. 
Probab=23.44  E-value=6.7e+02  Score=24.13  Aligned_cols=71  Identities=14%  Similarity=0.213  Sum_probs=43.2

Q ss_pred             ChhhHHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHH--HHHHHHHHHhHHHHHHHHHHHHHhHH
Q 001070          734 APAAFSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLG--RGIEKAVKASTDALWARFHEENARNE  808 (1165)
Q Consensus       734 ~~~~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~--~~ieK~lk~eld~L~~R~dEerr~rE  808 (1165)
                      +..-+-.+.++|.-+-..+.-..+|.+++....    ...++++..++.  .++-+.+|+.||..++||..-+++-.
T Consensus         9 d~~d~~~~l~~Q~~~l~~ln~tn~~L~~~n~~s----~~rl~~~~~~f~~~~~~l~~mK~DLd~i~krir~lk~kl~   81 (88)
T PF10241_consen    9 DPEDLDEILALQAQTLGRLNKTNEELLNLNDLS----QQRLAEARERFARHTKLLKEMKKDLDYIFKRIRSLKAKLA   81 (88)
T ss_pred             CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            334477788888844444444445555555533    233334444443  35568899999999999988776543


No 450
>KOG4191 consensus Histone acetyltransferases PCAF/SAGA/ADA, subunit TADA3L/NGG1 [Chromatin structure and dynamics]
Probab=23.28  E-value=7.9e+02  Score=30.63  Aligned_cols=99  Identities=12%  Similarity=0.203  Sum_probs=66.3

Q ss_pred             ChhhHHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHH
Q 001070          734 APAAFSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLLRD  813 (1165)
Q Consensus       734 ~~~~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~  813 (1165)
                      ++.++-.+-.+|..|-++-.-..++.++|-.|+    ..|+++.|  +.+.+. .+.++++.-|.|+-.-+++|-+--.+
T Consensus       403 dDEvlaeLR~lqaeLk~vS~~N~k~k~~Ll~la----~eE~a~qe--~~q~ld-dlDkqI~qaYvKr~r~~kkrKkht~~  475 (516)
T KOG4191|consen  403 DDEVLAELRKLQAELKAVSAHNRKKKHDLLRLA----PEEMARQE--FQQVLD-DLDKQIEQAYVKRNRSRKKRKKHTVT  475 (516)
T ss_pred             hHHHHHHHHHHHHHHHHHHhhhHHHHHHHHHhh----HHHHHHHH--HHHHHH-HHHHHHHHHHHHHHHHHHhhcccchH
Confidence            567788888899999999999999999998854    67777775  333333 46667777777766666665443333


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          814 RTQQITGLITNLINKDLTASLEKLVKKE  841 (1165)
Q Consensus       814 RQ~qLL~LVS~~LnktL~~nLEk~LKke  841 (1165)
                      --+.+++.|+.  ++-+...|+..+||.
T Consensus       476 ek~~~~~~~~e--q~~~~~~Lksl~kr~  501 (516)
T KOG4191|consen  476 EKIGSTSQISE--QSGSFPVLKSLMKRS  501 (516)
T ss_pred             hhhhhHHHHHH--HhhhHHHHHHHHHHh
Confidence            33345666666  345566666666554


No 451
>KOG4590 consensus Signal transduction protein Enabled, contains WH1 domain [Signal transduction mechanisms]
Probab=23.28  E-value=1.1e+02  Score=37.12  Aligned_cols=12  Identities=0%  Similarity=-0.294  Sum_probs=5.4

Q ss_pred             CcccccccccCC
Q 001070          132 QLEVNPITKYGS  143 (1165)
Q Consensus       132 qlev~pIt~Y~s  143 (1165)
                      .-.-.++..|..
T Consensus       241 ~~~~~~~~~~~~  252 (409)
T KOG4590|consen  241 TSSGSSKQDATY  252 (409)
T ss_pred             cCCCcCcccccc
Confidence            334445555543


No 452
>COG3823 Glutamine cyclotransferase [Posttranslational modification, protein turnover, chaperones]
Probab=23.02  E-value=3.3e+02  Score=31.01  Aligned_cols=34  Identities=15%  Similarity=0.211  Sum_probs=26.2

Q ss_pred             cccccEEEEEeecCCcEEEEeccCCCcEEEEEee
Q 001070          273 VEEAFFNQVVVLSQAGLLLFANAKKNAIYSVHLG  306 (1165)
Q Consensus       273 ~~~aff~sV~~~p~a~~ilLan~~r~aIYalhl~  306 (1165)
                      .+++.-|-++++|+.+-+++.--.=+.+|-|.+.
T Consensus       226 ~~~nvlNGIA~~~~~~r~~iTGK~wp~lfEVk~~  259 (262)
T COG3823         226 SNDNVLNGIAHDPQQDRFLITGKLWPLLFEVKLD  259 (262)
T ss_pred             cccccccceeecCcCCeEEEecCcCceeEEEEec
Confidence            4567888888888888888887777788777654


No 453
>PRK14145 heat shock protein GrpE; Provisional
Probab=22.53  E-value=5.2e+02  Score=28.72  Aligned_cols=46  Identities=15%  Similarity=0.208  Sum_probs=27.7

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVKK  840 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LKk  840 (1165)
                      .++.++|+++.+|...++...      +.-.+-+++.+.|  .+-++||++|+.
T Consensus        69 lR~~AEfeN~rkR~~kE~e~~------~~~a~e~~~~~LL--pV~DnLerAl~~  114 (196)
T PRK14145         69 QRLKAEFENYRKRTEKEKSEM------VEYGKEQVILELL--PVMDNFERALAS  114 (196)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHH--hHHhHHHHHHhc
Confidence            355678888888877765433      2333444444444  455788888754


No 454
>TIGR03513 GldL_gliding gliding motility-associated protein GldL. This protein family, GldL, is named for the member from Flavobacterium johnsoniae, which is required for a type of rapid gliding motility found in certain members of the Bacteriodetes. However, members are found also in several members of the Bacteriodetes that appear not to be motile
Probab=22.43  E-value=9.5e+02  Score=26.95  Aligned_cols=53  Identities=15%  Similarity=0.199  Sum_probs=27.6

Q ss_pred             HHHHHHHHHHHHhhhcCchHHHHHHHHH------HHHHHHHHHHHHHHHHHHHhhhhhh
Q 001070          943 GMVEHTTATLQHFESTHSPLALVLRESV------NSVSSMAQTLSGEFVDGQRKLFDLA  995 (1165)
Q Consensus       943 Gm~E~~~qlQqq~dSaKtsLv~~L~etI------ssmaa~q~~LqsEll~lQrQL~~~a  995 (1165)
                      .++|+++.+-+++++.-..+-.+|+++-      +.++.-.+.|..|+.++-++|.++.
T Consensus       134 ~Y~eqm~~aa~~l~~LN~~Ye~QL~~as~q~~~~~~i~~na~~fkeQ~~kLa~NL~sLN  192 (202)
T TIGR03513       134 KYIEQMSSLAANMEGLNTIYEAQLKGASSHADANNEIAINSSSLKEEMEKMAANLTSLN  192 (202)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            4444444444555555444444444332      2223334567777777777766543


No 455
>KOG3156 consensus Uncharacterized membrane protein [Function unknown]
Probab=22.02  E-value=1.2e+03  Score=26.50  Aligned_cols=141  Identities=21%  Similarity=0.256  Sum_probs=63.8

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHH-HhhhhhHhhhhhhHHHHHHHHHHHHHh--hcchhhhHHHHHHHHHHHhHHH
Q 001070          816 QQITGLITNLINKDLTASLEKLVKKELA-AVGPAIVRTISPSIEKTITSAIVESFQ--RGVGDKAVNQLERSVNSRLEAT  892 (1165)
Q Consensus       816 ~qLL~LVS~~LnktL~~nLEk~LKkeV~-sVvPAI~~~t~~avekqlss~l~eslq--~~l~dk~vnqLeK~V~s~Lp~a  892 (1165)
                      +.|..++++++|..+..+=+..+.|+=. .|.-- .+.....+.+.+.+.-...|.  +.=.||+.|.||| +++.|.+.
T Consensus        65 ETIt~aiT~v~ndsl~~vsk~~vtkaqq~~v~~Q-Q~~~f~kiRsel~S~e~sEF~~lr~e~EklkndlEk-~ks~lr~e  142 (220)
T KOG3156|consen   65 ETITSAITTVLNDSLETVSKELVTKAQQEKVSYQ-QKVDFAKIRSELVSIERSEFANLRAENEKLKNDLEK-LKSSLRHE  142 (220)
T ss_pred             HHHHHHHHHHHcccHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHH
Confidence            5677777776554443333333333322 22111 111222333444332222221  0123577777775 45778887


Q ss_pred             HHHHHHH-hhhhhhhHHHHHH-HHHHhHhhcchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhcCchHHHHHHHHH
Q 001070          893 VGRQIQA-QFQTSGKHALQDA-LKSSVEASVIPAFEKSCKAMFEQVDATFQKGMVEHTTATLQHFESTHSPLALVLRESV  970 (1165)
Q Consensus       893 VaraIq~-~vqtsv~qaIqda-vr~af~stLIPAFE~scq~MFqQV~~~F~rGm~E~~~qlQqq~dSaKtsLv~~L~etI  970 (1165)
                      +.+..+. ++.=    .|++. +++......+--+|         ++    ..+...+.-+..+++++|+...+-|-..+
T Consensus       143 i~~~~a~~rLdL----NLEkgr~~d~~~~~~l~~~e---------~s----~kId~Ev~~lk~qi~s~K~qt~qw~~g~v  205 (220)
T KOG3156|consen  143 ISKTTAEFRLDL----NLEKGRIKDESSSHDLQIKE---------IS----TKIDQEVTNLKTQIESVKTQTIQWLIGVV  205 (220)
T ss_pred             HHhcchhceeec----chhhccccchhhhcchhHhH---------HH----HHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            7765433 0000    01111 22222222222222         22    23333334556677888877777777766


Q ss_pred             HHHHH
Q 001070          971 NSVSS  975 (1165)
Q Consensus       971 ssmaa  975 (1165)
                      -+..+
T Consensus       206 ~~~~A  210 (220)
T KOG3156|consen  206 TGTSA  210 (220)
T ss_pred             HHHHH
Confidence            55444


No 456
>TIGR03185 DNA_S_dndD DNA sulfur modification protein DndD. This model describes the DndB protein encoded by an operon associated with a sulfur-containing modification to DNA. The operon is sporadically distributed in bacteria, much like some restriction enzyme operons. DndD is described as a putative ATPase. The small number of examples known so far include species from among the Firmicutes, Actinomycetes, Proteobacteria, and Cyanobacteria.
Probab=21.96  E-value=1.7e+03  Score=28.42  Aligned_cols=15  Identities=33%  Similarity=0.328  Sum_probs=8.4

Q ss_pred             chhhhHHHHHHHHHH
Q 001070          769 PVTKEGRRLEASLGR  783 (1165)
Q Consensus       769 plsKE~kklE~~L~~  783 (1165)
                      .+.++++++|..+..
T Consensus       206 ~~~~~~~~le~el~~  220 (650)
T TIGR03185       206 SILSEIEALEAELKE  220 (650)
T ss_pred             HHHHHHHHHHHHHHH
Confidence            445566666655544


No 457
>cd00179 SynN Syntaxin N-terminus domain; syntaxins are nervous system-specific proteins implicated in the docking of synaptic vesicles with the presynaptic plasma membrane; they are a family of receptors for intracellular transport vesicles; each target membrane may be identified by a specific member of the syntaxin family; syntaxins contain a moderately well conserved amino-terminal domain, called Habc, whose structure is an antiparallel three-helix bundle; a linker of about 30 amino acids connects this to the carboxy-terminal region, designated H3 (t_SNARE), of the syntaxin cytoplasmic domain; the highly conserved H3 region forms a single, long alpha-helix when it is part of the core SNARE complex and anchors the protein on the cytoplasmic surface of cellular membranes; H3 is not included in defining this domain
Probab=21.93  E-value=8.3e+02  Score=24.64  Aligned_cols=20  Identities=20%  Similarity=0.420  Sum_probs=13.6

Q ss_pred             HHHHHHHHHhHHHHHHHHHH
Q 001070          880 QLERSVNSRLEATVGRQIQA  899 (1165)
Q Consensus       880 qLeK~V~s~Lp~aVaraIq~  899 (1165)
                      .+|+........-|.|++.-
T Consensus       106 ~~Q~~~~~~~k~~i~Rq~~i  125 (151)
T cd00179         106 KAQRKYRERYKERIQRQLEI  125 (151)
T ss_pred             HHHHHHHHHHHHHHHHHHHH
Confidence            45667777777777777654


No 458
>KOG2129 consensus Uncharacterized conserved protein H4 [Function unknown]
Probab=21.55  E-value=1.6e+03  Score=27.88  Aligned_cols=29  Identities=17%  Similarity=0.288  Sum_probs=18.7

Q ss_pred             ccCcHHHHHHHHHhcCCHHHHHHHhhccC
Q 001070         1037 SDRKYEEAFTTALQRSDVSIVSWLCSQVD 1065 (1165)
Q Consensus      1037 ~eGqyEEAF~kALqSsDlsLV~~LcsrvD 1065 (1165)
                      .-|.++..|+-||..-.+.|..|-.--..
T Consensus       442 s~~~~~a~~l~al~~ekl~L~~w~~a~~s  470 (552)
T KOG2129|consen  442 SFAVLEAIRLEALRTEKLPLIAWRLAALS  470 (552)
T ss_pred             hHhhhhhhhhhhhcccccchHHHHHhhcc
Confidence            34567777778887766777666544333


No 459
>TIGR03752 conj_TIGR03752 integrating conjugative element protein, PFL_4705 family. Members of this protein family are found occasionally on plasmids such as the Pseudomonas putida toluene catabolic TOL plasmid pWWO_p085. Usually, however, they are found on the bacterial main chromosome in regions flanked by markers of conjugative transfer and/or transposition.
Probab=21.28  E-value=6.7e+02  Score=31.37  Aligned_cols=53  Identities=21%  Similarity=0.179  Sum_probs=33.4

Q ss_pred             HHHHHHHHHhcCCHHHHHHHhhccCcccccccCCCCcchhHHHHHHHHHhhhccc
Q 001070         1041 YEEAFTTALQRSDVSIVSWLCSQVDMHGLLSMVPLPLSQGVLLSLLQQLACDINK 1095 (1165)
Q Consensus      1041 yEEAF~kALqSsDlsLV~~LcsrvDP~~Lfsl~PlpLSQgVLLSLIQQLSsDL~t 1095 (1165)
                      -..|+-++|..+=..+-+|+-.+|-=.|=.-..|  =.+-|.|=|=|||..|-+.
T Consensus       412 G~~alG~alsgG~~e~adW~~krygqsFdAVyVp--pG~~vavHi~q~i~IDye~  464 (472)
T TIGR03752       412 GNYALGQALSGGVDEVADWVNKRYGQSFDAVYVP--PGAQVAVHIDQELAIDYEP  464 (472)
T ss_pred             HHHHHHhhhccchHHHHHHHHHHhhccccEEEeC--CCCEEEEEecccccCCCCc
Confidence            4667888888887779999988887543222122  1234445555777777654


No 460
>PF03276 Gag_spuma:  Spumavirus gag protein;  InterPro: IPR004957 The Spumavirus gag protein is a core viral polyprotein that undergoes specific enzymatic cleavages in vivo to yield the mature protein.; GO: 0019028 viral capsid
Probab=21.27  E-value=2.9e+02  Score=34.86  Aligned_cols=11  Identities=36%  Similarity=0.567  Sum_probs=7.2

Q ss_pred             hhhHhhcCCcc
Q 001070          177 ATRSLLRGHTK  187 (1165)
Q Consensus       177 ~ir~llrGH~q  187 (1165)
                      .+.+||-||-.
T Consensus       309 vvNALl~g~~G  319 (582)
T PF03276_consen  309 VVNALLGGHLG  319 (582)
T ss_pred             HHHHHhcCCCc
Confidence            44457777776


No 461
>PRK15361 pathogenicity island 2 effector protein SseD; Provisional
Probab=21.17  E-value=1.2e+03  Score=26.09  Aligned_cols=32  Identities=25%  Similarity=0.215  Sum_probs=21.0

Q ss_pred             hHHHHHHHHHHHHHHHHHHHHH-------HHHHHHHHHH
Q 001070          806 RNEKLLRDRTQQITGLITNLIN-------KDLTASLEKL  837 (1165)
Q Consensus       806 ~rEaa~~~RQ~qLL~LVS~~Ln-------ktL~~nLEk~  837 (1165)
                      ++=.....|+..+.++++++.+       |++++..||+
T Consensus       130 ~lg~a~mtR~Ad~ek~~sdlQ~~~AqsY~K~i~e~~dKA  168 (195)
T PRK15361        130 GLGAGVAQRQSDQDKAIADLQQNGAQSYNKSLTEIMEKA  168 (195)
T ss_pred             chhhhhHhhhHHHHHHHHHHHhccHHHHHhhHHHHHHHH
Confidence            4445667777778888877654       5666666655


No 462
>PF01690 PLRV_ORF5:  Potato leaf roll virus readthrough protein;  InterPro: IPR002929 This family consists mainly of the Potato leafroll virus (PLrV) read through protein otherwise known as the minor capsid protein. This is generated via a readthrough of open reading frame 3, the coat protein, allowing transcription of open reading frame 5 to give an extended coat protein with a large C-terminal addition or read through domain []. The read through protein is essential for the circulative aphid transmission of PLrV [] and Beet western yellows virus []. The N-terminal region of the luteovirus readthrough domain determines virus binding to Buchnera GroEL and is essential for virus persistence in the aphid [].; GO: 0019028 viral capsid
Probab=20.88  E-value=64  Score=39.59  Aligned_cols=8  Identities=38%  Similarity=0.335  Sum_probs=3.2

Q ss_pred             EEEEEeec
Q 001070          300 IYSVHLGY  307 (1165)
Q Consensus       300 IYalhl~~  307 (1165)
                      +--+||+-
T Consensus       182 ~~SFhl~~  189 (465)
T PF01690_consen  182 TISFHLEA  189 (465)
T ss_pred             eEEEEEEe
Confidence            33344443


No 463
>PRK14153 heat shock protein GrpE; Provisional
Probab=20.84  E-value=4.5e+02  Score=29.10  Aligned_cols=45  Identities=18%  Similarity=0.304  Sum_probs=27.2

Q ss_pred             HHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          787 KAVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       787 K~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      .++.++|+++-+|.+.++..      .+.-.+-+++.++|  .+-++||++|+
T Consensus        57 lR~~AEfeN~rKR~~kE~e~------~~~~a~~~~~~~LL--pv~DnLerAl~  101 (194)
T PRK14153         57 FRLAAEFDNFRKRTAREMEE------NRKFVLEQVLLDLL--EVTDNFERALE  101 (194)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            35667888888888876532      22333334444444  45578888875


No 464
>PF05918 API5:  Apoptosis inhibitory protein 5 (API5);  InterPro: IPR008383 This family consists of apoptosis inhibitory protein 5 (API5) sequences from several organisms. Apoptosis or programmed cell death is a physiological form of cell death that occurs in embryonic development and organ formation. It is characterised by biochemical and morphological changes such as DNA fragmentation and cell volume shrinkage. API5 is an anti apoptosis gene located in Homo sapiens chromosome 11, whose expression prevents the programmed cell death that occurs upon the deprivation of growth factors [,].; PDB: 3U0R_A 3V6A_A.
Probab=20.80  E-value=1.3e+03  Score=29.61  Aligned_cols=88  Identities=19%  Similarity=0.270  Sum_probs=43.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHH----HHHHhHHHHHHHHHHH
Q 001070          742 IAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFH----EENARNEKLLRDRTQQ  817 (1165)
Q Consensus       742 ~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~d----Eerr~rEaa~~~RQ~q  817 (1165)
                      ..+-+.|-||+.+..              ..|+.-+-.+|..-+.---+..|.+|+.++.    ++...||+...==.++
T Consensus        95 ~kvaDvL~QlL~tdd--------------~~E~~~v~~sL~~ll~~d~k~tL~~lf~~i~~~~~~de~~Re~~lkFl~~k  160 (556)
T PF05918_consen   95 SKVADVLVQLLQTDD--------------PVELDAVKNSLMSLLKQDPKGTLTGLFSQIESSKSGDEQVRERALKFLREK  160 (556)
T ss_dssp             HHHHHHHHHHTT-----------------HHHHHHHHHHHHHHHHH-HHHHHHHHHHHHH---HS-HHHHHHHHHHHHHH
T ss_pred             hHHHHHHHHHHhccc--------------HHHHHHHHHHHHHHHhcCcHHHHHHHHHHHHhcccCchHHHHHHHHHHHHH
Confidence            344466777665332              2233335566777677667778888888886    4444455332222233


Q ss_pred             HHHHHHHHHH--HHHHHHHHHHHHHHHH
Q 001070          818 ITGLITNLIN--KDLTASLEKLVKKELA  843 (1165)
Q Consensus       818 LL~LVS~~Ln--ktL~~nLEk~LKkeV~  843 (1165)
                      |..+-.+.++  +.+-+-|...|||.+.
T Consensus       161 l~~l~~~~~~p~~E~e~~i~~~ikkvL~  188 (556)
T PF05918_consen  161 LKPLKPELLTPQKEMEEFIVDEIKKVLQ  188 (556)
T ss_dssp             GGGS-TTTS---HHHHHHHHHHHHHHCT
T ss_pred             HhhCcHHHhhchHHHHHHHHHHHHHHHH
Confidence            3344444444  4444444444444443


No 465
>PRK14146 heat shock protein GrpE; Provisional
Probab=20.58  E-value=4.3e+02  Score=29.60  Aligned_cols=44  Identities=16%  Similarity=0.240  Sum_probs=28.5

Q ss_pred             HHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 001070          788 AVKASTDALWARFHEENARNEKLLRDRTQQITGLITNLINKDLTASLEKLVK  839 (1165)
Q Consensus       788 ~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL~LVS~~LnktL~~nLEk~LK  839 (1165)
                      ++.++|+++.+|.+.++...      +.-.+-+++.++|  .+-+|||+++.
T Consensus        79 R~~AdfeN~rkR~~kE~e~~------~~~a~e~~~~~lL--pv~DnlerAl~  122 (215)
T PRK14146         79 RERAEFQNFKRRSAQEFVSI------RKEAVKSLVSGFL--NPIDNLERVGA  122 (215)
T ss_pred             HHHHHHHHHHHHHHHHHHHH------HHHHHHHHHHHHh--hHHhHHHHHHh
Confidence            55678888888887766433      3444555555555  45688888775


No 466
>PF14781 BBS2_N:  Ciliary BBSome complex subunit 2, N-terminal
Probab=20.49  E-value=1.4e+02  Score=31.32  Aligned_cols=76  Identities=14%  Similarity=0.263  Sum_probs=44.7

Q ss_pred             cCCcEEEEeCcchhhHhhcCC---cc------------EEEeecCCCceeEEecCCCCCCcceeEeecCCCCCCceEEEe
Q 001070          165 KGGNVRVLNLNTATRSLLRGH---TK------------IKIWEDSKVAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVT  229 (1165)
Q Consensus       165 kdg~IRVwdi~t~ir~llrGH---~q------------VriWD~~~g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvt  229 (1165)
                      .+..||.+||+..++.|=.|-   ++            +-+||+..-.-+--.+-+||  |+++.|=.--+.+... +++
T Consensus        37 ~~~~i~~LNin~~italaaG~l~~~~~~D~LliGt~t~llaYDV~~N~d~Fyke~~DG--vn~i~~g~~~~~~~~l-~iv  113 (136)
T PF14781_consen   37 QDSDISFLNINQEITALAAGRLKPDDGRDCLLIGTQTSLLAYDVENNSDLFYKEVPDG--VNAIVIGKLGDIPSPL-VIV  113 (136)
T ss_pred             ccCceeEEECCCceEEEEEEecCCCCCcCEEEEeccceEEEEEcccCchhhhhhCccc--eeEEEEEecCCCCCcE-EEE
Confidence            678999999998777763332   11            78888876554444455577  8888873212222222 444


Q ss_pred             ecCCCceEEEeEccCc
Q 001070          230 AGPLNREVKLWASASE  245 (1165)
Q Consensus       230 sGslnrtIKLW~~a~~  245 (1165)
                      ||  |-.|.=+|..+.
T Consensus       114 GG--ncsi~Gfd~~G~  127 (136)
T PF14781_consen  114 GG--NCSIQGFDYEGN  127 (136)
T ss_pred             Cc--eEEEEEeCCCCc
Confidence            44  455555554443


No 467
>COG1480 Predicted membrane-associated HD superfamily hydrolase [General function prediction only]
Probab=20.30  E-value=9.7e+02  Score=31.35  Aligned_cols=38  Identities=11%  Similarity=0.075  Sum_probs=25.5

Q ss_pred             HHHHHHHHHHhHHHHHHHHHHHHHhHHHHHHHHHHHHH
Q 001070          782 GRGIEKAVKASTDALWARFHEENARNEKLLRDRTQQIT  819 (1165)
Q Consensus       782 ~~~ieK~lk~eld~L~~R~dEerr~rEaa~~~RQ~qLL  819 (1165)
                      .++++..+.+++++++.-+.+-+|..|+.+.+..+.=+
T Consensus        86 ~~e~t~~~v~~~~~~~~~i~~vk~~~e~~~~~~~e~~~  123 (700)
T COG1480          86 DAEITQNIVQLYQNFFDAINEVKRSLEENEDENTEYSL  123 (700)
T ss_pred             hHHHHHHHHHHHHHHHHHHHHHHhhhcccchhhHHHHH
Confidence            45666777778888888888877666666555554443


No 468
>PF05694 SBP56:  56kDa selenium binding protein (SBP56);  InterPro: IPR008826 This family consists of several eukaryotic selenium binding proteins as well as three sequences from archaea. The exact function of this protein is unknown although it is thought that SBP56 participates in late stages of intra-Golgi protein transport []. The Lotus japonicus homologue of SBP56, LjSBP is thought to have more than one physiological role and can be implicated in controlling the oxidation/reduction status of target proteins in vesicular Golgi transport [].; GO: 0008430 selenium binding; PDB: 2ECE_A.
Probab=20.22  E-value=2.4e+02  Score=34.91  Aligned_cols=108  Identities=12%  Similarity=0.234  Sum_probs=62.4

Q ss_pred             EEEeecCCCceeEEecCC-CCCCcceeEeecCCCCCCceEEEeecCCCceEEEeEccCcCCCCCCCCCCCcceEEEEecc
Q 001070          188 IKIWEDSKVAPLIILKPH-GGQPVNSAQYLTAPNQAGHIILVTAGPLNREVKLWASASEEGWSLPTHAESWKCTQTLDLK  266 (1165)
Q Consensus       188 VriWD~~~g~pl~~leph-dG~sV~SVaFl~aP~~~d~~~lvtsGslnrtIKLW~~a~~~~~~~~~~~~~w~C~QTLe~~  266 (1165)
                      +.|||..+..+++++.=. +|.-+-.|-|+..|+...   -.++.-+..+|-+|--...         ..|.-...++..
T Consensus       224 l~vWD~~~r~~~Q~idLg~~g~~pLEvRflH~P~~~~---gFvg~aLss~i~~~~k~~~---------g~W~a~kVi~ip  291 (461)
T PF05694_consen  224 LHVWDWSTRKLLQTIDLGEEGQMPLEVRFLHDPDANY---GFVGCALSSSIWRFYKDDD---------GEWAAEKVIDIP  291 (461)
T ss_dssp             EEEEETTTTEEEEEEES-TTEEEEEEEEE-SSTT--E---EEEEEE--EEEEEEEE-ET---------TEEEEEEEEEE-
T ss_pred             EEEEECCCCcEeeEEecCCCCCceEEEEecCCCCccc---eEEEEeccceEEEEEEcCC---------CCeeeeEEEECC
Confidence            999999999999988743 455788999988777654   3344458888877764222         357888888875


Q ss_pred             CCC-CCc--cc--------cccEEEEEeecCCcEEEEeccCCCcEEEEEeec
Q 001070          267 SSA-KPR--VE--------EAFFNQVVVLSQAGLLLFANAKKNAIYSVHLGY  307 (1165)
Q Consensus       267 ~s~-~~~--~~--------~aff~sV~~~p~a~~ilLan~~r~aIYalhl~~  307 (1165)
                      ... ++-  .+        -.++--+.++.|-+||.++|--..-|--.-|.-
T Consensus       292 ~~~v~~~~lp~ml~~~~~~P~LitDI~iSlDDrfLYvs~W~~GdvrqYDISD  343 (461)
T PF05694_consen  292 AKKVEGWILPEMLKPFGAVPPLITDILISLDDRFLYVSNWLHGDVRQYDISD  343 (461)
T ss_dssp             -EE--SS---GGGGGG-EE------EEE-TTS-EEEEEETTTTEEEEEE-SS
T ss_pred             CcccCcccccccccccccCCCceEeEEEccCCCEEEEEcccCCcEEEEecCC
Confidence            432 100  01        145666778999999999987666665554443


No 469
>PRK02888 nitrous-oxide reductase; Validated
Probab=20.21  E-value=3.5e+02  Score=34.82  Aligned_cols=73  Identities=15%  Similarity=0.179  Sum_probs=49.4

Q ss_pred             CcEEEEeCcchhhHhhcC------CccEEEeecCC----CceeEEecCCCCCCcceeEeecCCCCCCceEEEeecCCCce
Q 001070          167 GNVRVLNLNTATRSLLRG------HTKIKIWEDSK----VAPLIILKPHGGQPVNSAQYLTAPNQAGHIILVTAGPLNRE  236 (1165)
Q Consensus       167 g~IRVwdi~t~ir~llrG------H~qVriWD~~~----g~pl~~lephdG~sV~SVaFl~aP~~~d~~~lvtsGslnrt  236 (1165)
                      ..+.++|+.......-.|      =..|.|.|.++    +..+..+-| -|+.+.-|+|  +   ||+++++++|.+..+
T Consensus       271 d~~vvfni~~iea~vkdGK~~~V~gn~V~VID~~t~~~~~~~v~~yIP-VGKsPHGV~v--S---PDGkylyVanklS~t  344 (635)
T PRK02888        271 DWVVVFNIARIEEAVKAGKFKTIGGSKVPVVDGRKAANAGSALTRYVP-VPKNPHGVNT--S---PDGKYFIANGKLSPT  344 (635)
T ss_pred             ceEEEEchHHHHHhhhCCCEEEECCCEEEEEECCccccCCcceEEEEE-CCCCccceEE--C---CCCCEEEEeCCCCCc
Confidence            466677776422222223      12399999998    444444444 3788888999  3   555679999999999


Q ss_pred             EEEeEccCc
Q 001070          237 VKLWASASE  245 (1165)
Q Consensus       237 IKLW~~a~~  245 (1165)
                      +-+.|.+.-
T Consensus       345 VSVIDv~k~  353 (635)
T PRK02888        345 VTVIDVRKL  353 (635)
T ss_pred             EEEEEChhh
Confidence            999998664


No 470
>KOG1937 consensus Uncharacterized conserved protein [Function unknown]
Probab=20.12  E-value=5.9e+02  Score=31.71  Aligned_cols=67  Identities=19%  Similarity=0.251  Sum_probs=53.8

Q ss_pred             hhHHHHHHHHHHHHHHHHHHHHHHHHhhhhcccchhhhHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHhHHHHH
Q 001070          736 AAFSQVIAMQDMLNQLMTMQKELQKQMSNLVTLPVTKEGRRLEASLGRGIEKAVKASTDALWARFHEENARNEKLL  811 (1165)
Q Consensus       736 ~~~~q~~~mq~~l~ql~~~qke~qkqm~~~v~~plsKE~kklE~~L~~~ieK~lk~eld~L~~R~dEerr~rEaa~  811 (1165)
                      -||--++++|.--+|++.|-.+         .+.+.||++.+|.-|..+--|....+|+.|++-++.-+...+..+
T Consensus       449 ~aykllt~iH~nc~ei~E~i~~---------tg~~~revrdlE~qI~~E~~k~~l~slEkl~~Dyqairqen~~L~  515 (521)
T KOG1937|consen  449 LAYKLLTRIHLNCMEILEMIRE---------TGALKREVRDLESQIYVEEQKQYLKSLEKLHQDYQAIRQENDQLF  515 (521)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH---------cchHHHHHHHHHHHHhHHHHHHHHhhHHHHHHHHHHHHHHHHHHH
Confidence            4567777888888888877543         458899999999999999999999999999988887776665443


No 471
>KOG4714 consensus Nucleoporin [Nuclear structure]
Probab=20.08  E-value=1.9e+02  Score=33.55  Aligned_cols=31  Identities=32%  Similarity=0.575  Sum_probs=27.3

Q ss_pred             CceEEEeecCCcEEEEeCcc--hhhHhhcCCcc
Q 001070          157 KHYVCYGLKGGNVRVLNLNT--ATRSLLRGHTK  187 (1165)
Q Consensus       157 ~~yIayG~kdg~IRVwdi~t--~ir~llrGH~q  187 (1165)
                      -+.+|.|..||.|-|||...  ..-++|+-|+.
T Consensus       192 q~~v~cgt~dg~~~l~d~rn~~~p~S~l~ahk~  224 (319)
T KOG4714|consen  192 QHLVCCGTDDGIVGLWDARNVAMPVSLLKAHKA  224 (319)
T ss_pred             ccEEEEecCCCeEEEEEcccccchHHHHHHhhh
Confidence            35679999999999999987  77789999997


No 472
>PF10186 Atg14:  UV radiation resistance protein and autophagy-related subunit 14;  InterPro: IPR018791 Class III phosphatidylinositol 3-kinase (PI3-kinase) regulates multiple membrane trafficking. In yeast, two distinct PI3-kinase complexes are known: complex I (Vps34, Vps15, Vps30/Atg6, and Atg14) is involved in autophagy, and complex II (Vps34, Vps15, Vps30/Atg6, and Vps38) functions in the vacuolar protein sorting pathway. In mammals, the counterparts of Vps34, Vps15, and Vps30/Atg6 are Vps34, p150, and Beclin 1, respectively. Mammalian UV irradiation resistance-associated gene (UVRAG) has been identified as identical to yeast Vps38 [].  The Atg14 (autophagy-related protein 14) proteins are hydrophilic proteins and have a coiled-coil motif at the N terminus region. Yeast cells with mutant Atg14 are defective not only in autophagy but also in sorting of carboxypeptidase Y (CPY), a vacuolar-soluble hydrolase, to the vacuole []. This entry represents Atg14 and UVRAG, which bind Beclin 1 to forms two distinct PI3-kinase complexes. This entry also includes Bakor (beclin-1-associated autophagy-related key regulator), also known as autophagy-related protein 14-like protein, which share sequence similarity to the yeast Atg14 protein []. Barkor positively regulates autophagy through its interaction with Beclin-1, with decreased levels of autophagosome formation observed when Barkor expression is eliminated []. Autophagy mediates the cellular response to nutrient deprivation, protein aggregation, and pathogen invasion in humans, and malfunction of autophagy has been implicated in multiple human diseases including cancer. ; GO: 0010508 positive regulation of autophagy
Probab=20.03  E-value=1.2e+03  Score=25.87  Aligned_cols=28  Identities=18%  Similarity=0.478  Sum_probs=23.1

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHhhhhcc
Q 001070          740 QVIAMQDMLNQLMTMQKELQKQMSNLVT  767 (1165)
Q Consensus       740 q~~~mq~~l~ql~~~qke~qkqm~~~v~  767 (1165)
                      .+...+..|.++..-.+.+++++...+.
T Consensus        21 ~L~~~~~~l~~~~~~~~~l~~~i~~~l~   48 (302)
T PF10186_consen   21 RLLELRSELQQLKEENEELRRRIEEILE   48 (302)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            4777888888888888888888888765


Done!