Query         009839
Match_columns 524
No_of_seqs    150 out of 199
Neff          4.9 
Searched_HMMs 46136
Date          Thu Mar 28 17:56:59 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/009839.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/009839hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG2412 Nuclear-export-signal  100.0 9.3E-82   2E-86  664.3  40.5  448    1-488   123-588 (591)
  2 PF07817 GLE1:  GLE1-like prote 100.0 5.4E-62 1.2E-66  486.0  17.9  230  223-454     4-256 (256)
  3 KOG0163 Myosin class VI heavy   97.1   0.017 3.6E-07   66.0  16.0   54  101-154   930-984 (1259)
  4 KOG1029 Endocytic adaptor prot  96.7   0.024 5.3E-07   64.8  13.8    9  288-296   543-551 (1118)
  5 KOG2412 Nuclear-export-signal   96.3   0.076 1.7E-06   58.9  14.2  125   54-189   166-293 (591)
  6 PF02854 MIF4G:  MIF4G domain;   96.2   0.069 1.5E-06   49.7  11.5  174  247-456     2-184 (209)
  7 PTZ00266 NIMA-related protein   96.1   0.058 1.3E-06   64.3  13.2   18  113-130   475-492 (1021)
  8 PTZ00121 MAEBL; Provisional     96.1    0.13 2.9E-06   62.4  15.7   13   56-68   1132-1144(2084)
  9 PTZ00121 MAEBL; Provisional     95.8    0.68 1.5E-05   56.6  19.6   19   82-100  1185-1203(2084)
 10 PTZ00266 NIMA-related protein   95.4    0.11 2.3E-06   62.2  11.6   16  445-460   916-931 (1021)
 11 smart00543 MIF4G Middle domain  94.3     1.4 3.1E-05   41.1  13.9  167  247-455     2-174 (200)
 12 COG3064 TolA Membrane protein   93.8     5.4 0.00012   42.2  17.8   25  330-366   325-349 (387)
 13 KOG1029 Endocytic adaptor prot  93.3    0.92   2E-05   52.5  12.3    7  333-339   696-702 (1118)
 14 KOG0163 Myosin class VI heavy   92.9     2.5 5.5E-05   49.1  14.9   36  118-154   957-992 (1259)
 15 KOG1144 Translation initiation  92.9    0.44 9.5E-06   55.1   9.0   69  307-387   566-645 (1064)
 16 KOG2891 Surface glycoprotein [  91.2     1.7 3.7E-05   45.2  10.3   25   78-102   267-293 (445)
 17 KOG2140 Uncharacterized conser  90.6    0.42   9E-06   53.4   5.6  169  222-442   139-312 (739)
 18 PF09726 Macoilin:  Transmembra  89.5      21 0.00045   41.7  18.3   42  234-275   616-657 (697)
 19 PRK09510 tolA cell envelope in  87.6      29 0.00063   37.8  16.8   20  316-336   347-366 (387)
 20 COG4942 Membrane-bound metallo  87.1      53  0.0012   36.2  20.6   26   79-104   164-190 (420)
 21 KOG3054 Uncharacterized conser  86.7     4.7  0.0001   41.4   9.5   12  285-296   262-273 (299)
 22 COG3064 TolA Membrane protein   85.7     6.5 0.00014   41.7  10.2   17  133-149   145-162 (387)
 23 KOG2072 Translation initiation  85.1      28 0.00061   41.2  15.8   28   75-102   554-581 (988)
 24 PRK11637 AmiB activator; Provi  84.9      63  0.0014   35.1  21.7   31   40-70    104-135 (428)
 25 PF15346 ARGLU:  Arginine and g  84.8      37 0.00081   32.4  14.3   11  102-112    61-71  (149)
 26 PF15236 CCDC66:  Coiled-coil d  84.3      32  0.0007   33.1  13.5   30   73-102    46-75  (157)
 27 KOG2002 TPR-containing nuclear  83.4      23  0.0005   42.5  14.4   17   21-37    773-789 (1018)
 28 KOG4364 Chromatin assembly fac  83.4      19 0.00042   41.6  13.3   10  485-494   769-778 (811)
 29 KOG1144 Translation initiation  79.9      11 0.00024   44.3  10.0   48   78-130   213-260 (1064)
 30 KOG4364 Chromatin assembly fac  79.3      36 0.00079   39.5  13.7    7  355-361   559-565 (811)
 31 PF09726 Macoilin:  Transmembra  75.3 1.3E+02  0.0029   35.2  17.3   39   64-102   431-470 (697)
 32 KOG3054 Uncharacterized conser  74.7      30 0.00065   35.7  10.4   30   79-111   114-143 (299)
 33 KOG2072 Translation initiation  72.0 2.3E+02   0.005   34.1  18.1   23   45-67    702-724 (988)
 34 COG1196 Smc Chromosome segrega  71.5 2.6E+02  0.0057   34.6  23.9   61    8-68    226-286 (1163)
 35 PF05672 MAP7:  MAP7 (E-MAP-115  70.7 1.1E+02  0.0024   29.9  15.3   41  115-158   101-141 (171)
 36 KOG3654 Uncharacterized CH dom  69.6      15 0.00032   41.3   7.4   30  132-162   424-454 (708)
 37 PF06637 PV-1:  PV-1 protein (P  69.5   1E+02  0.0022   33.9  13.3   43  106-150   309-351 (442)
 38 KOG2002 TPR-containing nuclear  64.4 1.7E+02  0.0037   35.6  15.0   18   36-53    755-772 (1018)
 39 PLN03086 PRLI-interacting fact  64.4      21 0.00046   40.7   7.7   20  319-338   200-219 (567)
 40 KOG2891 Surface glycoprotein [  63.1 1.1E+02  0.0023   32.4  11.7   22   85-106   331-352 (445)
 41 COG5269 ZUO1 Ribosome-associat  57.5      60  0.0013   34.2   8.8   36  120-155   249-284 (379)
 42 TIGR03319 YmdA_YtgF conserved   56.3 3.4E+02  0.0075   30.7  17.5   11  315-325   307-317 (514)
 43 PLN02316 synthase/transferase   56.1      26 0.00057   42.7   7.0   16  374-389   689-704 (1036)
 44 PF15437 PGBA_C:  Plasminogen-b  55.5      35 0.00077   29.6   5.7   37  109-147    47-83  (86)
 45 KOG2404 Fumarate reductase, fl  54.4   1E+02  0.0023   33.5  10.2  100  394-500   258-394 (477)
 46 TIGR01069 mutS2 MutS2 family p  50.9 1.2E+02  0.0025   36.0  11.0   23   93-115   526-548 (771)
 47 KOG3634 Troponin [Cytoskeleton  50.3 1.8E+02   0.004   31.3  11.1   15  261-275   233-247 (361)
 48 KOG4661 Hsp27-ERE-TATA-binding  48.8 2.2E+02  0.0048   33.0  12.0   16   85-100   620-635 (940)
 49 PRK00409 recombination and DNA  48.6 1.4E+02  0.0031   35.3  11.3    7   93-99    531-537 (782)
 50 PRK13428 F0F1 ATP synthase sub  46.2   2E+02  0.0044   31.8  11.4   16  465-480   384-399 (445)
 51 KOG4691 Uncharacterized conser  46.0 3.3E+02  0.0072   27.4  12.2   46   58-104    61-107 (227)
 52 TIGR01069 mutS2 MutS2 family p  45.3 3.4E+02  0.0073   32.3  13.6    6  334-339   748-753 (771)
 53 KOG0982 Centrosomal protein Nu  44.3 2.8E+02   0.006   31.0  11.7   59   51-110   210-283 (502)
 54 PF12037 DUF3523:  Domain of un  43.9 4.1E+02  0.0089   28.0  19.8   10   10-19     40-49  (276)
 55 PF07046 CRA_rpt:  Cytoplasmic   43.3      72  0.0016   24.2   5.0   18  133-150    10-27  (42)
 56 PF07349 DUF1478:  Protein of u  42.7      23 0.00049   33.8   2.9   39  395-433    35-74  (162)
 57 COG4942 Membrane-bound metallo  40.4 5.6E+02   0.012   28.5  18.2   22   94-115   194-215 (420)
 58 KOG4691 Uncharacterized conser  38.2 4.4E+02  0.0094   26.6  13.0   35   11-50     61-95  (227)
 59 PF11208 DUF2992:  Protein of u  37.7      98  0.0021   29.0   6.3   27   65-91     66-98  (132)
 60 PF14362 DUF4407:  Domain of un  36.4 4.9E+02   0.011   26.7  14.1   16  320-335   276-291 (301)
 61 PF06936 Selenoprotein_S:  Sele  36.4      94   0.002   30.8   6.2    7  104-110    84-90  (190)
 62 PRK02292 V-type ATP synthase s  35.9 3.7E+02  0.0081   25.6  10.2   24  358-381   149-174 (188)
 63 PF15236 CCDC66:  Coiled-coil d  34.5 4.4E+02  0.0094   25.5  14.0   22   59-80     49-70  (157)
 64 KOG3223 Uncharacterized conser  34.4 3.2E+02   0.007   27.5   9.4   21  134-154    46-66  (221)
 65 PRK10361 DNA recombination pro  34.0 7.4E+02   0.016   28.0  17.3   44  234-277   141-198 (475)
 66 KOG0742 AAA+-type ATPase [Post  33.3 7.7E+02   0.017   28.0  18.4   63  428-490   467-540 (630)
 67 KOG1363 Predicted regulator of  32.4 3.8E+02  0.0082   30.1  10.8   55   47-102   260-319 (460)
 68 KOG1363 Predicted regulator of  32.0 2.1E+02  0.0046   32.1   8.7    8   87-94    322-329 (460)
 69 PF03879 Cgr1:  Cgr1 family;  I  31.3 3.4E+02  0.0075   24.7   8.4   22  109-130    47-68  (108)
 70 COG5269 ZUO1 Ribosome-associat  30.7 5.7E+02   0.012   27.2  10.9   13  285-297   357-369 (379)
 71 PF15272 BBP1_C:  Spindle pole   30.6 5.7E+02   0.012   25.7  14.5   59   16-76     32-94  (196)
 72 TIGR00570 cdk7 CDK-activating   29.6 3.2E+02  0.0068   29.2   9.1   60   87-154   126-185 (309)
 73 PF12128 DUF3584:  Protein of u  29.4 1.2E+03   0.026   29.1  21.1  182   34-273   602-783 (1201)
 74 PF11214 Med2:  Mediator comple  28.9      58  0.0012   29.5   3.1   15   74-88     58-72  (105)
 75 KOG3859 Septins (P-loop GTPase  28.3 7.8E+02   0.017   26.6  12.5   44   67-110   318-362 (406)
 76 PLN02316 synthase/transferase   27.3 1.6E+02  0.0034   36.3   7.2   12   69-80    125-136 (1036)
 77 TIGR01791 CM_archaeal chorisma  27.1 3.7E+02   0.008   22.4   7.9   63   24-86      2-83  (83)
 78 PF07046 CRA_rpt:  Cytoplasmic   27.0 2.6E+02  0.0057   21.3   5.7    9  145-153    28-36  (42)
 79 PTZ00491 major vault protein;   27.0 8.6E+02   0.019   29.5  12.8  104   60-164   640-773 (850)
 80 PRK09174 F0F1 ATP synthase sub  26.5 6.4E+02   0.014   25.0  14.6   21   90-110    99-119 (204)
 81 TIGR02168 SMC_prok_B chromosom  26.1 1.2E+03   0.026   27.9  21.2  239   24-274   799-1048(1179)
 82 PRK06231 F0F1 ATP synthase sub  25.8 6.6E+02   0.014   24.8  11.8   85   85-170    79-167 (205)
 83 smart00582 RPR domain present   25.1 3.7E+02  0.0079   23.5   7.6   47  407-453    37-84  (121)
 84 KOG1087 Cytosolic sorting prot  25.0 4.7E+02    0.01   29.5   9.9   39  399-437    34-74  (470)
 85 KOG0161 Myosin class II heavy   24.8 1.8E+03   0.039   29.6  22.7  224    1-273  1272-1503(1930)
 86 PF13904 DUF4207:  Domain of un  24.8 7.7E+02   0.017   25.3  14.0  101   64-167    88-225 (264)
 87 PF11207 DUF2989:  Protein of u  24.2 1.1E+02  0.0023   30.8   4.3   98  322-426    36-145 (203)
 88 KOG4326 Mitochondrial F1F0-ATP  24.0 2.8E+02  0.0062   23.7   6.1   11  120-130    45-55  (81)
 89 PF05672 MAP7:  MAP7 (E-MAP-115  24.0   7E+02   0.015   24.5  10.9    6  222-227   146-151 (171)
 90 PRK00106 hypothetical protein;  23.7 1.1E+03   0.025   26.9  17.5    9  468-476   454-462 (535)
 91 PF06098 Radial_spoke_3:  Radia  22.9 4.2E+02  0.0092   28.0   8.6   55   99-153   159-213 (291)
 92 PF00769 ERM:  Ezrin/radixin/mo  21.6 8.7E+02   0.019   24.7  13.7   23  217-239   183-206 (246)
 93 PTZ00399 cysteinyl-tRNA-synthe  21.3 1.5E+02  0.0032   34.5   5.4   11  179-189   614-624 (651)
 94 PF04696 Pinin_SDK_memA:  pinin  21.2 6.6E+02   0.014   23.2  11.3   33   73-105    12-44  (131)
 95 PF04747 DUF612:  Protein of un  20.9 8.9E+02   0.019   26.9  10.5   14  113-126   112-125 (510)
 96 cd03200 GST_C_JTV1 GST_C famil  20.4 2.6E+02  0.0057   23.7   5.5   50  406-455     2-51  (96)

No 1  
>KOG2412 consensus Nuclear-export-signal (NES)-containing protein/polyadenylated-RNA export factor [RNA processing and modification]
Probab=100.00  E-value=9.3e-82  Score=664.34  Aligned_cols=448  Identities=34%  Similarity=0.489  Sum_probs=389.6

Q ss_pred             CccccchhhHHHHHhhhcccchhHHHHHHHHHHHHHHHh-HHhhhhHHHHhhhhhhhhhHHHHHhhhHHHHHHHHHHHHH
Q 009839            1 MDEVGLADGALVELTHQHQLGVKEEIRNLISTLETQLIS-ENEQSNSALAQVEKDRDMRREMDRKNDTVYQRKIAEALDN   79 (524)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~~~-e~~~~~~~~~~~~k~~~~~~~~~~~~d~~~qr~~~e~~~~   79 (524)
                      |+++|+..++    .++|++.++.++|++++.+..-.++ ++..+++....++||.++|.+..+|+ ..+|+++.+.+|+
T Consensus       123 l~~L~~~~~~----~~q~~~~~~~~~~~ki~~~~~pea~~~~~~n~e~~~l~~~~~e~~~~~~~r~-~e~Q~qv~qsl~~  197 (591)
T KOG2412|consen  123 LNKLGLKESA----INQRQTEIKSDIRAKILNSPLPEANQEIETNAENIRLVEKLSETRKEVKRRL-LEEQNQVLQSLDT  197 (591)
T ss_pred             HHHHHHhhcc----chhhhHhHHhhhhhhhhcCCChHHHHHHHhhHHHHHhhhhHHHHHHHHHHHH-HHHHHHHHHHHHH
Confidence            4566666666    7999999999999999999888777 89999999999999999999999999 9999999999999


Q ss_pred             hHHHHHHhHHHHHHHHHHHhhchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           80 HLTAVQRDHELKSQIEERKIRSDAAYEEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEAAERE  159 (524)
Q Consensus        80 ~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~~e~e  159 (524)
                      |+..+||.++..+||.+|+++++++-+||+|+.++.||++.+.+.+.++.+++++.+++|+++.   .++|++++..+  
T Consensus       198 el~~i~~~~q~~eqi~~~~~~~e~kr~Eaerk~~~~qEe~Rqk~d~~~~~~eqekiR~~eekqe---ee~ke~e~~~~--  272 (591)
T KOG2412|consen  198 ELQAIQREKQRKEQIRERKERSEEKREEAERKRRAHQEELRQKEDEEAELQEQEKIRAEEEKQE---EERKEAEEQAE--  272 (591)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHH---HHHHHHHHHHH--
Confidence            9999999999999999999999999999999999999999999999999999999999988733   22233322111  


Q ss_pred             HhhhhhhhhccccccccCC-CCCCCcccccccccCCCCCCccchhhhh--HHhhhHHHHHHHHHHHHHHHHHHHhhhccc
Q 009839          160 AAENSKRITAGVSQDGACG-RQPDDSSVIAGAQSRGSRSDGTKKLQSA--VRATESALNIEQKRLQKLKELDEENQSLKL  236 (524)
Q Consensus       160 ~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~~k~~~~--~~~~~~a~~~~~~R~~~Lkel~~~~~~lks  236 (524)
                           +.++...+++.... +++..+++.++       ++...+|||+  ..++.+.+....-+.++.-+          
T Consensus       273 -----k~~q~~~~~eek~a~qk~~~~~~~~~-------~~~ds~m~w~~~d~i~q~k~d~v~pi~~kd~~----------  330 (591)
T KOG2412|consen  273 -----KEVQDPKAHEEKLAEQKAVIEKVTTS-------SASDSQMFWNSQDAIAQSKLDLVNPILKKDEE----------  330 (591)
T ss_pred             -----HHhcCchhccccccccccccccccCC-------chhHHHhhhhHHHHHHHHHHHHHhhhhhHHHH----------
Confidence                 12223333444433 55566666666       5578889998  47778888887777665444          


Q ss_pred             cccccccccccccccccccccCchhh-HHHHHHHHHHHhcCCC-----ChHHHHHHHHHHHHHhcccCC---CCCcchhH
Q 009839          237 SSNEDFSGYEKDISRLIRQIRGLKDN-VRTKASELVKILNNPL-----CPQSISLATFSKKVVSRCETP---DDNVAMSC  307 (524)
Q Consensus       237 ~lkk~~~~~kRqI~~kIGQLtns~~q-I~~is~eL~~lL~~~~-----~p~~~~Ln~lAKaIV~QaEt~---~~~sAfPl  307 (524)
                       +++-..+++|.||+.|||||++..| |..|++.|.+++++.+     +.+.||+|+|||++|+|+|++   +|.+||||
T Consensus       331 -lk~~~~~~kr~in~~~~qis~~~~q~L~qI~dkl~s~~~~~~~~~~pl~~~~~~~~iaka~V~Q~Etev~~~PeaAfPl  409 (591)
T KOG2412|consen  331 -LKNYNQSLKRAINPPFSQISKSNGQVLRQIFDKLDSLFGGIPDIVDPLAYDWCLNFIAKAFVKQAETEVASKPEAAFPL  409 (591)
T ss_pred             -HHHHHHHHHhhcCCChhhhhhccHHHHHHHHHHHHHHhcCCCCCCCchhHHHHHHHHHHHHHHHHHHHHHhCCcccchH
Confidence             4445568899999999999999988 9999999999998753     457899999999999999994   67899999


Q ss_pred             HHHHHHHHhhCccHHHHHHHHhhhhceeeccccccccccccccHHHHHHHcCccc-CCCcccchhhHHHHHHHHHHHHHH
Q 009839          308 GYVIVLVASQVPQVMDILLGEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYRE-EDGKIESLENYLSRLKSYMRLYAA  386 (524)
Q Consensus       308 A~V~v~L~~~~Pef~diLlArl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~-~dg~~Ese~~Yl~RMsGI~rLYAA  386 (524)
                      |.|++.||++||+|+|+|||||||+|||+||||++.      ++|.|.++|||+. |+|+||..|.|++||+||+|||||
T Consensus       410 a~V~l~i~~q~Pdv~dlllA~l~KkCP~~VPf~~~~------~~Eq~~k~mGyk~~d~nk~Eqnd~YleRm~Gi~rLYAA  483 (591)
T KOG2412|consen  410 AKVILYIWSQFPDVGDLLLARLHKKCPYVVPFHIVN------STEQYQKMMGYKAWDSNKWEQNDAYLERMDGIMRLYAA  483 (591)
T ss_pred             HHHHHHHHHhCchHHHHHHHHHHhcCCccccccccC------cHHHHHHhhcccccccccccccchHHHHhHhHHHHHHH
Confidence            999999999999999999999999999999999864      3699999999997 678999999999999999999999


Q ss_pred             HHhcCCC----CCCCCCCcchHHHHHHHHhCCCCCccchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhHhhhcc
Q 009839          387 LIQTEIP----GVQNAHGLKEGWAWLARFLNALPANIYTAVALNAFLQLAGFALFKKYKSQFRKILDNIYDNFLNALKAR  462 (524)
Q Consensus       387 I~qt~~~----~~~nP~gi~~~W~WLARiLN~~P~~~ita~vL~afLevAG~~L~~~YG~QF~KLL~lI~~d~~p~l~~~  462 (524)
                      |+++++|    +.-||||+.++|.|||||||+.|.+++||++|.+||++||+.|++.||+||+|||.+|.++|+|++.++
T Consensus       484 Ii~l~~p~~~~~~~hpf~i~~gW~wLA~iln~~p~~~~tatll~s~Lq~aG~~L~q~Yg~Qf~Klli~i~E~y~~r~~a~  563 (591)
T KOG2412|consen  484 IIQLDIPVGNATNVHPFGINHGWAWLARILNKIPLLDTTATLLNSFLQTAGFGLLQRYGSQFLKLLILIREHYLPRLAAK  563 (591)
T ss_pred             HHHhcccccCCCCCCcchhhcccHHHHHHhCCCCccchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhcc
Confidence            9999986    345899999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             CCchhHHHHHHHHHHHHhcccccCCC
Q 009839          463 EDSKLNLVIAEIQYYIEDKKFLEEPE  488 (524)
Q Consensus       463 ~~~~~~~~v~rLe~~Led~~~l~ePe  488 (524)
                      ++.|..++...|+.|+ |+++...|+
T Consensus       564 ~~~g~~rl~ill~~~l-~~q~~~~~~  588 (591)
T KOG2412|consen  564 KDTGDLRLRILLEAWL-DRQYLKEPE  588 (591)
T ss_pred             ccccchHHHHHHHHHH-Hhhhhcccc
Confidence            8777788888999999 788888887


No 2  
>PF07817 GLE1:  GLE1-like protein;  InterPro: IPR012476 The members of this family are sequences that are similar to the human protein GLE1 (O75458 from SWISSPROT). This protein is localised at the nuclear pore complexes and functions in poly(A)+ RNA export to the cytoplasm []. ; GO: 0016973 poly(A)+ mRNA export from nucleus, 0005643 nuclear pore; PDB: 3PEV_B 3RRN_B 3PEU_B 3RRM_B.
Probab=100.00  E-value=5.4e-62  Score=485.99  Aligned_cols=230  Identities=36%  Similarity=0.553  Sum_probs=183.2

Q ss_pred             HHHHHHHHhhh---ccccccccccccccccccccccccCchhhHHHHHHHHHHHhcCC--------------CChHHHHH
Q 009839          223 KLKELDEENQS---LKLSSNEDFSGYEKDISRLIRQIRGLKDNVRTKASELVKILNNP--------------LCPQSISL  285 (524)
Q Consensus       223 ~Lkel~~~~~~---lks~lkk~~~~~kRqI~~kIGQLtns~~qI~~is~eL~~lL~~~--------------~~p~~~~L  285 (524)
                      +++++++.+..   -++.+|+.++++||+||++|||||++.+||.+|+++|.++|++.              ++++.|+|
T Consensus         4 ~i~~~k~~~~~~~~~d~~lKk~~~~~kr~I~~~vgQls~~~~qi~~i~~~i~~ll~~~~~~~~~~~~~~~~~~~~~~~~l   83 (256)
T PF07817_consen    4 KIKQIKQALKEPVKSDPSLKKLRFDLKRKINPKVGQLSNSSSQINRIINQISNLLSGQPVKSNDLQQSKNDHPLAYKYLL   83 (256)
T ss_dssp             HHHHHHHHTHHHHHS-HHHHHHHHHHHHHHCCHHHC--SBHHHHHHHHHHHHHH----------HHTTTT-SHHHHHHHH
T ss_pred             HHHHHHHHHHHHhhcCHHHHHHHHHhhhhCcCcHhhccCcHHHHHHHHHHHHHHhhhhhhchhhhhhhccCCchHHHHHH
Confidence            44555555543   33578999999999999999999999999999999999995532              24577899


Q ss_pred             HHHHHHHHhcccCC---CCCcchhHHHHHHHHHhhCccHHHHHHHHhhhhceeeccccccccccccccHHHHHHHcCccc
Q 009839          286 ATFSKKVVSRCETP---DDNVAMSCGYVIVLVASQVPQVMDILLGEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYRE  362 (524)
Q Consensus       286 n~lAKaIV~QaEt~---~~~sAfPlA~V~v~L~~~~Pef~diLlArl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~  362 (524)
                      |+|||+||+|||++   ++++|||+|.|++.||+.||+|+|+||||||++|||+||+|+++.  .++|+|+|+++|||+.
T Consensus        84 ~~lAk~iv~Q~e~ev~~~~~~A~PlA~v~~~l~~~~p~~~dillA~l~k~Cp~~vP~~~~~~--~~~~~e~~~k~lGyk~  161 (256)
T PF07817_consen   84 NFLAKKIVSQAETEVSANPESAFPLARVAVQLWSQHPEFGDILLARLHKKCPYLVPKYPGFT--CDQSTEEYRKRLGYKR  161 (256)
T ss_dssp             HHHHHHHHHHHHHHHHH-GGGHHHHHHHHHHHHHHSTCHHHHHHHHHHHH-GGGG----T-------SSHHHHHHTT--B
T ss_pred             HHHHHHHHHHHHHHhccCCchhhhHHHHHHHHHHcCCcHHHHHHHHHHHcCceeEeecCccc--CCCCHHHHHHHcCCcc
Confidence            99999999999995   578999999999999999999999999999999999999998874  3568899999999999


Q ss_pred             CCCcccchhhHHHHHHHHHHHHHHHHhcCCCCCC---CCCCcchHHHHHHHHhCCCCCccchHHHHHHHHHHHHHHHHHH
Q 009839          363 EDGKIESLENYLSRLKSYMRLYAALIQTEIPGVQ---NAHGLKEGWAWLARFLNALPANIYTAVALNAFLQLAGFALFKK  439 (524)
Q Consensus       363 ~dg~~Ese~~Yl~RMsGI~rLYAAI~qt~~~~~~---nP~gi~~~W~WLARiLN~~P~~~ita~vL~afLevAG~~L~~~  439 (524)
                      +||+||++++|++||+||++|||||+++++++.+   ||||++++|+|||||||++|.+++|+++|++||++||++|+++
T Consensus       162 ~~~~~E~~~~y~~Rm~Gi~~lyaAi~~~~~~~~~~~~~p~~~~~~W~wlAr~lN~~p~~~~~~~lL~~~Le~ag~~l~~~  241 (256)
T PF07817_consen  162 DDGGWESEDQYLKRMTGIIRLYAAIIQTPPPKGQKTSNPHGLEHGWRWLARILNLPPAPNITATLLHSFLEVAGFRLLQI  241 (256)
T ss_dssp             -TTSB--HHHHHHHHHHHHHHHHHHHHS---CCCCTT-SS-THHHHHHHHHHHCS-CC-HHHHHHHHHHHHHHHHHHHHH
T ss_pred             CCCCccchHHHHHHHHHHHHHHHHHHhccCCcCCCCCCCCCcHHHHHHHHHHhCCCCCcccHHHHHHHHHHHHHHHHHHH
Confidence            8777999999999999999999999999987432   7999999999999999998888999999999999999999999


Q ss_pred             HHHHHHHHHHHHHHH
Q 009839          440 YKSQFRKILDNIYDN  454 (524)
Q Consensus       440 YG~QF~KLL~lI~~d  454 (524)
                      ||+||.|||.+|.++
T Consensus       242 Yg~Qf~Kll~~i~~~  256 (256)
T PF07817_consen  242 YGRQFVKLLQLISEH  256 (256)
T ss_dssp             HTHHHHHHHHHHHT-
T ss_pred             HHHHHHHHHHHHhcC
Confidence            999999999999864


No 3  
>KOG0163 consensus Myosin class VI heavy chain [Cytoskeleton]
Probab=97.06  E-value=0.017  Score=65.98  Aligned_cols=54  Identities=39%  Similarity=0.481  Sum_probs=37.5

Q ss_pred             chHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHH
Q 009839          101 SDAAYEEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAK-RAALEAEKRAAKE  154 (524)
Q Consensus       101 ~~~a~EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~-k~~~ea~~~~~~~  154 (524)
                      +|+|.-|-+|+|-..++.++.+||+++++||+.|+|+||++ ++..|-+.+.+.+
T Consensus       930 qE~~E~ER~rrEaeek~rre~ee~k~~k~e~e~kRK~eEeqr~~qee~e~~l~~e  984 (1259)
T KOG0163|consen  930 QELAEAERKRREAEEKRRREEEEKKRAKAEMETKRKAEEEQRKAQEEEERRLALE  984 (1259)
T ss_pred             HHHHHHHHHhhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhHHHHHHHH
Confidence            34444555666777777888899999999999998888776 4444444444444


No 4  
>KOG1029 consensus Endocytic adaptor protein intersectin [Signal transduction mechanisms; Intracellular trafficking, secretion, and vesicular transport]
Probab=96.71  E-value=0.024  Score=64.77  Aligned_cols=9  Identities=0%  Similarity=0.143  Sum_probs=3.7

Q ss_pred             HHHHHHhcc
Q 009839          288 FSKKVVSRC  296 (524)
Q Consensus       288 lAKaIV~Qa  296 (524)
                      +.+.|-+|+
T Consensus       543 irq~ikdql  551 (1118)
T KOG1029|consen  543 IRQAIKDQL  551 (1118)
T ss_pred             HHHHHHHHH
Confidence            334444444


No 5  
>KOG2412 consensus Nuclear-export-signal (NES)-containing protein/polyadenylated-RNA export factor [RNA processing and modification]
Probab=96.30  E-value=0.076  Score=58.88  Aligned_cols=125  Identities=18%  Similarity=0.220  Sum_probs=62.3

Q ss_pred             hhhhhHHHHHhhhHHHHH--HHHHHHHHhHH-HHHHhHHHHHHHHHHHhhchHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           54 DRDMRREMDRKNDTVYQR--KIAEALDNHLT-AVQRDHELKSQIEERKIRSDAAYEEAKRKERALQEEKIRQEKVKAEAE  130 (524)
Q Consensus        54 ~~~~~~~~~~~~d~~~qr--~~~e~~~~~~~-~~q~~~e~~~q~ee~~~r~~~a~EEa~~~e~a~~e~k~~qek~k~e~e  130 (524)
                      ..+.+.++..-.+..++|  ++..++...+. .+|+....+...|.-+.|++   .++++++     |-+|+  ++++.|
T Consensus       166 ~~~l~~~~~e~~~~~~~r~~e~Q~qv~qsl~~el~~i~~~~q~~eqi~~~~~---~~e~kr~-----Eaerk--~~~~qE  235 (591)
T KOG2412|consen  166 NIRLVEKLSETRKEVKRRLLEEQNQVLQSLDTELQAIQREKQRKEQIRERKE---RSEEKRE-----EAERK--RRAHQE  235 (591)
T ss_pred             HHHhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH---HHHhhhh-----hhHHH--HHHHHH
Confidence            445566666667777777  66666666666 67777777766666666666   3332221     22222  222222


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhhhhccccccccCCCCCCCcccccc
Q 009839          131 MQAKLRAEEAKRAALEAEKRAAKEAAEREAAENSKRITAGVSQDGACGRQPDDSSVIAG  189 (524)
Q Consensus       131 ~~~~~~~ee~~k~~~ea~~~~~~~~~e~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  189 (524)
                      ...+++.+++++... +.-++.++++|.|++++...+.-...-.++.-.+...++...+
T Consensus       236 e~Rqk~d~~~~~~eq-ekiR~~eekqeee~ke~e~~~~k~~q~~~~~eek~a~qk~~~~  293 (591)
T KOG2412|consen  236 ELRQKEDEEAELQEQ-EKIRAEEEKQEEERKEAEEQAEKEVQDPKAHEEKLAEQKAVIE  293 (591)
T ss_pred             HHHHHHHHHHHHhHH-HHHHHHHHHHHHHHHHHHHHHHHHhcCchhccccccccccccc
Confidence            224444444444322 2223333345555555555433222222223355556666555


No 6  
>PF02854 MIF4G:  MIF4G domain;  InterPro: IPR003890 This entry represents an MIF4G-like domain. MIF4G domains share a common structure but can differ in sequence. This entry is designated "type 3", and is found in nuclear cap-binding proteins, eIF4G, and UPF2. The MIF4G domain is a structural motif with an ARM (Armadillo) repeat-type fold, consisting of a 2-layer alpha/alpha right-handed superhelix. Proteins usually contain two or more structurally similar MIF4G domains connected by unstructured linkers. MIF4G domains are found in several proteins involved in RNA metabolism, including eIF4G (eukaryotic initiation factor 4-gamma), eIF-2b (translation initiation factor), UPF2 (regulator of nonsense transcripts 2), and nuclear cap-binding proteins (CBP80, CBC1, NCBP1), although the sequence identity between them may be low [].  The nuclear cap-binding complex (CBC) is a heterodimer. Human CBC consists of a large CBP80 subunit and a small CBP20 subunit, the latter being critical for cap binding. CBP80 contains three MIF4G domains connected with long linkers, while CBP20 has an RNP (ribonucleoprotein)-type domain that associates with domains 2 and 3 of CBP80 []. The complex binds to 5'-cap of eukaryotic RNA polymerase II transcripts, such as mRNA and U snRNA. The binding is important for several mRNA nuclear maturation steps and for nonsense-mediated decay. It is also essential for nuclear export of U snRNAs in metazoans [].  Eukaryotic translation initiation factor 4 gamma (eIF4G) plays a critical role in protein expression, and is at the centre of a complex regulatory network. Together with the cap-binding protein eIF4E, it recruits the small ribosomal subunit to the 5'-end of mRNA and promotes the assembly of a functional translation initiation complex, which scans along the mRNA to the translation start codon. The activity of eIF4G in translation initiation could be regulated through intra- and inter-protein interactions involving the ARM repeats []. In eIF4G, the MIF4G domain binds eIF4A, eIF3, RNA and DNA. Nonsense-mediated mRNA decay (NMD) in eukaryotes involves UPF1, UPF2 and UPF3 to accelerate the decay rate of two unique classes of transcripts: (1) nonsense mRNAs that arise through errors in gene expression, and (2) naturally occurring transcripts that lack coding errors but have built-in features that target them for accelerated decay (error-free mRNAs). NMD can trigger decay during any round of translation and can target CBC-bound or eIF-4E-bound transcripts []. UPF2 contains MIF4G domains, while UPF3 contains an RNP domain []. ; GO: 0005515 protein binding, 0016070 RNA metabolic process; PDB: 3FEY_A 3FEX_A 1H6K_C 1H2V_C 1H2U_A 1H2T_C 1N54_A 1N52_A 1HU3_A 3RK6_A ....
Probab=96.16  E-value=0.069  Score=49.71  Aligned_cols=174  Identities=16%  Similarity=0.201  Sum_probs=114.2

Q ss_pred             cccccccccccCchhhHHHHHHHHHHHhcCCCChHHHHHHHHHHHHHhcccCCCCCcchhHHHHHHHHHhhCc-cHHHHH
Q 009839          247 KDISRLIRQIRGLKDNVRTKASELVKILNNPLCPQSISLATFSKKVVSRCETPDDNVAMSCGYVIVLVASQVP-QVMDIL  325 (524)
Q Consensus       247 RqI~~kIGQLtns~~qI~~is~eL~~lL~~~~~p~~~~Ln~lAKaIV~QaEt~~~~sAfPlA~V~v~L~~~~P-ef~diL  325 (524)
                      |+|+--+|.||  ...+..++.+|.++....   ....+..+++.|+..+... |..+-.+|.++..|-..+| +|+..|
T Consensus         2 r~v~~~lnklt--~~n~~~~~~~l~~~~~~~---~~~~~~~i~~~i~~~a~~~-~~~~~~~a~l~~~l~~~~~~~f~~~l   75 (209)
T PF02854_consen    2 RKVRGILNKLT--PSNFESIIDELIKLNWSD---DPETLKEIVKLIFEKAVEE-PNFSPLYARLCAALNSRFPSEFRSLL   75 (209)
T ss_dssp             HHHHHHHHHCS--STTHHHHHHHHHHHHHHS---CHHHHHHHHHHHHHHHHHS-GGGHHHHHHHHHHHHHHCHHHHHHHH
T ss_pred             chHHHHHHHCC--HHHHHHHHHHHHHHHhhc---cHHHHHHHHHHHhhhhhcC-chHHHHHHHHHHHHhccchhhHHHHH
Confidence            56777788888  455667777777776542   2345777788887776553 2467788889999999999 999998


Q ss_pred             HHHhhhhceeeccccccccccccccHHHHHHHcCcccCCCcccchhhHHHHHHHHHHHHHHHHhcCCCCCCCCCCcchHH
Q 009839          326 LGEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYREEDGKIESLENYLSRLKSYMRLYAALIQTEIPGVQNAHGLKEGW  405 (524)
Q Consensus       326 lArl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~~dg~~Ese~~Yl~RMsGI~rLYAAI~qt~~~~~~nP~gi~~~W  405 (524)
                      +.+++...-...+..        .. +               +....+..|+.|.+++.+-+.....      .+....-
T Consensus        76 l~~~~~~f~~~~~~~--------~~-~---------------~~~~~~~~~~~~~~~fl~eL~~~~v------v~~~~i~  125 (209)
T PF02854_consen   76 LNRCQEEFEERYSNE--------EL-E---------------ENRQSSKQRRRGNIRFLAELFNFGV------VSEKIIF  125 (209)
T ss_dssp             HHHHHHHHHHHT-HH--------HH-H---------------HHHHHHHHHHHHHHHHHHHHHHTTS------SCHHHHH
T ss_pred             HHHHHHHHHHhhhhh--------hH-H---------------HHHHHHHHHHhhhhhHHHhhHhhcc------ccchhHH
Confidence            888765542211000        00 0               1234667899999999999987542      2222333


Q ss_pred             HHHHHHhCCC------CCccchHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHHHHHh
Q 009839          406 AWLARFLNAL------PANIYTAVALNAFLQLAGFALF--KKYKSQFRKILDNIYDNFL  456 (524)
Q Consensus       406 ~WLARiLN~~------P~~~ita~vL~afLevAG~~L~--~~YG~QF~KLL~lI~~d~~  456 (524)
                      ..+..++...      |.......++..+|..+|..|.  ......+..++..+.....
T Consensus       126 ~~l~~ll~~~~~~~~~~~~~~~ie~~~~lL~~~G~~l~~~~~~~~~l~~~~~~~~~~~~  184 (209)
T PF02854_consen  126 DILRELLSDGTDECQPPPDEENIECLCTLLKTCGKKLENSEESPKALDEIFERLQKYAN  184 (209)
T ss_dssp             HHHHHHHHHTSHHCCHHTCHHHHHHHHHHHHHHHHHHHHCHHHHHHHHHHHHHHHHHHH
T ss_pred             HHHHHHHhcccccccCCCcHhHHHHHHHHHHHHHHHHhcCCCchhHHHHHHHHHHHHHH
Confidence            3444444431      2234568888999999999999  6666666666666555444


No 7  
>PTZ00266 NIMA-related protein kinase; Provisional
Probab=96.13  E-value=0.058  Score=64.32  Aligned_cols=18  Identities=33%  Similarity=0.357  Sum_probs=8.1

Q ss_pred             HHHHHHHHHHHHHHHHHH
Q 009839          113 RALQEEKIRQEKVKAEAE  130 (524)
Q Consensus       113 ~a~~e~k~~qek~k~e~e  130 (524)
                      +..+++|+|+|+.+.|.|
T Consensus       475 r~er~erer~Erer~erE  492 (1021)
T PTZ00266        475 RMERIERERLERERLERE  492 (1021)
T ss_pred             HHHHHHHHHHHHHHHHHH
Confidence            333444444444444444


No 8  
>PTZ00121 MAEBL; Provisional
Probab=96.10  E-value=0.13  Score=62.36  Aligned_cols=13  Identities=15%  Similarity=0.327  Sum_probs=5.5

Q ss_pred             hhhHHHHHhhhHH
Q 009839           56 DMRREMDRKNDTV   68 (524)
Q Consensus        56 ~~~~~~~~~~d~~   68 (524)
                      ++|++=+.|.+.+
T Consensus      1132 eARrae~~Rr~Ee 1144 (2084)
T PTZ00121       1132 EARKAEDARKAEE 1144 (2084)
T ss_pred             HHhhHHHHHHHHH
Confidence            4444444444433


No 9  
>PTZ00121 MAEBL; Provisional
Probab=95.77  E-value=0.68  Score=56.63  Aligned_cols=19  Identities=26%  Similarity=0.445  Sum_probs=8.4

Q ss_pred             HHHHHhHHHHHHHHHHHhh
Q 009839           82 TAVQRDHELKSQIEERKIR  100 (524)
Q Consensus        82 ~~~q~~~e~~~q~ee~~~r  100 (524)
                      ...+|.-++|.-.|+|++.
T Consensus      1185 EE~Rr~EElRraEEaRkaE 1203 (2084)
T PTZ00121       1185 EEVRKAEELRKAEDARKAE 1203 (2084)
T ss_pred             HHHHHHHHHHHHHHHHHhh
Confidence            3344444455444444433


No 10 
>PTZ00266 NIMA-related protein kinase; Provisional
Probab=95.43  E-value=0.11  Score=62.22  Aligned_cols=16  Identities=25%  Similarity=0.370  Sum_probs=6.8

Q ss_pred             HHHHHHHHHHHhHhhh
Q 009839          445 RKILDNIYDNFLNALK  460 (524)
Q Consensus       445 ~KLL~lI~~d~~p~l~  460 (524)
                      .|||.---..+..+|.
T Consensus       916 ~~~~~~~~~~~~~~~~  931 (1021)
T PTZ00266        916 RKMLMEKEKGIYDRLR  931 (1021)
T ss_pred             HHHHHHHhhhHHHHHh
Confidence            4444333334444443


No 11 
>smart00543 MIF4G Middle domain of eukaryotic initiation factor 4G (eIF4G). Also occurs in NMD2p and CBP80. The domain is rich in alpha-helices and may contain multiple alpha-helical repeats. In eIF4G, this domain binds eIF4A, eIF3, RNA and DNA. Ponting (TiBS) "Novel eIF4G domain homologues (in press)
Probab=94.29  E-value=1.4  Score=41.06  Aligned_cols=167  Identities=19%  Similarity=0.209  Sum_probs=105.6

Q ss_pred             cccccccccccCchhhHHHHHHHHHHHhcCCCChHHHHHHHHHHHHHhcccCCCCCcchhHHHHHHHHHhhCccHHHHHH
Q 009839          247 KDISRLIRQIRGLKDNVRTKASELVKILNNPLCPQSISLATFSKKVVSRCETPDDNVAMSCGYVIVLVASQVPQVMDILL  326 (524)
Q Consensus       247 RqI~~kIGQLtns~~qI~~is~eL~~lL~~~~~p~~~~Ln~lAKaIV~QaEt~~~~sAfPlA~V~v~L~~~~Pef~diLl  326 (524)
                      ++|+.-+|.||  .+.+..++.+|..+..+.  +  -....+++.++..+..+ |...-.+|.++..+...+|+|+..|+
T Consensus         2 ~~v~~~lnkLs--~~n~~~~~~~l~~~~~~~--~--~~~~~l~~~i~~~~~~~-~~~~~~ya~L~~~l~~~~~~f~~~ll   74 (200)
T smart00543        2 KKVKGLINKLS--PSNFESIIKELLKLNNSD--K--NLRKYILELIFEKAVEE-PNFIPAYARLCALLNAKNPDFGSLLL   74 (200)
T ss_pred             hHHHHHHhhCC--HHHHHHHHHHHHHHHccC--H--HHHHHHHHHHHHHHHcC-cchHHHHHHHHHHHHHHHHHHHHHHH
Confidence            45677788887  468888888888888652  2  24555666666666553 24567778888888888888877776


Q ss_pred             HHhhhhceeeccccccccccccccHHHHHHHcCcccCCCcccchhhHHHHHHHHHHHHHHHHhcCCCCCCCCCCcchHHH
Q 009839          327 GEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYREEDGKIESLENYLSRLKSYMRLYAALIQTEIPGVQNAHGLKEGWA  406 (524)
Q Consensus       327 Arl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~~dg~~Ese~~Yl~RMsGI~rLYAAI~qt~~~~~~nP~gi~~~W~  406 (524)
                      ..++..-  -.+.            +               +.......|..|.+++.+-+.....      .+....-.
T Consensus        75 ~~~~~~f--~~~~------------e---------------~~~~~~~~~~~~~i~fl~eL~~~~~------i~~~~i~~  119 (200)
T smart00543       75 ERLQEEF--EKGL------------E---------------SEEESDKQRRLGLVRFLGELYNFQV------LTSKIILE  119 (200)
T ss_pred             HHHHHHH--HHHH------------H---------------HHHHHhhhhHHhHHHHHHHHHHccc------CcHHHHHH
Confidence            6654431  0000            0               0112345788999999998876532      11222333


Q ss_pred             HHHHHhCCC--C---CccchHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHHHH
Q 009839          407 WLARFLNAL--P---ANIYTAVALNAFLQLAGFALF-KKYKSQFRKILDNIYDNF  455 (524)
Q Consensus       407 WLARiLN~~--P---~~~ita~vL~afLevAG~~L~-~~YG~QF~KLL~lI~~d~  455 (524)
                      .+..+++..  |   ..+....++..+|..+|..|. .....-+..++..+...+
T Consensus       120 ~l~~ll~~~~~~~~~~~~~~ve~l~~lL~~~G~~l~~~~~~~~~~~~l~~l~~~~  174 (200)
T smart00543      120 LLKELLNDLTKLDPPRSDFSVECLLSLLPTCGKDLEREKSPKLLDEILERLQDYL  174 (200)
T ss_pred             HHHHHHhccCCCCCCCcHHHHHHHHHHHHHhhHHHcCcccHHHHHHHHHHHHHHH
Confidence            444444431  1   134678899999999999999 666666666666655544


No 12 
>COG3064 TolA Membrane protein involved in colicin uptake [Cell envelope biogenesis, outer membrane]
Probab=93.75  E-value=5.4  Score=42.24  Aligned_cols=25  Identities=12%  Similarity=0.262  Sum_probs=15.7

Q ss_pred             hhhceeeccccccccccccccHHHHHHHcCcccCCCc
Q 009839          330 HRACIYTVPKHIVFSEAAFESEEAYYKTIGYREEDGK  366 (524)
Q Consensus       330 ~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~~dg~  366 (524)
                      -+.|.+-|-+.|+      -|      +++|+..+|.
T Consensus       325 gK~C~l~ikL~pd------Gt------l~~~~~~~Gd  349 (387)
T COG3064         325 GKTCRLRIKLAPD------GT------LLDIKPEGGD  349 (387)
T ss_pred             CceeEEEEEEcCC------cc------eeeccccCCC
Confidence            4678888877653      12      5667776654


No 13 
>KOG1029 consensus Endocytic adaptor protein intersectin [Signal transduction mechanisms; Intracellular trafficking, secretion, and vesicular transport]
Probab=93.31  E-value=0.92  Score=52.54  Aligned_cols=7  Identities=14%  Similarity=-0.150  Sum_probs=3.0

Q ss_pred             ceeeccc
Q 009839          333 CIYTVPK  339 (524)
Q Consensus       333 CP~lVP~  339 (524)
                      |-.+.||
T Consensus       696 yrAly~F  702 (1118)
T KOG1029|consen  696 YRALYPF  702 (1118)
T ss_pred             Eeeeccc
Confidence            4444444


No 14 
>KOG0163 consensus Myosin class VI heavy chain [Cytoskeleton]
Probab=92.90  E-value=2.5  Score=49.12  Aligned_cols=36  Identities=42%  Similarity=0.450  Sum_probs=17.8

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          118 EKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKE  154 (524)
Q Consensus       118 ~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~  154 (524)
                      +.+++.|.|+|.|- .+.+.|+++..+.|-.++.++|
T Consensus       957 k~e~e~kRK~eEeq-r~~qee~e~~l~~e~q~qla~e  992 (1259)
T KOG0163|consen  957 KAEMETKRKAEEEQ-RKAQEEEERRLALELQEQLAKE  992 (1259)
T ss_pred             HHHHHHHHHHHHHH-HHhhhhHHHHHHHHHHHHHHHH
Confidence            34455566666553 3334444554445544444444


No 15 
>KOG1144 consensus Translation initiation factor 5B (eIF-5B) [Translation, ribosomal structure and biogenesis]
Probab=92.86  E-value=0.44  Score=55.13  Aligned_cols=69  Identities=14%  Similarity=0.219  Sum_probs=40.1

Q ss_pred             HHHHHHHHHhh-CccHHHHHHHHhhhhceeeccccccccccccccHHHHHHHcCccc-CCCcc---------cchhhHHH
Q 009839          307 CGYVIVLVASQ-VPQVMDILLGEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYRE-EDGKI---------ESLENYLS  375 (524)
Q Consensus       307 lA~V~v~L~~~-~Pef~diLlArl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~-~dg~~---------Ese~~Yl~  375 (524)
                      ||.+++-|+.+ -|.-..-|-=.=.++|||+|...-            --|++||+. .++.+         -....|..
T Consensus       566 ~aIlvvdImhGlepqtiESi~lLR~rktpFivALNK------------iDRLYgwk~~p~~~i~~~lkkQ~k~v~~EF~~  633 (1064)
T KOG1144|consen  566 LAILVVDIMHGLEPQTIESINLLRMRKTPFIVALNK------------IDRLYGWKSCPNAPIVEALKKQKKDVQNEFKE  633 (1064)
T ss_pred             eEEEEeehhccCCcchhHHHHHHHhcCCCeEEeehh------------hhhhcccccCCCchHHHHHHHhhHHHHHHHHH
Confidence            33344444433 233333333233688999997751            125788885 33321         23568999


Q ss_pred             HHHHHHHHHHHH
Q 009839          376 RLKSYMRLYAAL  387 (524)
Q Consensus       376 RMsGI~rLYAAI  387 (524)
                      |+..|+-=|+-.
T Consensus       634 R~~~ii~efaEQ  645 (1064)
T KOG1144|consen  634 RLNNIIVEFAEQ  645 (1064)
T ss_pred             HHHHHHHHHHHc
Confidence            999998777654


No 16 
>KOG2891 consensus Surface glycoprotein [General function prediction only]
Probab=91.18  E-value=1.7  Score=45.22  Aligned_cols=25  Identities=36%  Similarity=0.578  Sum_probs=20.4

Q ss_pred             HHhHHHHHHhH--HHHHHHHHHHhhch
Q 009839           78 DNHLTAVQRDH--ELKSQIEERKIRSD  102 (524)
Q Consensus        78 ~~~~~~~q~~~--e~~~q~ee~~~r~~  102 (524)
                      ..|||.||=..  |-|+|||-.|.|++
T Consensus       267 srhlsevqiakraeerrqieterlrqe  293 (445)
T KOG2891|consen  267 SRHLSEVQIAKRAEERRQIETERLRQE  293 (445)
T ss_pred             hhhhhHHHHHHHHHHHhhhhHHHHhhh
Confidence            46999999543  57889999999988


No 17 
>KOG2140 consensus Uncharacterized conserved protein [General function prediction only]
Probab=90.59  E-value=0.42  Score=53.38  Aligned_cols=169  Identities=18%  Similarity=0.277  Sum_probs=103.4

Q ss_pred             HHHHHHHHHhhhcccc--ccccccccccccccccccccCchhhHHHHHHHHHH--HhcCCCChHHHHHHHHHHHHHh-cc
Q 009839          222 QKLKELDEENQSLKLS--SNEDFSGYEKDISRLIRQIRGLKDNVRTKASELVK--ILNNPLCPQSISLATFSKKVVS-RC  296 (524)
Q Consensus       222 ~~Lkel~~~~~~lks~--lkk~~~~~kRqI~~kIGQLtns~~qI~~is~eL~~--lL~~~~~p~~~~Ln~lAKaIV~-Qa  296 (524)
                      .+|+.+.+++.+..+.  ...+|-.+|+.|++.||.++.+  .|..|..+|.+  +|.+        -++|++.||. |+
T Consensus       139 aKL~~mq~qi~Dk~s~~yQRmnWEalkksInglInkvn~s--Ni~~ii~eLfqeNiirg--------Rgl~crsv~~aq~  208 (739)
T KOG2140|consen  139 AKLRMMQAQITDKNSIEYQRMNWEALKKSINGLINKVNAS--NIQEIIRELFQENIIRG--------RGLLCRSVMQAQA  208 (739)
T ss_pred             HHHHHHHHHhcccchHHHHHHHHHHHHHHhHHHHhhhhHH--HHHHHHHHHHHHHHHhc--------cchhHHHHHHHHh
Confidence            4666677777776652  4578889999999999998754  34444443332  2222        4556777665 55


Q ss_pred             cCCCCCcchhHHHHHHHHHhhCccHHHHHHHHhhhhceeeccccccccccccccHHHHHHHcCcccCCCcccchhhHHHH
Q 009839          297 ETPDDNVAMSCGYVIVLVASQVPQVMDILLGEFHRACIYTVPKHIVFSEAAFESEEAYYKTIGYREEDGKIESLENYLSR  376 (524)
Q Consensus       297 Et~~~~sAfPlA~V~v~L~~~~Pef~diLlArl~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~~dg~~Ese~~Yl~R  376 (524)
                      -+|.  ..-.+|.+++.|-+.||++|++|+-+|..      -|.                 -+|+..|          +=
T Consensus       209 asp~--ft~vyaALvAviNskfP~IgElLlkrLil------qf~-----------------r~f~RnD----------k~  253 (739)
T KOG2140|consen  209 ASPG--FTPVYAALVAVINSKFPQIGELLLKRLIL------QFK-----------------RSFRRND----------KV  253 (739)
T ss_pred             cCCC--CcHHHHHHHHHHccCCchHHHHHHHHHHH------HHH-----------------HHhcccc----------hH
Confidence            5553  55667888889999999999999988742      221                 1233332          23


Q ss_pred             HHHHHHHHHHHHhcCCCCCCCCCCcchHHHHHHHHhCCCCCccchHHHHHHHHHHHHHHHHHHHHH
Q 009839          377 LKSYMRLYAALIQTEIPGVQNAHGLKEGWAWLARFLNALPANIYTAVALNAFLQLAGFALFKKYKS  442 (524)
Q Consensus       377 MsGI~rLYAAI~qt~~~~~~nP~gi~~~W~WLARiLN~~P~~~ita~vL~afLevAG~~L~~~YG~  442 (524)
                      |+|-+.=|.|++...    +-.|-+ -+-..|.-+|-. |-+ -...|..+||..||..|..+=.+
T Consensus       254 ~c~~~~kfiahLinq----~VahEI-v~Leil~lLLe~-PTd-dSvevaI~flkecGakL~~VSpr  312 (739)
T KOG2140|consen  254 SCLNASKFIAHLINQ----QVAHEI-VALEILTLLLER-PTD-DSVEVAIAFLKECGAKLAEVSPR  312 (739)
T ss_pred             HHHHHHHHHHHHHHH----HHHHHH-HHHHHHHHHhcC-CCC-chHHHHHHHHHHHHHHHHHhChH
Confidence            444444444544321    000111 245666777765 433 34566678999999998866443


No 18 
>PF09726 Macoilin:  Transmembrane protein;  InterPro: IPR019130  This entry represents the multi-pass transmembrane protein Macoilin, which is highly conserved in eukaryotes. ; GO: 0016021 integral to membrane
Probab=89.51  E-value=21  Score=41.71  Aligned_cols=42  Identities=12%  Similarity=0.238  Sum_probs=35.1

Q ss_pred             ccccccccccccccccccccccccCchhhHHHHHHHHHHHhc
Q 009839          234 LKLSSNEDFSGYEKDISRLIRQIRGLKDNVRTKASELVKILN  275 (524)
Q Consensus       234 lks~lkk~~~~~kRqI~~kIGQLtns~~qI~~is~eL~~lL~  275 (524)
                      +|..|=.-+|+-||+|...-|||..--.+|......|.+++.
T Consensus       616 iKldLfsaLg~akrq~ei~~~~~~~~d~ei~~lk~ki~~~~a  657 (697)
T PF09726_consen  616 IKLDLFSALGDAKRQLEIAQGQLRKKDKEIEELKAKIAQLLA  657 (697)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHh
Confidence            566666789999999999999998888888888888888775


No 19 
>PRK09510 tolA cell envelope integrity inner membrane protein TolA; Provisional
Probab=87.62  E-value=29  Score=37.85  Aligned_cols=20  Identities=10%  Similarity=0.144  Sum_probs=9.5

Q ss_pred             hhCccHHHHHHHHhhhhceee
Q 009839          316 SQVPQVMDILLGEFHRACIYT  336 (524)
Q Consensus       316 ~~~Pef~diLlArl~kkCP~l  336 (524)
                      +++|.|-.-.+.- .+.+||.
T Consensus       347 SGd~aldrAA~~A-ar~a~lP  366 (387)
T PRK09510        347 GGDPALCQAALAA-AKTAKIP  366 (387)
T ss_pred             CCCHHHHHHHHHH-HHcCCCC
Confidence            4455554444444 4455443


No 20 
>COG4942 Membrane-bound metallopeptidase [Cell division and chromosome partitioning]
Probab=87.06  E-value=53  Score=36.25  Aligned_cols=26  Identities=12%  Similarity=0.234  Sum_probs=12.4

Q ss_pred             HhHHHHHHhH-HHHHHHHHHHhhchHH
Q 009839           79 NHLTAVQRDH-ELKSQIEERKIRSDAA  104 (524)
Q Consensus        79 ~~~~~~q~~~-e~~~q~ee~~~r~~~a  104 (524)
                      +||.++|.+- .++..|+..+...+.+
T Consensus       164 ~~l~~~~~~l~~~~~~iaaeq~~l~~~  190 (420)
T COG4942         164 DALKATLKQLAAVRAEIAAEQAELTTL  190 (420)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            4455554443 2455555555544433


No 21 
>KOG3054 consensus Uncharacterized conserved protein [Function unknown]
Probab=86.69  E-value=4.7  Score=41.37  Aligned_cols=12  Identities=33%  Similarity=0.346  Sum_probs=7.5

Q ss_pred             HHHHHHHHHhcc
Q 009839          285 LATFSKKVVSRC  296 (524)
Q Consensus       285 Ln~lAKaIV~Qa  296 (524)
                      |+.+||-|-.+.
T Consensus       262 l~AVAkfIkqrG  273 (299)
T KOG3054|consen  262 LAAVAKFIKQRG  273 (299)
T ss_pred             HHHHHHHHHHcC
Confidence            667777665544


No 22 
>COG3064 TolA Membrane protein involved in colicin uptake [Cell envelope biogenesis, outer membrane]
Probab=85.66  E-value=6.5  Score=41.68  Aligned_cols=17  Identities=53%  Similarity=0.532  Sum_probs=8.3

Q ss_pred             HHHHHHHH-HHHHHHHHH
Q 009839          133 AKLRAEEA-KRAALEAEK  149 (524)
Q Consensus       133 ~~~~~ee~-~k~~~ea~~  149 (524)
                      +++++|++ .|++.|+++
T Consensus       145 ~kk~aE~a~aka~aEA~k  162 (387)
T COG3064         145 QKKKAEAAKAKAAAEAAK  162 (387)
T ss_pred             HHHHHHHHHHHHHHHHHH
Confidence            44444444 455555555


No 23 
>KOG2072 consensus Translation initiation factor 3, subunit a (eIF-3a) [Translation, ribosomal structure and biogenesis]
Probab=85.08  E-value=28  Score=41.22  Aligned_cols=28  Identities=32%  Similarity=0.187  Sum_probs=19.4

Q ss_pred             HHHHHhHHHHHHhHHHHHHHHHHHhhch
Q 009839           75 EALDNHLTAVQRDHELKSQIEERKIRSD  102 (524)
Q Consensus        75 e~~~~~~~~~q~~~e~~~q~ee~~~r~~  102 (524)
                      .++++-=++.||.+-.+|=||.|+..-|
T Consensus       554 ~~~~~v~~E~krilaRk~liE~rKe~~E  581 (988)
T KOG2072|consen  554 NYLKNVDKEHKRILARKSLIEKRKEDLE  581 (988)
T ss_pred             HHHhcchHHHHHHHHHHHHHHHHHhHHH
Confidence            3344444677888888888888886655


No 24 
>PRK11637 AmiB activator; Provisional
Probab=84.93  E-value=63  Score=35.09  Aligned_cols=31  Identities=16%  Similarity=0.395  Sum_probs=12.5

Q ss_pred             HHhhhhHHHHhhhhhh-hhhHHHHHhhhHHHH
Q 009839           40 ENEQSNSALAQVEKDR-DMRREMDRKNDTVYQ   70 (524)
Q Consensus        40 e~~~~~~~~~~~~k~~-~~~~~~~~~~d~~~q   70 (524)
                      ++......|...++.. ..+..+.+++...|+
T Consensus       104 ei~~l~~eI~~~q~~l~~~~~~l~~rlra~Y~  135 (428)
T PRK11637        104 QIDELNASIAKLEQQQAAQERLLAAQLDAAFR  135 (428)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            3333444444444332 223334444444443


No 25 
>PF15346 ARGLU:  Arginine and glutamate-rich 1
Probab=84.85  E-value=37  Score=32.43  Aligned_cols=11  Identities=64%  Similarity=0.875  Sum_probs=5.3

Q ss_pred             hHHHHHHHHHH
Q 009839          102 DAAYEEAKRKE  112 (524)
Q Consensus       102 ~~a~EEa~~~e  112 (524)
                      .++++|+++++
T Consensus        61 ~~~l~e~r~ke   71 (149)
T PF15346_consen   61 EEALEEARRKE   71 (149)
T ss_pred             HHHHHHHHhhh
Confidence            34445555543


No 26 
>PF15236 CCDC66:  Coiled-coil domain-containing protein 66
Probab=84.28  E-value=32  Score=33.10  Aligned_cols=30  Identities=23%  Similarity=0.382  Sum_probs=18.0

Q ss_pred             HHHHHHHhHHHHHHhHHHHHHHHHHHhhch
Q 009839           73 IAEALDNHLTAVQRDHELKSQIEERKIRSD  102 (524)
Q Consensus        73 ~~e~~~~~~~~~q~~~e~~~q~ee~~~r~~  102 (524)
                      |.|-..+...++.--+.++-||||++..+.
T Consensus        46 ~eEre~rR~kq~E~q~ai~~QieEk~r~k~   75 (157)
T PF15236_consen   46 IEERERRRQKQLEHQRAIKQQIEEKRRQKQ   75 (157)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            444445555555555556668888766665


No 27 
>KOG2002 consensus TPR-containing nuclear phosphoprotein that regulates K(+) uptake [Inorganic ion transport and metabolism]
Probab=83.43  E-value=23  Score=42.50  Aligned_cols=17  Identities=24%  Similarity=0.255  Sum_probs=11.4

Q ss_pred             chhHHHHHHHHHHHHHH
Q 009839           21 GVKEEIRNLISTLETQL   37 (524)
Q Consensus        21 ~~~~~~r~~~~~~~~~~   37 (524)
                      +.-|+|+..+-.||.++
T Consensus       773 ~t~eev~~a~~~le~a~  789 (1018)
T KOG2002|consen  773 RTLEEVLEAVKELEEAR  789 (1018)
T ss_pred             ccHHHHHHHHHHHHHHH
Confidence            66677777776666554


No 28 
>KOG4364 consensus Chromatin assembly factor-I [Chromatin structure and dynamics]
Probab=83.39  E-value=19  Score=41.59  Aligned_cols=10  Identities=20%  Similarity=0.561  Sum_probs=5.6

Q ss_pred             cCCCccccCC
Q 009839          485 EEPEGRTLQA  494 (524)
Q Consensus       485 ~ePeGr~m~~  494 (524)
                      +.|+|-.++.
T Consensus       769 p~~d~~~~p~  778 (811)
T KOG4364|consen  769 PDKDGKRLPK  778 (811)
T ss_pred             CCCccccCCC
Confidence            4455666654


No 29 
>KOG1144 consensus Translation initiation factor 5B (eIF-5B) [Translation, ribosomal structure and biogenesis]
Probab=79.88  E-value=11  Score=44.30  Aligned_cols=48  Identities=31%  Similarity=0.405  Sum_probs=28.5

Q ss_pred             HHhHHHHHHhHHHHHHHHHHHhhchHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           78 DNHLTAVQRDHELKSQIEERKIRSDAAYEEAKRKERALQEEKIRQEKVKAEAE  130 (524)
Q Consensus        78 ~~~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~e~a~~e~k~~qek~k~e~e  130 (524)
                      -+|++++|..-+.+.+.|||+.|-+   ||.-|+  ..+|++.+.+..+++.|
T Consensus       213 ~Kgv~~~qe~La~~qe~eE~qkree---EE~~r~--eeEEer~~ee~E~~~eE  260 (1064)
T KOG1144|consen  213 PKGVRAMQEALAKRQEEEERQKREE---EERLRR--EEEEERRREEEEAQEEE  260 (1064)
T ss_pred             chhHHHHHHHHHHHHHHHHHHHHHH---HHHHHH--HHHHHHHHHHHHHHHHH
Confidence            4688888888887777777777766   444333  33334444444333333


No 30 
>KOG4364 consensus Chromatin assembly factor-I [Chromatin structure and dynamics]
Probab=79.27  E-value=36  Score=39.46  Aligned_cols=7  Identities=29%  Similarity=0.643  Sum_probs=2.7

Q ss_pred             HHHcCcc
Q 009839          355 YKTIGYR  361 (524)
Q Consensus       355 ~k~lGyr  361 (524)
                      +-=-||.
T Consensus       559 fVPhgyL  565 (811)
T KOG4364|consen  559 FVPHGYL  565 (811)
T ss_pred             ecCCccc
Confidence            3333444


No 31 
>PF09726 Macoilin:  Transmembrane protein;  InterPro: IPR019130  This entry represents the multi-pass transmembrane protein Macoilin, which is highly conserved in eukaryotes. ; GO: 0016021 integral to membrane
Probab=75.32  E-value=1.3e+02  Score=35.25  Aligned_cols=39  Identities=13%  Similarity=0.355  Sum_probs=19.5

Q ss_pred             hhhHHHHHHHHHHHHHhHHHHHHh-HHHHHHHHHHHhhch
Q 009839           64 KNDTVYQRKIAEALDNHLTAVQRD-HELKSQIEERKIRSD  102 (524)
Q Consensus        64 ~~d~~~qr~~~e~~~~~~~~~q~~-~e~~~q~ee~~~r~~  102 (524)
                      |-|.|--|.+-+-|-.+++.+-.. +.+|+.+..-|...|
T Consensus       431 raeLq~~Rq~E~ELRsqis~l~~~Er~lk~eL~qlr~ene  470 (697)
T PF09726_consen  431 RAELQSSRQSEQELRSQISSLTNNERSLKSELSQLRQENE  470 (697)
T ss_pred             HHHHHhhhhhHHHHHHHHhhccccchHHHHHHHHHHHHHH
Confidence            345555555555555555544442 445555544443333


No 32 
>KOG3054 consensus Uncharacterized conserved protein [Function unknown]
Probab=74.73  E-value=30  Score=35.73  Aligned_cols=30  Identities=37%  Similarity=0.510  Sum_probs=13.7

Q ss_pred             HhHHHHHHhHHHHHHHHHHHhhchHHHHHHHHH
Q 009839           79 NHLTAVQRDHELKSQIEERKIRSDAAYEEAKRK  111 (524)
Q Consensus        79 ~~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~  111 (524)
                      +.-.-.||.-|.. -- |.|.|+++ +||++||
T Consensus       114 kqerr~qRe~E~~-eR-EeRk~ke~-~eE~erK  143 (299)
T KOG3054|consen  114 KQERRAQREAEEA-ER-EERKRKED-YEEAERK  143 (299)
T ss_pred             HHHHHHHHHHHHH-HH-HHHhHHHH-HHHHHHh
Confidence            3344445555443 11 23334443 6676664


No 33 
>KOG2072 consensus Translation initiation factor 3, subunit a (eIF-3a) [Translation, ribosomal structure and biogenesis]
Probab=71.96  E-value=2.3e+02  Score=34.13  Aligned_cols=23  Identities=30%  Similarity=0.316  Sum_probs=15.0

Q ss_pred             hHHHHhhhhhhhhhHHHHHhhhH
Q 009839           45 NSALAQVEKDRDMRREMDRKNDT   67 (524)
Q Consensus        45 ~~~~~~~~k~~~~~~~~~~~~d~   67 (524)
                      ..+|--.+++-+.+.+=|+.|=.
T Consensus       702 ~EeiPL~e~~~~~~~~~d~e~~e  724 (988)
T KOG2072|consen  702 LEEIPLIEKAYDERQEEDRELYE  724 (988)
T ss_pred             HHhhhhHHHHHHHHHhhhHHHHH
Confidence            34566667777777777776655


No 34 
>COG1196 Smc Chromosome segregation ATPases [Cell division and chromosome partitioning]
Probab=71.52  E-value=2.6e+02  Score=34.59  Aligned_cols=61  Identities=20%  Similarity=0.183  Sum_probs=44.8

Q ss_pred             hhHHHHHhhhcccchhHHHHHHHHHHHHHHHhHHhhhhHHHHhhhhhhhhhHHHHHhhhHH
Q 009839            8 DGALVELTHQHQLGVKEEIRNLISTLETQLISENEQSNSALAQVEKDRDMRREMDRKNDTV   68 (524)
Q Consensus         8 ~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~~~e~~~~~~~~~~~~k~~~~~~~~~~~~d~~   68 (524)
                      +..++-..-.|...-.+++++.++.++..+.+-.+.-..+-.+|+..+....+++..++..
T Consensus       226 ~~~~~~~~~~~~~~~l~~~~~~l~~~~~~~~~~~~~~~~~~~~i~~~~~~~~e~~~~~~~~  286 (1163)
T COG1196         226 ELALLLAKLKELRKELEELEEELSRLEEELEELQEELEEAEKEIEELKSELEELREELEEL  286 (1163)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            3444445555556677888888888888888777777777788888887777777777665


No 35 
>PF05672 MAP7:  MAP7 (E-MAP-115) family;  InterPro: IPR008604 The organisation of microtubules varies with the cell type and is presumably controlled by tissue-specific microtubule-associated proteins (MAPs). The 115 kDa epithelial MAP (E-MAP-115) has been identified as a microtubule-stabilising protein predominantly expressed in cell lines of epithelial origin []. The binding of this microtubule associated protein is nucleotide independent [].
Probab=70.71  E-value=1.1e+02  Score=29.94  Aligned_cols=41  Identities=46%  Similarity=0.482  Sum_probs=18.2

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          115 LQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEAAER  158 (524)
Q Consensus       115 ~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~~e~  158 (524)
                      .+|+.++..+-|-+++  ++-+.+.++.. +|.++--..+.+|+
T Consensus       101 e~Ee~e~~~kQkeeae--~ka~EeAek~r-~ErE~~~~q~eqER  141 (171)
T PF05672_consen  101 EQEEQERLQKQKEEAE--AKAREEAEKQR-KERERIMQQEEQER  141 (171)
T ss_pred             hHHHHHHHHHhHHHHH--HHHHHHHHHHH-HHHHHHHHHHHHHH
Confidence            3444444444444444  33333333333 55555555544333


No 36 
>KOG3654 consensus Uncharacterized CH domain protein [Cytoskeleton]
Probab=69.56  E-value=15  Score=41.31  Aligned_cols=30  Identities=27%  Similarity=0.310  Sum_probs=13.6

Q ss_pred             HHHHHHHHHHHH-HHHHHHHHHHHHHHHHHhh
Q 009839          132 QAKLRAEEAKRA-ALEAEKRAAKEAAEREAAE  162 (524)
Q Consensus       132 ~~~~~~ee~~k~-~~ea~~~~~~~~~e~e~~~  162 (524)
                      ++++++||+|.. .-|.+.++-. ++|=++++
T Consensus       424 earrkaeeer~~keee~arrefi-rqey~rrk  454 (708)
T KOG3654|consen  424 EARRKAEEERAPKEEEVARREFI-RQEYERRK  454 (708)
T ss_pred             HHHHhhHhhhcchhhhhhHHHHH-HHHHHHHH
Confidence            366666666633 2333333222 44555554


No 37 
>PF06637 PV-1:  PV-1 protein (PLVAP);  InterPro: IPR009538 This family consists of several PV-1 (PLVAP) proteins, which seem to be specific to mammals. PV-1 is a novel protein component of the endothelial fenestral and stomatal diaphragms []. The function of this family is unknown.
Probab=69.52  E-value=1e+02  Score=33.86  Aligned_cols=43  Identities=37%  Similarity=0.369  Sum_probs=26.8

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          106 EEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKR  150 (524)
Q Consensus       106 EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~  150 (524)
                      .|+.+--+|-||.+++-+|.-+..|  ++.++|=.|++.+--++|
T Consensus       309 le~e~~l~a~qeakek~~KEAqare--aklqaec~rQ~qlaLEEK  351 (442)
T PF06637_consen  309 LEAEQGLQASQEAKEKAGKEAQARE--AKLQAECARQTQLALEEK  351 (442)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHHHHH
Confidence            5555656677777777777666555  788888666443333333


No 38 
>KOG2002 consensus TPR-containing nuclear phosphoprotein that regulates K(+) uptake [Inorganic ion transport and metabolism]
Probab=64.45  E-value=1.7e+02  Score=35.63  Aligned_cols=18  Identities=17%  Similarity=0.191  Sum_probs=10.2

Q ss_pred             HHHhHHhhhhHHHHhhhh
Q 009839           36 QLISENEQSNSALAQVEK   53 (524)
Q Consensus        36 ~~~~e~~~~~~~~~~~~k   53 (524)
                      -+--..+++.+.+.|.+|
T Consensus       755 N~a~v~kkla~s~lr~~k  772 (1018)
T KOG2002|consen  755 NLALVLKKLAESILRLEK  772 (1018)
T ss_pred             HHHHHHHHHHHHHHhccc
Confidence            344455666666666555


No 39 
>PLN03086 PRLI-interacting factor K; Provisional
Probab=64.43  E-value=21  Score=40.65  Aligned_cols=20  Identities=10%  Similarity=0.167  Sum_probs=9.2

Q ss_pred             ccHHHHHHHHhhhhceeecc
Q 009839          319 PQVMDILLGEFHRACIYTVP  338 (524)
Q Consensus       319 Pef~diLlArl~kkCP~lVP  338 (524)
                      ++...+|-..|..-+..++|
T Consensus       200 ~npKavLE~~Lr~~stLT~G  219 (567)
T PLN03086        200 PNHKAVLETALRQHATLSED  219 (567)
T ss_pred             ccHHHHHHHHhhcCccccCC
Confidence            33345555555444444433


No 40 
>KOG2891 consensus Surface glycoprotein [General function prediction only]
Probab=63.06  E-value=1.1e+02  Score=32.44  Aligned_cols=22  Identities=41%  Similarity=0.480  Sum_probs=14.7

Q ss_pred             HHhHHHHHHHHHHHhhchHHHH
Q 009839           85 QRDHELKSQIEERKIRSDAAYE  106 (524)
Q Consensus        85 q~~~e~~~q~ee~~~r~~~a~E  106 (524)
                      |--+|+..+.||.+.|-+.|.|
T Consensus       331 qekqeleqmaeeekkr~eeaee  352 (445)
T KOG2891|consen  331 QEKQELEQMAEEEKKREEEAEE  352 (445)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Confidence            4556677777777777765543


No 41 
>COG5269 ZUO1 Ribosome-associated chaperone zuotin [Translation, ribosomal structure and biogenesis / Posttranslational modification, protein turnover, chaperones]
Probab=57.48  E-value=60  Score=34.17  Aligned_cols=36  Identities=31%  Similarity=0.290  Sum_probs=25.0

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          120 IRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEA  155 (524)
Q Consensus       120 ~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~  155 (524)
                      +|++-++.+++.+.+.++|+++|++-|+++++-+.+
T Consensus       249 ereagar~~a~aa~k~kae~k~kae~ea~a~asa~a  284 (379)
T COG5269         249 EREAGARLKALAALKGKAEAKNKAEIEAEALASATA  284 (379)
T ss_pred             chhhhhhHHHHHHHhhhhHHHhHHHHHHHHhhhhHH
Confidence            456666677776677777777787777777665543


No 42 
>TIGR03319 YmdA_YtgF conserved hypothetical protein YmdA/YtgF.
Probab=56.26  E-value=3.4e+02  Score=30.68  Aligned_cols=11  Identities=18%  Similarity=0.513  Sum_probs=4.7

Q ss_pred             HhhCccHHHHH
Q 009839          315 ASQVPQVMDIL  325 (524)
Q Consensus       315 ~~~~Pef~diL  325 (524)
                      ...||++..+|
T Consensus       307 ~~~~~~~~~~l  317 (514)
T TIGR03319       307 HGLHPELIKLL  317 (514)
T ss_pred             CcCCHHHHHHH
Confidence            33345444433


No 43 
>PLN02316 synthase/transferase
Probab=56.15  E-value=26  Score=42.66  Aligned_cols=16  Identities=6%  Similarity=0.044  Sum_probs=10.5

Q ss_pred             HHHHHHHHHHHHHHHh
Q 009839          374 LSRLKSYMRLYAALIQ  389 (524)
Q Consensus       374 l~RMsGI~rLYAAI~q  389 (524)
                      ..|+.-+++..+.+++
T Consensus       689 ~~RF~~F~~Aale~l~  704 (1036)
T PLN02316        689 GERFGFFCHAALEFLL  704 (1036)
T ss_pred             HHHHHHHHHHHHHHHH
Confidence            4677777776666654


No 44 
>PF15437 PGBA_C:  Plasminogen-binding protein pgbA C-terminal
Probab=55.52  E-value=35  Score=29.58  Aligned_cols=37  Identities=30%  Similarity=0.374  Sum_probs=20.5

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          109 KRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEA  147 (524)
Q Consensus       109 ~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea  147 (524)
                      +++-.|.|-.++-+++||.-.|  .-.++-|+|..|+|+
T Consensus        47 kKkAKAeqrA~EfEqRakehqE--rDEkElEERrKALe~   83 (86)
T PF15437_consen   47 KKKAKAEQRAREFEQRAKEHQE--RDEKELEERRKALEM   83 (86)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH--HHHHHHHHHHHhhhc
Confidence            4555566666666666665555  444444555554554


No 45 
>KOG2404 consensus Fumarate reductase, flavoprotein subunit [Energy production and conversion]
Probab=54.38  E-value=1e+02  Score=33.54  Aligned_cols=100  Identities=23%  Similarity=0.307  Sum_probs=62.2

Q ss_pred             CCCCCCCcchHHHHHH-----------------HHhCCCCCcc-chHHHHH----------------HHHHHHHHHHHHH
Q 009839          394 GVQNAHGLKEGWAWLA-----------------RFLNALPANI-YTAVALN----------------AFLQLAGFALFKK  439 (524)
Q Consensus       394 ~~~nP~gi~~~W~WLA-----------------RiLN~~P~~~-ita~vL~----------------afLevAG~~L~~~  439 (524)
                      +.-.|...+..|++||                 ||.|...-.+ +|..++.                +..+..|. ++++
T Consensus       258 gfidpndr~~~wKfLAAEalRG~GaiLl~s~GrRF~nELg~RDyvTgei~kl~~P~ednrallVmnea~~e~~~n-~inF  336 (477)
T KOG2404|consen  258 GFIDPNDRTALWKFLAAEALRGLGAILLNSTGRRFGNELGTRDYVTGEIQKLKCPIEDNRALLVMNEANYEAFGN-NINF  336 (477)
T ss_pred             CccCCCCchhHHHHHHHHHhccCceEEEeccchhhhcccccchhhhHhHHhhcCCcccceeEEEecHhHHHHHhh-hhhh
Confidence            4456788889999998                 4555432222 2333332                33444454 6777


Q ss_pred             HHHHHHHHHHHH-HHHHhHhhhccCCchhHHHHHHHHHHHHh-cccccCCCcccc-CCCCCCCc
Q 009839          440 YKSQFRKILDNI-YDNFLNALKAREDSKLNLVIAEIQYYIED-KKFLEEPEGRTL-QAPPLSST  500 (524)
Q Consensus       440 YG~QF~KLL~lI-~~d~~p~l~~~~~~~~~~~v~rLe~~Led-~~~l~ePeGr~m-~~~~~s~~  500 (524)
                      |  -|.|++.-+ ..++...++    -......+.|+.|-.- .+..+.|=||.+ +.++||.+
T Consensus       337 Y--~~K~l~kK~~~~el~s~ln----~t~sel~ttl~eY~~~~~g~~~D~fgrk~f~~s~is~t  394 (477)
T KOG2404|consen  337 Y--MFKKLFKKYESAELASALN----ITESELKTTLEEYSKSFTGKSEDPFGRKVFPVSDISPT  394 (477)
T ss_pred             H--hHHHHHHHhhHHHHHHHhC----CCHHHHHHHHHHHHHhhcCCCCCcCCCccccCCCCCcc
Confidence            7  677777544 455555555    2334577888888764 677889999975 55777754


No 46 
>TIGR01069 mutS2 MutS2 family protein. Function of MutS2 is unknown. It should not be considered a DNA mismatch repair protein. It is likely a DNA mismatch binding protein of unknown cellular function.
Probab=50.87  E-value=1.2e+02  Score=36.03  Aligned_cols=23  Identities=13%  Similarity=0.356  Sum_probs=8.7

Q ss_pred             HHHHHHhhchHHHHHHHHHHHHH
Q 009839           93 QIEERKIRSDAAYEEAKRKERAL  115 (524)
Q Consensus        93 q~ee~~~r~~~a~EEa~~~e~a~  115 (524)
                      ++|+.+..-+...+|+++..+.+
T Consensus       526 ~~e~~~~~~~~~~~e~~~~~~~l  548 (771)
T TIGR01069       526 ELEQKNEHLEKLLKEQEKLKKEL  548 (771)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHH
Confidence            33333333333333443333333


No 47 
>KOG3634 consensus Troponin [Cytoskeleton]
Probab=50.27  E-value=1.8e+02  Score=31.31  Aligned_cols=15  Identities=20%  Similarity=0.379  Sum_probs=11.2

Q ss_pred             hhHHHHHHHHHHHhc
Q 009839          261 DNVRTKASELVKILN  275 (524)
Q Consensus       261 ~qI~~is~eL~~lL~  275 (524)
                      .++..++.+|.+.|-
T Consensus       233 ~~LkeKiKELhqrI~  247 (361)
T KOG3634|consen  233 NDLKEKIKELHQRIC  247 (361)
T ss_pred             HHHHHHHHHHHHHHH
Confidence            677888888887763


No 48 
>KOG4661 consensus Hsp27-ERE-TATA-binding protein/Scaffold attachment factor (SAF-B) [Transcription]
Probab=48.82  E-value=2.2e+02  Score=32.98  Aligned_cols=16  Identities=31%  Similarity=0.551  Sum_probs=8.2

Q ss_pred             HHhHHHHHHHHHHHhh
Q 009839           85 QRDHELKSQIEERKIR  100 (524)
Q Consensus        85 q~~~e~~~q~ee~~~r  100 (524)
                      ||+.|-++.|+|++.|
T Consensus       620 ~Re~eer~RirE~rer  635 (940)
T KOG4661|consen  620 RREAEERQRIREERER  635 (940)
T ss_pred             hHHHHHHHHHHHHHHH
Confidence            4555555555555543


No 49 
>PRK00409 recombination and DNA strand exchange inhibitor protein; Reviewed
Probab=48.64  E-value=1.4e+02  Score=35.35  Aligned_cols=7  Identities=14%  Similarity=0.449  Sum_probs=2.6

Q ss_pred             HHHHHHh
Q 009839           93 QIEERKI   99 (524)
Q Consensus        93 q~ee~~~   99 (524)
                      +.|+++.
T Consensus       531 ~~e~~~~  537 (782)
T PRK00409        531 ELEQKAE  537 (782)
T ss_pred             HHHHHHH
Confidence            3333333


No 50 
>PRK13428 F0F1 ATP synthase subunit delta; Provisional
Probab=46.23  E-value=2e+02  Score=31.76  Aligned_cols=16  Identities=0%  Similarity=-0.085  Sum_probs=9.8

Q ss_pred             chhHHHHHHHHHHHHh
Q 009839          465 SKLNLVIAEIQYYIED  480 (524)
Q Consensus       465 ~~~~~~v~rLe~~Led  480 (524)
                      |-......+|...|..
T Consensus       384 pLs~~q~~~L~~~L~k  399 (445)
T PRK13428        384 ELSDAQRTRLTEVLSR  399 (445)
T ss_pred             CCCHHHHHHHHHHHHH
Confidence            3344556777777764


No 51 
>KOG4691 consensus Uncharacterized conserved protein [Function unknown]
Probab=45.96  E-value=3.3e+02  Score=27.45  Aligned_cols=46  Identities=26%  Similarity=0.278  Sum_probs=29.5

Q ss_pred             hHHHHHhhhHHHHHHHHHHHHHhHHHHHHhHHHHHH-HHHHHhhchHH
Q 009839           58 RREMDRKNDTVYQRKIAEALDNHLTAVQRDHELKSQ-IEERKIRSDAA  104 (524)
Q Consensus        58 ~~~~~~~~d~~~qr~~~e~~~~~~~~~q~~~e~~~q-~ee~~~r~~~a  104 (524)
                      +-|+.+ .-.+|--.+--+..---+.|||.||.+-= .-|+.--+|||
T Consensus        61 ~~eLm~-r~~~Y~~~vrslR~~fr~Ev~r~~e~~~g~~ie~~~e~eaa  107 (227)
T KOG4691|consen   61 FFELME-RYQHYRQTVRSLRMEFRSEVQRVHEARAGVLIERKAEKEAA  107 (227)
T ss_pred             HHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHhhcchhHHHhhhhhHHH
Confidence            334433 34677777777888888999998887744 13444445544


No 52 
>TIGR01069 mutS2 MutS2 family protein. Function of MutS2 is unknown. It should not be considered a DNA mismatch repair protein. It is likely a DNA mismatch binding protein of unknown cellular function.
Probab=45.26  E-value=3.4e+02  Score=32.33  Aligned_cols=6  Identities=0%  Similarity=-0.512  Sum_probs=2.3

Q ss_pred             eeeccc
Q 009839          334 IYTVPK  339 (524)
Q Consensus       334 P~lVP~  339 (524)
                      |++..|
T Consensus       748 ~~V~~f  753 (771)
T TIGR01069       748 PKVKSF  753 (771)
T ss_pred             cceeee
Confidence            333333


No 53 
>KOG0982 consensus Centrosomal protein Nuf [Cell cycle control, cell division, chromosome partitioning; Cytoskeleton]
Probab=44.31  E-value=2.8e+02  Score=31.04  Aligned_cols=59  Identities=34%  Similarity=0.517  Sum_probs=42.6

Q ss_pred             hhhhhhhhHHHHHhhhHHHHHHHHHHHH--------------HhHHHHHHhHHHHHHHHHHHhhchHHH-HHHHH
Q 009839           51 VEKDRDMRREMDRKNDTVYQRKIAEALD--------------NHLTAVQRDHELKSQIEERKIRSDAAY-EEAKR  110 (524)
Q Consensus        51 ~~k~~~~~~~~~~~~d~~~qr~~~e~~~--------------~~~~~~q~~~e~~~q~ee~~~r~~~a~-EEa~~  110 (524)
                      |+--.+-|-+|++|+- -++||+.++-|              .++.-|-|.|.+--|.-|.--|-+.++ ||+||
T Consensus       210 ~e~mee~r~di~~kv~-flerkv~eledd~~~~gd~~SrlkqEnlqLvhR~h~LEEq~reqElraeE~l~Ee~rr  283 (502)
T KOG0982|consen  210 VEGMEEERIDIERKVR-FLERKVQELEDDQNIAGDRSSRLKQENLQLVHRYHMLEEQRREQELRAEESLSEEERR  283 (502)
T ss_pred             hhhhhchhhhHHHHHH-HHHHHHHHhhcchhccccchhHHHHHHHHHHHHHHHHHHHHHhhhhhHHHHHHHHHHH
Confidence            3444556778888875 48999999988              345557789998888888777777777 44444


No 54 
>PF12037 DUF3523:  Domain of unknown function (DUF3523);  InterPro: IPR021911  This presumed domain is functionally uncharacterised. This domain is found in eukaryotes. This domain is typically between 257 to 277 amino acids in length. This domain is found associated with PF00004 from PFAM. This domain has a conserved LER sequence motif. 
Probab=43.90  E-value=4.1e+02  Score=27.96  Aligned_cols=10  Identities=40%  Similarity=0.421  Sum_probs=4.7

Q ss_pred             HHHHHhhhcc
Q 009839           10 ALVELTHQHQ   19 (524)
Q Consensus        10 ~~~~~~~~~~   19 (524)
                      ||-||.+-.|
T Consensus        40 Alrel~~S~~   49 (276)
T PF12037_consen   40 ALRELNSSPH   49 (276)
T ss_pred             HHHHHhcChh
Confidence            3445554444


No 55 
>PF07046 CRA_rpt:  Cytoplasmic repetitive antigen (CRA) like repeat;  InterPro: IPR009761 This family consists of several repeats of around 42 residues in length. These repeated sequences are found in multiple copies in Trypanosoma cruzi antigens, Q26907 from SWISSPROT contains 23 copies of this repeat [].
Probab=43.25  E-value=72  Score=24.20  Aligned_cols=18  Identities=44%  Similarity=0.339  Sum_probs=8.2

Q ss_pred             HHHHHHHHHHHHHHHHHH
Q 009839          133 AKLRAEEAKRAALEAEKR  150 (524)
Q Consensus       133 ~~~~~ee~~k~~~ea~~~  150 (524)
                      +.+-+|.+++++.||.+.
T Consensus        10 a~k~aEaeKqraAEA~k~   27 (42)
T PF07046_consen   10 ATKVAEAEKQRAAEATKA   27 (42)
T ss_pred             HHHHHHHHHHHHHHHHHH
Confidence            344444444444444443


No 56 
>PF07349 DUF1478:  Protein of unknown function (DUF1478);  InterPro: IPR009949 This family consists of several hypothetical Sapovirus VP3 proteins of around 165 residues in length. The function of this family is unknown.
Probab=42.71  E-value=23  Score=33.81  Aligned_cols=39  Identities=28%  Similarity=0.583  Sum_probs=27.6

Q ss_pred             CCCCCCcchHHHHHHHHhCCCCCcc-chHHHHHHHHHHHH
Q 009839          395 VQNAHGLKEGWAWLARFLNALPANI-YTAVALNAFLQLAG  433 (524)
Q Consensus       395 ~~nP~gi~~~W~WLARiLN~~P~~~-ita~vL~afLevAG  433 (524)
                      ..||.|+.++|+||--.+-.+|-+. ..+++|.+|--.-|
T Consensus        35 ~nNpmgp~nAW~WLL~lvqsn~MSl~qy~taL~S~~llLG   74 (162)
T PF07349_consen   35 RNNPMGPHNAWSWLLPLVQSNQMSLMQYATALQSFVLLLG   74 (162)
T ss_pred             hcCCCCCchHHHHhcccCCCCcccHHHHHHHHHHHHHHHc
Confidence            4689999999999987777655432 35777777655444


No 57 
>COG4942 Membrane-bound metallopeptidase [Cell division and chromosome partitioning]
Probab=40.43  E-value=5.6e+02  Score=28.54  Aligned_cols=22  Identities=18%  Similarity=0.193  Sum_probs=9.4

Q ss_pred             HHHHHhhchHHHHHHHHHHHHH
Q 009839           94 IEERKIRSDAAYEEAKRKERAL  115 (524)
Q Consensus        94 ~ee~~~r~~~a~EEa~~~e~a~  115 (524)
                      --+++.+.+...+|-++.+..+
T Consensus       194 q~~q~~kl~~~~~E~kk~~~~l  215 (420)
T COG4942         194 QRAQQAKLAQLLEERKKTLAQL  215 (420)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Confidence            3334444444444444444333


No 58 
>KOG4691 consensus Uncharacterized conserved protein [Function unknown]
Probab=38.21  E-value=4.4e+02  Score=26.62  Aligned_cols=35  Identities=26%  Similarity=0.321  Sum_probs=25.8

Q ss_pred             HHHHhhhcccchhHHHHHHHHHHHHHHHhHHhhhhHHHHh
Q 009839           11 LVELTHQHQLGVKEEIRNLISTLETQLISENEQSNSALAQ   50 (524)
Q Consensus        11 ~~~~~~~~~~~~~~~~r~~~~~~~~~~~~e~~~~~~~~~~   50 (524)
                      .+||+..||     -.|+.+-+|-..+..|+++-.++=+.
T Consensus        61 ~~eLm~r~~-----~Y~~~vrslR~~fr~Ev~r~~e~~~g   95 (227)
T KOG4691|consen   61 FFELMERYQ-----HYRQTVRSLRMEFRSEVQRVHEARAG   95 (227)
T ss_pred             HHHHHHHHH-----HHHHHHHHHHHHHHHHHHHHHhhcch
Confidence            456666665     35788888999999999987666554


No 59 
>PF11208 DUF2992:  Protein of unknown function (DUF2992);  InterPro: IPR016787 There is currently no experimental data for members of this group or their homologues, nor do they exhibit features indicative of any function.
Probab=37.74  E-value=98  Score=28.96  Aligned_cols=27  Identities=19%  Similarity=0.281  Sum_probs=16.9

Q ss_pred             hhHHHHHHHHHHHHHh------HHHHHHhHHHH
Q 009839           65 NDTVYQRKIAEALDNH------LTAVQRDHELK   91 (524)
Q Consensus        65 ~d~~~qr~~~e~~~~~------~~~~q~~~e~~   91 (524)
                      .-+--||.++-.+.++      ..|++.+||++
T Consensus        66 NPKR~qR~a~ke~~~~g~~TkAQ~ALk~q~E~~   98 (132)
T PF11208_consen   66 NPKRLQREAKKEMKKKGISTKAQQALKLQREQR   98 (132)
T ss_pred             ChhHHHHHHHHhhhccCCChHHHHHHHHHHHHH
Confidence            3445567776666543      35777778766


No 60 
>PF14362 DUF4407:  Domain of unknown function (DUF4407)
Probab=36.42  E-value=4.9e+02  Score=26.72  Aligned_cols=16  Identities=13%  Similarity=0.302  Sum_probs=10.1

Q ss_pred             cHHHHHHHHhhhhcee
Q 009839          320 QVMDILLGEFHRACIY  335 (524)
Q Consensus       320 ef~diLlArl~kkCP~  335 (524)
                      |+.++|+-.+-..|||
T Consensus       276 el~Pv~~Kl~~~~~~Y  291 (301)
T PF14362_consen  276 ELLPVLFKLLSGKGPY  291 (301)
T ss_pred             HHHHHHHHHhcCCChH
Confidence            4566666666666763


No 61 
>PF06936 Selenoprotein_S:  Selenoprotein S (SelS);  InterPro: IPR009703 This family consists of several mammalian selenoprotein S (SelS) sequences. SelS is a plasma membrane protein and is present in a variety of tissues and cell types. These proteins are involved in the degradation process of misfolded endoplasmic reticulum (ER) luminal proteins which participate in the transfer of misfolded proteins from the ER to the cytosol, where they are destroyed by the proteasome in a ubiquitin-dependent manner []. They probably serve as a linker between DER1, which mediates the retro-translocation of misfolded proteins into the cytosol, and the ATPase complex VCP, which mediates the translocation and ubiquitination.; GO: 0008430 selenium binding, 0006886 intracellular protein transport, 0030176 integral to endoplasmic reticulum membrane; PDB: 2Q2F_A.
Probab=36.36  E-value=94  Score=30.77  Aligned_cols=7  Identities=57%  Similarity=0.743  Sum_probs=3.2

Q ss_pred             HHHHHHH
Q 009839          104 AYEEAKR  110 (524)
Q Consensus       104 a~EEa~~  110 (524)
                      |++.||+
T Consensus        84 a~eaAR~   90 (190)
T PF06936_consen   84 AMEAARR   90 (190)
T ss_dssp             HHHHHHH
T ss_pred             HHHHHHH
Confidence            3344544


No 62 
>PRK02292 V-type ATP synthase subunit E; Provisional
Probab=35.91  E-value=3.7e+02  Score=25.63  Aligned_cols=24  Identities=25%  Similarity=0.281  Sum_probs=15.3

Q ss_pred             cCccc--CCCcccchhhHHHHHHHHH
Q 009839          358 IGYRE--EDGKIESLENYLSRLKSYM  381 (524)
Q Consensus       358 lGyr~--~dg~~Ese~~Yl~RMsGI~  381 (524)
                      +|+..  .+|+++-.-+|..||.-+.
T Consensus       149 GGvil~~~~g~I~~dnT~~~rl~~~~  174 (188)
T PRK02292        149 GGVVVESEDGRVRVNNTFDSILEDVW  174 (188)
T ss_pred             ceEEEEecCCceEEeccHHHHHHHHH
Confidence            67775  4677766667766665443


No 63 
>PF15236 CCDC66:  Coiled-coil domain-containing protein 66
Probab=34.51  E-value=4.4e+02  Score=25.54  Aligned_cols=22  Identities=27%  Similarity=0.424  Sum_probs=13.0

Q ss_pred             HHHHHhhhHHHHHHHHHHHHHh
Q 009839           59 REMDRKNDTVYQRKIAEALDNH   80 (524)
Q Consensus        59 ~~~~~~~d~~~qr~~~e~~~~~   80 (524)
                      ++.-|.-...||+-|...+...
T Consensus        49 re~rR~kq~E~q~ai~~QieEk   70 (157)
T PF15236_consen   49 RERRRQKQLEHQRAIKQQIEEK   70 (157)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Confidence            3444555666777776655544


No 64 
>KOG3223 consensus Uncharacterized conserved protein [Function unknown]
Probab=34.44  E-value=3.2e+02  Score=27.48  Aligned_cols=21  Identities=24%  Similarity=0.368  Sum_probs=11.6

Q ss_pred             HHHHHHHHHHHHHHHHHHHHH
Q 009839          134 KLRAEEAKRAALEAEKRAAKE  154 (524)
Q Consensus       134 ~~~~ee~~k~~~ea~~~~~~~  154 (524)
                      ++++||++|++.-+++|+..+
T Consensus        46 qrKEeee~KR~eal~RK~E~k   66 (221)
T KOG3223|consen   46 QRKEEEEEKRAEALERKAEAK   66 (221)
T ss_pred             HHhHHHHHHHHHHHHHHHHHH
Confidence            556677777644444444443


No 65 
>PRK10361 DNA recombination protein RmuC; Provisional
Probab=33.96  E-value=7.4e+02  Score=28.04  Aligned_cols=44  Identities=20%  Similarity=0.410  Sum_probs=27.1

Q ss_pred             ccccccccccccccccccc--------------cccccCchhhHHHHHHHHHHHhcCC
Q 009839          234 LKLSSNEDFSGYEKDISRL--------------IRQIRGLKDNVRTKASELVKILNNP  277 (524)
Q Consensus       234 lks~lkk~~~~~kRqI~~k--------------IGQLtns~~qI~~is~eL~~lL~~~  277 (524)
                      +-.|++..+.+++.+|...              |.+|.....++..=+..|.+.|.+.
T Consensus       141 ll~Pl~e~l~~f~~~v~~~~~~~~~~~~~L~~qi~~L~~~n~~i~~ea~nLt~ALkgd  198 (475)
T PRK10361        141 LLSPLREQLDGFRRQVQDSFGKEAQERHTLAHEIRNLQQLNAQMAQEAINLTRALKGD  198 (475)
T ss_pred             HHhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHcCC
Confidence            4455666666666666543              3334444456677777788888763


No 66 
>KOG0742 consensus AAA+-type ATPase [Posttranslational modification, protein turnover, chaperones]
Probab=33.27  E-value=7.7e+02  Score=28.03  Aligned_cols=63  Identities=17%  Similarity=0.104  Sum_probs=36.6

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHH----HhHhhhcc-------CCchhHHHHHHHHHHHHhcccccCCCcc
Q 009839          428 FLQLAGFALFKKYKSQFRKILDNIYDN----FLNALKAR-------EDSKLNLVIAEIQYYIEDKKFLEEPEGR  490 (524)
Q Consensus       428 fLevAG~~L~~~YG~QF~KLL~lI~~d----~~p~l~~~-------~~~~~~~~v~rLe~~Led~~~l~ePeGr  490 (524)
                      -...+=+.|+=.-|.|-.+++-++..+    |-..+.+.       .-||...-...|..|++....-+.++|-
T Consensus       467 aqRsaLNAlLfRTGdqSrdivLvlAtNrpgdlDsAV~DRide~veFpLPGeEERfkll~lYlnkyi~~~~~~~~  540 (630)
T KOG0742|consen  467 AQRSALNALLFRTGDQSRDIVLVLATNRPGDLDSAVNDRIDEVVEFPLPGEEERFKLLNLYLNKYILKPATSGK  540 (630)
T ss_pred             HHHHHHHHHHHHhcccccceEEEeccCCccchhHHHHhhhhheeecCCCChHHHHHHHHHHHHHHhcCcCCCCC
Confidence            334444555556677877776554432    22233332       2267777777788888766656666664


No 67 
>KOG1363 consensus Predicted regulator of the ubiquitin pathway (contains UAS and UBX domains) [Signal transduction mechanisms]
Probab=32.44  E-value=3.8e+02  Score=30.11  Aligned_cols=55  Identities=15%  Similarity=0.042  Sum_probs=26.9

Q ss_pred             HHHhhhhhhhhhHHHHHhhh-----HHHHHHHHHHHHHhHHHHHHhHHHHHHHHHHHhhch
Q 009839           47 ALAQVEKDRDMRREMDRKND-----TVYQRKIAEALDNHLTAVQRDHELKSQIEERKIRSD  102 (524)
Q Consensus        47 ~~~~~~k~~~~~~~~~~~~d-----~~~qr~~~e~~~~~~~~~q~~~e~~~q~ee~~~r~~  102 (524)
                      .+..|++-+ .-.|+.+.+.     .+-.-.-......+....|+.+..++--++|.++.+
T Consensus       260 ~~~iv~~~~-~~~Ell~~l~g~~~~~e~~~~~~~~~~~~~~~~q~~~~~~~er~~r~~~~~  319 (460)
T KOG1363|consen  260 LVRIVIGSR-SPEELLRYLQGVTGVDEEMTLLLVAFEEEERRLQMRRSEQDEREARLALEQ  319 (460)
T ss_pred             hhhhhhcCC-CHHHHHHHHHhcCCchHHHHHHHhhhhhhhHHHhhcccchhHHHHHHHHHH
Confidence            455555555 5566655542     122223334455566666655555544444444444


No 68 
>KOG1363 consensus Predicted regulator of the ubiquitin pathway (contains UAS and UBX domains) [Signal transduction mechanisms]
Probab=31.96  E-value=2.1e+02  Score=32.07  Aligned_cols=8  Identities=25%  Similarity=0.596  Sum_probs=3.0

Q ss_pred             hHHHHHHH
Q 009839           87 DHELKSQI   94 (524)
Q Consensus        87 ~~e~~~q~   94 (524)
                      |.|.+.+.
T Consensus       322 d~eyq~sl  329 (460)
T KOG1363|consen  322 DDEYQASL  329 (460)
T ss_pred             HHHHHHHH
Confidence            33333333


No 69 
>PF03879 Cgr1:  Cgr1 family;  InterPro: IPR005579 Cgr1 is involved in nucleolar integrity and is required for processing pre-rRNA for the 60S ribosome subunit. In Saccharomyces cerevisiae, this protein is conserved and contributes to compartmentalisation of nucleolar constituents []. Cgr1 is a small hydrophilic protein and members of this family are coiled-coil proteins []. Its primary role appears to be in ribosome biogenesis [, ]. Expression of CGR1 is also associated with a cessation of yeast cell growth, which is a prerequisite for germination in this organism [].
Probab=31.26  E-value=3.4e+02  Score=24.69  Aligned_cols=22  Identities=32%  Similarity=0.419  Sum_probs=12.2

Q ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Q 009839          109 KRKERALQEEKIRQEKVKAEAE  130 (524)
Q Consensus       109 ~~~e~a~~e~k~~qek~k~e~e  130 (524)
                      +.+++++.||++.+-.++.++-
T Consensus        47 K~~ekElKeEKe~er~~r~~~~   68 (108)
T PF03879_consen   47 KEKEKELKEEKEAERQRRIQRI   68 (108)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Confidence            4445566666666555555553


No 70 
>COG5269 ZUO1 Ribosome-associated chaperone zuotin [Translation, ribosomal structure and biogenesis / Posttranslational modification, protein turnover, chaperones]
Probab=30.75  E-value=5.7e+02  Score=27.21  Aligned_cols=13  Identities=23%  Similarity=0.491  Sum_probs=7.7

Q ss_pred             HHHHHHHHHhccc
Q 009839          285 LATFSKKVVSRCE  297 (524)
Q Consensus       285 Ln~lAKaIV~QaE  297 (524)
                      +.-+||-+|..+-
T Consensus       357 ~~~~ak~~id~g~  369 (379)
T COG5269         357 FDEFAKMFIDRGK  369 (379)
T ss_pred             HHHHHHHHHhcCC
Confidence            5556666665544


No 71 
>PF15272 BBP1_C:  Spindle pole body component BBP1, C-terminal
Probab=30.60  E-value=5.7e+02  Score=25.66  Aligned_cols=59  Identities=17%  Similarity=0.209  Sum_probs=41.3

Q ss_pred             hhcccchhHHHHHHHHHHHHHHHhHHhhhhHHH----HhhhhhhhhhHHHHHhhhHHHHHHHHHH
Q 009839           16 HQHQLGVKEEIRNLISTLETQLISENEQSNSAL----AQVEKDRDMRREMDRKNDTVYQRKIAEA   76 (524)
Q Consensus        16 ~~~~~~~~~~~r~~~~~~~~~~~~e~~~~~~~~----~~~~k~~~~~~~~~~~~d~~~qr~~~e~   76 (524)
                      .+|......+++.+-.+|=.++++|..+|---+    .-++||.+.++=  .+--..+|-+|+++
T Consensus        32 ~~~~~~~e~~~~~KY~~lR~ElI~ELkqsKklydnYYkL~~KY~~LK~~--~~~~~~l~~~i~~l   94 (196)
T PF15272_consen   32 DERYELQETSYKEKYQQLRQELINELKQSKKLYDNYYKLYSKYQELKKS--SKQSEDLQSRISNL   94 (196)
T ss_pred             hhHHHhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH--hHhhHHHHHHHHHH
Confidence            344456677889999999999999999987554    458999999882  22223344555543


No 72 
>TIGR00570 cdk7 CDK-activating kinase assembly factor MAT1. All proteins in this family for which functions are known are cyclin dependent protein kinases that are components of TFIIH, a complex that is involved in nucleotide excision repair and transcription initiation. Also known as MAT1 (menage a trois 1). This family is based on the phylogenomic analysis of JA Eisen (1999, Ph.D. Thesis, Stanford University).
Probab=29.55  E-value=3.2e+02  Score=29.23  Aligned_cols=60  Identities=27%  Similarity=0.302  Sum_probs=0.0

Q ss_pred             hHHHHHHHHHHHhhchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           87 DHELKSQIEERKIRSDAAYEEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKE  154 (524)
Q Consensus        87 ~~e~~~q~ee~~~r~~~a~EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~  154 (524)
                      ..+++.+|.+.+.|..   +|.+.-++....|++.-+..+.++.     ++|++-++..++.+.+...
T Consensus       126 ~~~n~~~I~~n~~~~~---~e~~~~~~~~~~E~~~~~~rr~~~~-----~~e~ee~~~~~~~~~~~ld  185 (309)
T TIGR00570       126 QKENKDVIQKNKEKST---REQEELEEALEFEKEEEEQRRLLLQ-----KEEEEQQMNKRKNKQALLD  185 (309)
T ss_pred             HHHhHHHHHHHHHHHH---hHHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHHHHHHH


No 73 
>PF12128 DUF3584:  Protein of unknown function (DUF3584);  InterPro: IPR021979  This family consist of uncharacterised bacterial proteins. 
Probab=29.39  E-value=1.2e+03  Score=29.13  Aligned_cols=182  Identities=16%  Similarity=0.200  Sum_probs=0.0

Q ss_pred             HHHHHhHHhhhhHHHHhhhhhhhhhHHHHHhhhHHHHHHHHHHHHHhHHHHHHhHHHHHHHHHHHhhchHHHHHHHHHHH
Q 009839           34 ETQLISENEQSNSALAQVEKDRDMRREMDRKNDTVYQRKIAEALDNHLTAVQRDHELKSQIEERKIRSDAAYEEAKRKER  113 (524)
Q Consensus        34 ~~~~~~e~~~~~~~~~~~~k~~~~~~~~~~~~d~~~qr~~~e~~~~~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~e~  113 (524)
                      |.+|..+++.-..++.+..+-   ..+++..+ .+++.++.++....-.+-+.-...+..++..+-..+   ....+.++
T Consensus       602 ee~L~~~l~~~~~~l~~~~~~---~~~~e~~l-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~---~~~~~~~~  674 (1201)
T PF12128_consen  602 EEELRERLEQAEDQLQSAEER---QEELEKQL-KQINKKIEELKREITQAEQELKQAEQDLQRLKNERE---QLKQEIEE  674 (1201)
T ss_pred             hHHHHHHHHHHHHHHHHHHHH---HHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHhhHHHHHHHHHHHH---HHHHHHHH


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhhhhccccccccCCCCCCCcccccccccC
Q 009839          114 ALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEAAEREAAENSKRITAGVSQDGACGRQPDDSSVIAGAQSR  193 (524)
Q Consensus       114 a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~~e~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  193 (524)
                      +.++++.+-+++-...+  ..++.-.+.+....++-+.......-|.++.-..                           
T Consensus       675 ~~~~~~~~~~~~l~~l~--~~l~~~~~e~~~~~~~~~~~~~e~~~e~~~~~~~---------------------------  725 (1201)
T PF12128_consen  675 AKEERKEQIEEQLNELE--EELKQLKQELEELLEELKEQLKELRNELKAQWQE---------------------------  725 (1201)
T ss_pred             HHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH---------------------------


Q ss_pred             CCCCCccchhhhhHHhhhHHHHHHHHHHHHHHHHHHHhhhccccccccccccccccccccccccCchhhHHHHHHHHHHH
Q 009839          194 GSRSDGTKKLQSAVRATESALNIEQKRLQKLKELDEENQSLKLSSNEDFSGYEKDISRLIRQIRGLKDNVRTKASELVKI  273 (524)
Q Consensus       194 ~~~~~~~~k~~~~~~~~~~a~~~~~~R~~~Lkel~~~~~~lks~lkk~~~~~kRqI~~kIGQLtns~~qI~~is~eL~~l  273 (524)
                                            .....-..+..+.+.+...+...+..+..++.+.+..+..---+..-|..+-++|..+
T Consensus       726 ----------------------~~~~~d~~i~~i~~~i~~~~~~~~~~~~~le~~~~~eL~~~GvD~~~I~~l~~~i~~L  783 (1201)
T PF12128_consen  726 ----------------------LEAELDEQIEQIKQEIAAAKQEAKEQLKELEQQYNQELAGKGVDPERIQQLKQEIEQL  783 (1201)
T ss_pred             ----------------------HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhCCCCHHHHHHHHHHHHHH


No 74 
>PF11214 Med2:  Mediator complex subunit 2;  InterPro: IPR021017 The Mediator complex is a coactivator involved in the regulated transcription of nearly all RNA polymerase II-dependent genes. Mediator functions as a bridge to convey information from gene-specific regulatory proteins to the basal RNA polymerase II transcription machinery. The Mediator complex, having a compact conformation in its free form, is recruited to promoters by direct interactions with regulatory proteins and serves for the assembly of a functional preinitiation complex with RNA polymerase II and the general transcription factors. On recruitment the Mediator complex unfolds to an extended conformation and partially surrounds RNA polymerase II, specifically interacting with the unphosphorylated form of the C-terminal domain (CTD) of RNA polymerase II. The Mediator complex dissociates from the RNA polymerase II holoenzyme and stays at the promoter when transcriptional elongation begins.  The Mediator complex is composed of at least 31 subunits: MED1, MED4, MED6, MED7, MED8, MED9, MED10, MED11, MED12, MED13, MED13L, MED14, MED15, MED16, MED17, MED18, MED19, MED20, MED21, MED22, MED23, MED24, MED25, MED26, MED27, MED29, MED30, MED31, CCNC, CDK8 and CDC2L6/CDK11.  The subunits form at least three structurally distinct submodules. The head and the middle modules interact directly with RNA polymerase II, whereas the elongated tail module interacts with gene-specific regulatory proteins. Mediator containing the CDK8 module is less active than Mediator lacking this module in supporting transcriptional activation.   The head module contains: MED6, MED8, MED11, SRB4/MED17, SRB5/MED18, ROX3/MED19, SRB2/MED20 and SRB6/MED22.  The middle module contains: MED1, MED4, NUT1/MED5, MED7, CSE2/MED9, NUT2/MED10, SRB7/MED21 and SOH1/MED31. CSE2/MED9 interacts directly with MED4.  The tail module contains: MED2, PGD1/MED3, RGR1/MED14, GAL11/MED15 and SIN4/MED16.  The CDK8 module contains: MED12, MED13, CCNC and CDK8.   Individual preparations of the Mediator complex lacking one or more distinct subunits have been variously termed ARC, CRSP, DRIP, PC2, SMCC and TRAP.  This family of mediator complex subunit 2 proteins is conserved in fungi. Cyclin-dependent kinase CDK8 or Srb10 interacts with and phosphorylates Med2. Post-translational modifications of Mediator subunits are important for regulation of gene expression [, ]. 
Probab=28.94  E-value=58  Score=29.50  Aligned_cols=15  Identities=13%  Similarity=0.242  Sum_probs=8.4

Q ss_pred             HHHHHHhHHHHHHhH
Q 009839           74 AEALDNHLTAVQRDH   88 (524)
Q Consensus        74 ~e~~~~~~~~~q~~~   88 (524)
                      ...||+--+.++...
T Consensus        58 h~ILDd~~~~l~~sk   72 (105)
T PF11214_consen   58 HSILDDTESKLNDSK   72 (105)
T ss_pred             HHHHHHHHHHHHHHH
Confidence            345666666665543


No 75 
>KOG3859 consensus Septins (P-loop GTPases) [Cell cycle control, cell division, chromosome partitioning]
Probab=28.33  E-value=7.8e+02  Score=26.56  Aligned_cols=44  Identities=20%  Similarity=0.300  Sum_probs=34.7

Q ss_pred             HHHHHHHHHHHHHhHHHHHHhHH-HHHHHHHHHhhchHHHHHHHH
Q 009839           67 TVYQRKIAEALDNHLTAVQRDHE-LKSQIEERKIRSDAAYEEAKR  110 (524)
Q Consensus        67 ~~~qr~~~e~~~~~~~~~q~~~e-~~~q~ee~~~r~~~a~EEa~~  110 (524)
                      .++|-....-..+|+..+||..| .|.-+..|-.-+||-+-|+.+
T Consensus       318 ~s~qet~eaKr~e~~~e~qrkEee~rqmFvqrvkekE~elke~Ek  362 (406)
T KOG3859|consen  318 FSLQETYEAKRNEFLGELQRKEEEMRQMFVQRVKEKEAELKEAEK  362 (406)
T ss_pred             ccHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            47888888889999999999876 776677777778876666643


No 76 
>PLN02316 synthase/transferase
Probab=27.29  E-value=1.6e+02  Score=36.32  Aligned_cols=12  Identities=25%  Similarity=0.434  Sum_probs=5.1

Q ss_pred             HHHHHHHHHHHh
Q 009839           69 YQRKIAEALDNH   80 (524)
Q Consensus        69 ~qr~~~e~~~~~   80 (524)
                      .+|.|.++-+++
T Consensus       125 ~~~~~~~~~~~~  136 (1036)
T PLN02316        125 RKREIEELAEEN  136 (1036)
T ss_pred             HHHHHHHHHhhc
Confidence            344444444443


No 77 
>TIGR01791 CM_archaeal chorismate mutase, archaeal type. This model represents a clade of archaeal chorismate mutases. Chorismate mutase catalyzes the conversion of chorismate into prephenate which is subsequently converted into either phenylalanine or tyrosine. In Sulfolobus this gene is found as a fusion with prephenate dehydrogenase (although the non-TIGR annotation contains a typographical error indicating it as a dehydratase) which is the next enzyme in the tyrosine biosynthesis pathway. The Archaeoglobus gene contains an N-terminal prephenate dehydrogenase domain and a C-terminal prephenate dehydratase domain followed by a regulatory amino acid-binding ACT domain. The Thermoplasma volcanium gene is adjacent to prephenate dehydratase.
Probab=27.06  E-value=3.7e+02  Score=22.37  Aligned_cols=63  Identities=19%  Similarity=0.203  Sum_probs=41.8

Q ss_pred             HHHHHHHHHHHHHHHhHHhhhhHHHHhhhhhhhhh-----------------HHHH--HhhhHHHHHHHHHHHHHhHHHH
Q 009839           24 EEIRNLISTLETQLISENEQSNSALAQVEKDRDMR-----------------REMD--RKNDTVYQRKIAEALDNHLTAV   84 (524)
Q Consensus        24 ~~~r~~~~~~~~~~~~e~~~~~~~~~~~~k~~~~~-----------------~~~~--~~~d~~~qr~~~e~~~~~~~~~   84 (524)
                      +++|++|..++.+|+.=+.+=.....+|=+++...                 .++.  .-+|..+-+.|=..+..+...+
T Consensus         2 ~~lR~~Id~iD~~i~~Ll~~R~~l~~~i~~~K~~~g~~i~d~~RE~~v~~~~~~~~~~~~l~~~~i~~if~~i~~~s~~~   81 (83)
T TIGR01791         2 EELRQEIEEIDKSILDLIEKRIKIARKIGEIKHNNGLPITDEEREERVIERLRNTARNLGLDVLKLKEIFEILMSLSKEE   81 (83)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHcCCCCCChHHHHHHHHHHHHHHHhcCCCHHHHHHHHHHHHHHHHHh
Confidence            68999999999988766655555555554444321                 1111  2267778888878778877777


Q ss_pred             HH
Q 009839           85 QR   86 (524)
Q Consensus        85 q~   86 (524)
                      |+
T Consensus        82 Q~   83 (83)
T TIGR01791        82 QR   83 (83)
T ss_pred             hC
Confidence            75


No 78 
>PF07046 CRA_rpt:  Cytoplasmic repetitive antigen (CRA) like repeat;  InterPro: IPR009761 This family consists of several repeats of around 42 residues in length. These repeated sequences are found in multiple copies in Trypanosoma cruzi antigens, Q26907 from SWISSPROT contains 23 copies of this repeat [].
Probab=27.00  E-value=2.6e+02  Score=21.31  Aligned_cols=9  Identities=56%  Similarity=0.538  Sum_probs=3.9

Q ss_pred             HHHHHHHHH
Q 009839          145 LEAEKRAAK  153 (524)
Q Consensus       145 ~ea~~~~~~  153 (524)
                      .|++++.++
T Consensus        28 aEaeKqraa   36 (42)
T PF07046_consen   28 AEAEKQRAA   36 (42)
T ss_pred             HHHHHHHHH
Confidence            344444444


No 79 
>PTZ00491 major vault protein; Provisional
Probab=26.98  E-value=8.6e+02  Score=29.53  Aligned_cols=104  Identities=28%  Similarity=0.359  Sum_probs=0.0

Q ss_pred             HHHHhhhHHHHHHHH----------HHHHHhHHHHHHhHHHHHHHHHHHhhchHHHHHHHHHH--------------HHH
Q 009839           60 EMDRKNDTVYQRKIA----------EALDNHLTAVQRDHELKSQIEERKIRSDAAYEEAKRKE--------------RAL  115 (524)
Q Consensus        60 ~~~~~~d~~~qr~~~----------e~~~~~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~e--------------~a~  115 (524)
                      .+|.|.-..+|.-+.          |+--.|..+. ++.|.|-+.|-+||-+++.-|++|++=              +|.
T Consensus       640 pvD~~tr~~LqkSVqlAiEItt~sqEa~A~h~a~~-~eQea~g~Lerqk~~d~~~aE~~r~~llel~a~s~aves~g~a~  718 (850)
T PTZ00491        640 PVDERTRDSLQKSVQLAIEITTKSQEAAARHQAEL-LEQEARGRLERQKMHDKAKAEEQRTKLLELQAESAAVESSGQSR  718 (850)
T ss_pred             ecCHHHHHHHHHHHHHhhhhhchhHHHHHHHHHHH-HHHHhhchhHHHhhhhHHHHHHHHHHHHHHHhHHHHHhhcchHH


Q ss_pred             HHHHHHHHHHHHHHH---HHHHHHHHHHH---HHHHHHHHHHHHHHHHHHHhhhh
Q 009839          116 QEEKIRQEKVKAEAE---MQAKLRAEEAK---RAALEAEKRAAKEAAEREAAENS  164 (524)
Q Consensus       116 ~e~k~~qek~k~e~e---~~~~~~~ee~~---k~~~ea~~~~~~~~~e~e~~~~~  164 (524)
                      -|.+-+-|.++.|+|   .+|+.+++..+   -+.+|..++..+-.-+-+++.|.
T Consensus       719 a~a~a~aea~~ie~e~~v~~a~lra~a~~i~~~ael~~~~~~~~~e~~~~~~~~~  773 (850)
T PTZ00491        719 AEALAEAEARLIEAEAEVEQAELRAKALRIEAEAELEKLRKRQELELEYEQAQNE  773 (850)
T ss_pred             HHHHHHHHHHhhhhhhHHHHHHhhhHHHHHhhHHHHHHHHHHHHHHHHHHHHHhH


No 80 
>PRK09174 F0F1 ATP synthase subunit B'; Validated
Probab=26.47  E-value=6.4e+02  Score=24.97  Aligned_cols=21  Identities=14%  Similarity=0.226  Sum_probs=10.2

Q ss_pred             HHHHHHHHHhhchHHHHHHHH
Q 009839           90 LKSQIEERKIRSDAAYEEAKR  110 (524)
Q Consensus        90 ~~~q~ee~~~r~~~a~EEa~~  110 (524)
                      .+.+.++....-+..+.+||.
T Consensus        99 ~k~eAe~~~~~ye~~L~~Ar~  119 (204)
T PRK09174         99 LKQEADAAVAAYEQELAQARA  119 (204)
T ss_pred             HHHHHHHHHHHHHHHHHHHHH
Confidence            444444444444444555544


No 81 
>TIGR02168 SMC_prok_B chromosome segregation protein SMC, common bacterial type. SMC (structural maintenance of chromosomes) proteins bind DNA and act in organizing and segregating chromosomes for partition. SMC proteins are found in bacteria, archaea, and eukaryotes. This family represents the SMC protein of most bacteria. The smc gene is often associated with scpB (TIGR00281) and scpA genes, where scp stands for segregation and condensation protein. SMC was shown (in Caulobacter crescentus) to be induced early in S phase but present and bound to DNA throughout the cell cycle.
Probab=26.14  E-value=1.2e+03  Score=27.93  Aligned_cols=239  Identities=17%  Similarity=0.135  Sum_probs=0.0

Q ss_pred             HHHHHHHHHHHHHHHhHHhhhhHHHHhhhhhhhhhHHHHHhhhHHHHHHHHHHHHHhHHHHHHhHHHHHHHHHHHhhchH
Q 009839           24 EEIRNLISTLETQLISENEQSNSALAQVEKDRDMRREMDRKNDTVYQRKIAEALDNHLTAVQRDHELKSQIEERKIRSDA  103 (524)
Q Consensus        24 ~~~r~~~~~~~~~~~~e~~~~~~~~~~~~k~~~~~~~~~~~~d~~~qr~~~e~~~~~~~~~q~~~e~~~q~ee~~~r~~~  103 (524)
                      ++++..++.+...+..--++-.+.-.++........++.++++ ..+..++++-...-..-...-++..++++-....+.
T Consensus       799 ~~~~~~l~~~~~~~~~~~~~l~~~~~~~~~l~~~~~~l~~~~~-~~~~~l~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~  877 (1179)
T TIGR02168       799 KALREALDELRAELTLLNEEAANLRERLESLERRIAATERRLE-DLEEQIEELSEDIESLAAEIEELEELIEELESELEA  877 (1179)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHhhHHHHHHHHHH


Q ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhhhhccccccccCCCCCCC
Q 009839          104 AYEEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEAAEREAAENSKRITAGVSQDGACGRQPDD  183 (524)
Q Consensus       104 a~EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~~e~e~~~~~~~~~~~~~~~~~~~~~~~~  183 (524)
                      ..++....+....+.+.+......+.+........-..+-..-..+....+..-..-..................     
T Consensus       878 ~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~l~~l~~~~~~~~~~~~~l~~~l~e~~~~~~~~~~~~-----  952 (1179)
T TIGR02168       878 LLNERASLEEALALLRSELEELSEELRELESKRSELRRELEELREKLAQLELRLEGLEVRIDNLQERLSEEYSLT-----  952 (1179)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhccC-----


Q ss_pred             cccccccccCCC----CCCccchhhhhHHhhhHHHHHHH-------HHHHHHHHHHHHhhhccccccccccccccccccc
Q 009839          184 SSVIAGAQSRGS----RSDGTKKLQSAVRATESALNIEQ-------KRLQKLKELDEENQSLKLSSNEDFSGYEKDISRL  252 (524)
Q Consensus       184 ~~~~~~~~~~~~----~~~~~~k~~~~~~~~~~a~~~~~-------~R~~~Lkel~~~~~~lks~lkk~~~~~kRqI~~k  252 (524)
                            ..+..+    -...++.+...+...-.|++.|.       +|+..|..-...+..-+..|...+.++.+.+...
T Consensus       953 ------~~~~~~~~~~~~~~~~~l~~~i~~lg~aiee~~~~~~~a~er~~~l~~q~~dL~~~~~~L~~~i~~i~~~~~~~ 1026 (1179)
T TIGR02168       953 ------LEEAEALENKIEDDEEEARRRLKRLENKIKELGPVNLAAIEEYEELKERYDFLTAQKEDLTEAKETLEEAIEEI 1026 (1179)
T ss_pred             ------HHHHHhhccccccCHHHHHHHHHHHHHHHHHcCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH


Q ss_pred             cccccCchhhHHHHHHHHHHHh
Q 009839          253 IRQIRGLKDNVRTKASELVKIL  274 (524)
Q Consensus       253 IGQLtns~~qI~~is~eL~~lL  274 (524)
                      |.....+-..|+..++.+..-|
T Consensus      1027 f~~~~~~F~~v~~~f~~~F~~l 1048 (1179)
T TIGR02168      1027 DREARERFKDTFDQVNENFQRV 1048 (1179)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH


No 82 
>PRK06231 F0F1 ATP synthase subunit B; Validated
Probab=25.78  E-value=6.6e+02  Score=24.83  Aligned_cols=85  Identities=20%  Similarity=0.200  Sum_probs=0.0

Q ss_pred             HHhHHHHHHHHHHHhhchHHH----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           85 QRDHELKSQIEERKIRSDAAY----EEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAKEAAEREA  160 (524)
Q Consensus        85 q~~~e~~~q~ee~~~r~~~a~----EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~~~~e~e~  160 (524)
                      +|.......+++-...++.|.    +=.++.+.|..|.++--..++.+++..+....+++++. .+.....+...-+.|+
T Consensus        79 ~R~~~I~~~L~~Ae~~~~eA~~~l~e~e~~L~~A~~eA~~Ii~~A~~eAe~~~e~i~~~A~~e-ae~ii~~A~~~Ie~Ek  157 (205)
T PRK06231         79 KRKELIEAEINQANELKQQAQQLLENAKQRHENALAQAKEIIDQANYEALQLKSELEKEANRQ-ANLIIFQARQEIEKER  157 (205)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHHHHHHHHH


Q ss_pred             hhhhhhhhcc
Q 009839          161 AENSKRITAG  170 (524)
Q Consensus       161 ~~~~~~~~~~  170 (524)
                      +.......+.
T Consensus       158 ~~a~~~Lk~e  167 (205)
T PRK06231        158 RELKEQLQKE  167 (205)
T ss_pred             HHHHHHHHHH


No 83 
>smart00582 RPR domain present in proteins, which are involved in regulation of nuclear pre-mRNA.
Probab=25.14  E-value=3.7e+02  Score=23.50  Aligned_cols=47  Identities=11%  Similarity=0.188  Sum_probs=26.2

Q ss_pred             HHHHHhCCCCCccc-hHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          407 WLARFLNALPANIY-TAVALNAFLQLAGFALFKKYKSQFRKILDNIYD  453 (524)
Q Consensus       407 WLARiLN~~P~~~i-ta~vL~afLevAG~~L~~~YG~QF~KLL~lI~~  453 (524)
                      |+-.+.+.+|...+ ..+|+.+.+..++......|+..|.+++.-+..
T Consensus        37 i~~~~~~~~~~~kL~~LYlindIl~n~~~~~~~~f~~~~~~~~~~~~~   84 (121)
T smart00582       37 WEKYIKKAPPPRKLPLLYLLDSIVQNSKRKYGSEFGDELGPVFQDALR   84 (121)
T ss_pred             HHHHHHhCCccceehhHHhHHHHHHHHhhccHHHHHHHHHHHHHHHHH
Confidence            34455565444333 577888999888765333444444444443333


No 84 
>KOG1087 consensus Cytosolic sorting protein GGA2/TOM1 [Intracellular trafficking, secretion, and vesicular transport]
Probab=25.00  E-value=4.7e+02  Score=29.48  Aligned_cols=39  Identities=21%  Similarity=0.295  Sum_probs=27.4

Q ss_pred             CCcchHHHHHHHHhCC-CCC-ccchHHHHHHHHHHHHHHHH
Q 009839          399 HGLKEGWAWLARFLNA-LPA-NIYTAVALNAFLQLAGFALF  437 (524)
Q Consensus       399 ~gi~~~W~WLARiLN~-~P~-~~ita~vL~afLevAG~~L~  437 (524)
                      .+...+=+.|.+-+|. .|. ..++.+||.+..+-||+.|+
T Consensus        34 ~~~~eAvralkKRi~~k~s~vq~lALtlLE~cvkNCG~~fh   74 (470)
T KOG1087|consen   34 GGPKEAVRALKKRLNSKNSKVQLLALTLLETCVKNCGYSFH   74 (470)
T ss_pred             cCcHHHHHHHHHHhccCCcHHHHHHHHHHHHHHHhhhHHHH
Confidence            3444666666666664 332 34578899999999999998


No 85 
>KOG0161 consensus Myosin class II heavy chain [Cytoskeleton]
Probab=24.81  E-value=1.8e+03  Score=29.59  Aligned_cols=224  Identities=17%  Similarity=0.169  Sum_probs=0.0

Q ss_pred             CccccchhhHHHHHhhhccc--chhHHHHHHHHHHHHHHHhHHhhhhHHHHhhhhhhhhhHHHHHhhhHHHHHHHHHHHH
Q 009839            1 MDEVGLADGALVELTHQHQL--GVKEEIRNLISTLETQLISENEQSNSALAQVEKDRDMRREMDRKNDTVYQRKIAEALD   78 (524)
Q Consensus         1 ~~~~~~~~~~~~~~~~~~~~--~~~~~~r~~~~~~~~~~~~e~~~~~~~~~~~~k~~~~~~~~~~~~d~~~qr~~~e~~~   78 (524)
                      |++.+...+.|-|.+..-.-  +.+..+..++..+=..+..|+.+..+.-..+-+.......+-..+|.. |--++++.-
T Consensus      1272 ~~E~~~l~~~lee~e~~~~~~~r~~~~~~~qle~~k~qle~e~r~k~~l~~~l~~l~~e~~~l~e~leee-~e~~~~l~r 1350 (1930)
T KOG0161|consen 1272 QNENEELSRQLEEAEAKLSALSRDKQALESQLEELKRQLEEETREKSALENALRQLEHELDLLREQLEEE-QEAKNELER 1350 (1930)
T ss_pred             hhhHHHHhhHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHHHHHH


Q ss_pred             HhHHHHHHhHHHHHHHHHHHhhchHHHHHHHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHH
Q 009839           79 NHLTAVQRDHELKSQIEERKIRSDAAYEEAKRK-ERALQEEKIRQEKVKAEAEMQAKLRAE-----EAKRAALEAEKRAA  152 (524)
Q Consensus        79 ~~~~~~q~~~e~~~q~ee~~~r~~~a~EEa~~~-e~a~~e~k~~qek~k~e~e~~~~~~~e-----e~~k~~~ea~~~~~  152 (524)
                      +|..+.-.+-+-|.++++..+..-+-+||++++ .+-+++..++-+-+.+.....-+.+..     +-..-..+.....+
T Consensus      1351 ~lsk~~~e~~~~~~k~e~~~~~~~eelee~kk~l~~~lq~~qe~~e~~~~~~~~Lek~k~~l~~el~d~~~d~~~~~~~~ 1430 (1930)
T KOG0161|consen 1351 KLSKANAELAQWKKKFEEEVLQRLEELEELKKKLQQRLQELEEQIEAANAKNASLEKAKNRLQQELEDLQLDLERSRAAV 1430 (1930)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHHHH


Q ss_pred             HHHHHHHHhhhhhhhhccccccccCCCCCCCcccccccccCCCCCCccchhhhhHHhhhHHHHHHHHHHHHHHHHHHHhh
Q 009839          153 KEAAEREAAENSKRITAGVSQDGACGRQPDDSSVIAGAQSRGSRSDGTKKLQSAVRATESALNIEQKRLQKLKELDEENQ  232 (524)
Q Consensus       153 ~~~~e~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~a~~~~~~R~~~Lkel~~~~~  232 (524)
                      +.-.+-                                                .+...+.+..++..+..|......-+
T Consensus      1431 ~~le~k------------------------------------------------~k~f~k~l~e~k~~~e~l~~Eld~aq 1462 (1930)
T KOG0161|consen 1431 AALEKK------------------------------------------------QKRFEKLLAEWKKKLEKLQAELDAAQ 1462 (1930)
T ss_pred             HHHHHH------------------------------------------------HHHHHHHHHHHHHHHHHHHHHHHHHH


Q ss_pred             hccccccccccccccccccccccccCchhhHHHHHHHHHHH
Q 009839          233 SLKLSSNEDFSGYEKDISRLIRQIRGLKDNVRTKASELVKI  273 (524)
Q Consensus       233 ~lks~lkk~~~~~kRqI~~kIGQLtns~~qI~~is~eL~~l  273 (524)
                      .--.++...+-.+++.+...+.|+-..........++|.++
T Consensus      1463 ~e~r~~~tel~kl~~~lee~~e~~e~l~renk~l~~ei~dl 1503 (1930)
T KOG0161|consen 1463 RELRQLSTELQKLKNALEELLEQLEELRRENKNLSQEIEDL 1503 (1930)
T ss_pred             HHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH


No 86 
>PF13904 DUF4207:  Domain of unknown function (DUF4207)
Probab=24.75  E-value=7.7e+02  Score=25.31  Aligned_cols=101  Identities=26%  Similarity=0.334  Sum_probs=0.0

Q ss_pred             hhhHHHHHHHHHHHHH----hHHHHHHhHHHHHHHHHHHhhchHHH----------HHHHHHHHHHHHHHHHHHHHHHH-
Q 009839           64 KNDTVYQRKIAEALDN----HLTAVQRDHELKSQIEERKIRSDAAY----------EEAKRKERALQEEKIRQEKVKAE-  128 (524)
Q Consensus        64 ~~d~~~qr~~~e~~~~----~~~~~q~~~e~~~q~ee~~~r~~~a~----------EEa~~~e~a~~e~k~~qek~k~e-  128 (524)
                      ..+.=|-+|-.+..++    .+ .+.+..|...+.+++..|+.-|.          .+..++.+.....+....++..+ 
T Consensus        88 aye~Wl~~K~~q~~~klqqk~l-~~~~~~E~~k~~~e~e~Rk~lA~~~y~eWl~~K~~q~~~~~~~~~~~~~~~~~~~~~  166 (264)
T PF13904_consen   88 AYEEWLSAKEKQEQEKLQQKQL-ELKQKEEREKQEEEKEERKRLAEEKYQEWLQRKEEQERKQREQKHSKEEEKKASKSL  166 (264)
T ss_pred             hHHHHHHHHHHHHHHHhhhHHH-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhcc


Q ss_pred             -------------HHHHH---------HHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhhh
Q 009839          129 -------------AEMQA---------KLRAEEAKRAALEAEKRAAKEAAEREAAENSKRI  167 (524)
Q Consensus       129 -------------~e~~~---------~~~~ee~~k~~~ea~~~~~~~~~e~e~~~~~~~~  167 (524)
                                   ++  +         ++..++.+++..+..+....++++.++++-+..|
T Consensus       167 ~~~~~~~~~~~~~e~--a~~~~q~W~~kK~~e~~~~r~~~~~~~~~~~~e~~eRk~~ae~A  225 (264)
T PF13904_consen  167 SSQAAKPEREVSQEE--AKQRYQEWERKKKEEQQQKREEEREKEQQKQQEEQERKEQAEEA  225 (264)
T ss_pred             cccccccccccCHHH--HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH


No 87 
>PF11207 DUF2989:  Protein of unknown function (DUF2989);  InterPro: IPR021372  Some members in this bacterial family of proteins are annotated as lipoproteins however this cannot be confirmed. 
Probab=24.24  E-value=1.1e+02  Score=30.82  Aligned_cols=98  Identities=20%  Similarity=0.208  Sum_probs=54.4

Q ss_pred             HHHHHHHh-hhhceeeccccccccccccccHHHHHHHcCcccCCCcccchhhHHHHHHHHHHHHHHHHhcCCC--CCCCC
Q 009839          322 MDILLGEF-HRACIYTVPKHIVFSEAAFESEEAYYKTIGYREEDGKIESLENYLSRLKSYMRLYAALIQTEIP--GVQNA  398 (524)
Q Consensus       322 ~diLlArl-~kkCP~lVP~~~~~~~~~~~TeEey~k~lGyr~~dg~~Ese~~Yl~RMsGI~rLYAAI~qt~~~--~~~nP  398 (524)
                      .|+++.|| +++-|----.|.     .-..-++|.+.+..-..-......+.=..|+.|++.-+-.|.+..-.  +.++|
T Consensus        36 tdLI~~Ry~~~~~pt~~~ky~-----~l~~le~Y~kCielAa~Iq~i~~~e~k~~R~~a~~~s~~~l~~L~~~tk~S~dP  110 (203)
T PF11207_consen   36 TDLIWHRYELKKNPTDKNKYQ-----LLEALEKYSKCIELAAQIQHIKQKERKTDRFRALLHSYQELERLQEETKNSQDP  110 (203)
T ss_pred             HHHHHHHHHHhcCCchHHHHH-----HHHHHHHHHHHHHHHhcCeeechHhHHHHHHHHHHHHHHHHHHHHHHHccCCCc
Confidence            89999999 444222111110     01123666666554432222333445568999999999999886533  44556


Q ss_pred             CCcchHHHH--------HHHHhCCCCCccc-hHHHHH
Q 009839          399 HGLKEGWAW--------LARFLNALPANIY-TAVALN  426 (524)
Q Consensus       399 ~gi~~~W~W--------LARiLN~~P~~~i-ta~vL~  426 (524)
                      |-  .+|.|        +.+||...-.+.+ ++.+..
T Consensus       111 ~l--lYy~Wsr~~d~~A~~~fL~~E~~~~l~t~elq~  145 (203)
T PF11207_consen  111 YL--LYYHWSRFGDQEALRRFLQLEGTPELETAELQY  145 (203)
T ss_pred             cH--HHHHhhccCcHHHHHHHHHHcCCCCCCCHHHHH
Confidence            55  47777        4467766433322 455543


No 88 
>KOG4326 consensus Mitochondrial F1F0-ATP synthase, subunit e [Energy production and conversion]
Probab=24.03  E-value=2.8e+02  Score=23.70  Aligned_cols=11  Identities=45%  Similarity=0.398  Sum_probs=6.8

Q ss_pred             HHHHHHHHHHH
Q 009839          120 IRQEKVKAEAE  130 (524)
Q Consensus       120 ~~qek~k~e~e  130 (524)
                      ..+||+.+.||
T Consensus        45 ~a~eKav~da~   55 (81)
T KOG4326|consen   45 DAHEKAVADAE   55 (81)
T ss_pred             HHHHHHHHhHH
Confidence            34667776665


No 89 
>PF05672 MAP7:  MAP7 (E-MAP-115) family;  InterPro: IPR008604 The organisation of microtubules varies with the cell type and is presumably controlled by tissue-specific microtubule-associated proteins (MAPs). The 115 kDa epithelial MAP (E-MAP-115) has been identified as a microtubule-stabilising protein predominantly expressed in cell lines of epithelial origin []. The binding of this microtubule associated protein is nucleotide independent [].
Probab=23.97  E-value=7e+02  Score=24.52  Aligned_cols=6  Identities=17%  Similarity=0.811  Sum_probs=2.4

Q ss_pred             HHHHHH
Q 009839          222 QKLKEL  227 (524)
Q Consensus       222 ~~Lkel  227 (524)
                      +-|.++
T Consensus       146 KRiEEI  151 (171)
T PF05672_consen  146 KRIEEI  151 (171)
T ss_pred             HHHHHH
Confidence            344443


No 90 
>PRK00106 hypothetical protein; Provisional
Probab=23.68  E-value=1.1e+03  Score=26.92  Aligned_cols=9  Identities=11%  Similarity=0.087  Sum_probs=3.7

Q ss_pred             HHHHHHHHH
Q 009839          468 NLVIAEIQY  476 (524)
Q Consensus       468 ~~~v~rLe~  476 (524)
                      ..++.||+.
T Consensus       454 ~~~i~rl~~  462 (535)
T PRK00106        454 ENYIKRLRD  462 (535)
T ss_pred             HHHHHHHHH
Confidence            334444443


No 91 
>PF06098 Radial_spoke_3:  Radial spoke protein 3;  InterPro: IPR009290 This family consists of several radial spoke protein 3 (RSP3) sequences. Eukaryotic cilia and flagella present in diverse types of cells perform motile, sensory, and developmental functions in organisms from protists to humans. They are centred by precisely organised, microtubule-based structures, the axonemes. The axoneme consists of two central singlet microtubules, called the central pair, and nine outer doublet microtubules. These structures are well conserved during evolution. The outer doublet microtubules, each composed of A and B sub-fibres, are connected to each other by nexin links, while the central pair is held at the centre of the axoneme by radial spokes. The radial spokes are T-shaped structures extending from the A-tubule of each outer doublet microtubule to the centre of the axoneme. Radial spoke protein 3 (RSP3), is present at the proximal end of the spoke stalk and helps in anchoring the radial spoke to the outer doublet. It is thought that radial spokes regulate the activity of inner arm dynein through protein phosphorylation and dephosphorylation [].
Probab=22.94  E-value=4.2e+02  Score=27.98  Aligned_cols=55  Identities=22%  Similarity=0.193  Sum_probs=0.0

Q ss_pred             hhchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839           99 IRSDAAYEEAKRKERALQEEKIRQEKVKAEAEMQAKLRAEEAKRAALEAEKRAAK  153 (524)
Q Consensus        99 ~r~~~a~EEa~~~e~a~~e~k~~qek~k~e~e~~~~~~~ee~~k~~~ea~~~~~~  153 (524)
                      .+.-.++|+.|..|.+.-..-+.+++.+.+.-....+...+..+...+..+|-++
T Consensus       159 r~~q~~fe~~R~aEl~e~qrlE~~e~r~~eEkerR~~q~~~~~~~~~~~~~Ki~A  213 (291)
T PF06098_consen  159 RRQQRAFEELRNAELAEVQRLEEAEKRRREEKERRIKQQKERLEKEKELREKIAA  213 (291)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH


No 92 
>PF00769 ERM:  Ezrin/radixin/moesin family;  InterPro: IPR011259 The ERM family consists of three closely-related proteins, ezrin, radixin and moesin []. Ezrin was first identified as a constituent of microvilli [], radixin as a barbed, end-capping actin-modulating protein from isolated junctional fractions [], and moesin as a heparin binding protein []. A tumour suppressor molecule responsible for neurofibromatosis type 2 (NF2) is highly similar to ERM proteins and has been designated merlin (moesin-ezrin-radixin-like protein). ERM molecules contain 3 domains, an N-terminal globular domain; an extended alpha-helical domain; and a charged C-terminal domain []. Ezrin, radixin and merlin also contain a polyproline region between the helical and C-terminal domains. The N-terminal domain is highly conserved, and is also found in merlin, band 4.1 proteins and members of the band 4.1 superfamily. ERM proteins crosslink actin filaments with plasma membranes. They co-localise with CD44 at actin filament-plasma membrane interaction sites, associating with CD44 via their N-terminal domains and with actin filaments via their C-terminal domains [].; GO: 0008092 cytoskeletal protein binding, 0005737 cytoplasm, 0019898 extrinsic to membrane; PDB: 2I1J_A 2I1K_A 1E5W_A 1EF1_C.
Probab=21.57  E-value=8.7e+02  Score=24.72  Aligned_cols=23  Identities=43%  Similarity=0.572  Sum_probs=14.4

Q ss_pred             HHHHH-HHHHHHHHHhhhcccccc
Q 009839          217 EQKRL-QKLKELDEENQSLKLSSN  239 (524)
Q Consensus       217 ~~~R~-~~Lkel~~~~~~lks~lk  239 (524)
                      -+.|+ +.|+.|...+..++..-+
T Consensus       183 Knk~lq~QL~~L~~EL~~~kde~k  206 (246)
T PF00769_consen  183 KNKRLQEQLKELKSELEQLKDEEK  206 (246)
T ss_dssp             H-HHHHHHHHHHHHHHHTTB-CCG
T ss_pred             hhHHHHHHHHHHHHHHHHHhhhhc
Confidence            34454 678888888888775433


No 93 
>PTZ00399 cysteinyl-tRNA-synthetase; Provisional
Probab=21.33  E-value=1.5e+02  Score=34.52  Aligned_cols=11  Identities=18%  Similarity=0.226  Sum_probs=5.7

Q ss_pred             CCCCCcccccc
Q 009839          179 RQPDDSSVIAG  189 (524)
Q Consensus       179 ~~~~~~~~~~~  189 (524)
                      +.+..|+.|+.
T Consensus       614 t~d~~G~~~sk  624 (651)
T PTZ00399        614 THDADGEEISK  624 (651)
T ss_pred             CCCCCCCCCCH
Confidence            45555555543


No 94 
>PF04696 Pinin_SDK_memA:  pinin/SDK/memA/ protein conserved region;  InterPro: IPR006786 This conserved region is located adjacent and C-terminal to a N-terminal pinin/SKD domain IPR006787 from INTERPRO. Members of this family have very varied localisations within the eukaryotic cell. Pinin is known to localise at the desmosomes and is implicated in anchoring intermediate filaments to the desmosomal plaque []. SDK2/3 is a dynamically localised nuclear protein thought to be involved in modulation of alternative pre-mRNA splicing []. MemA is a tumour marker preferentially expressed in human melanoma cell lines. A common feature of the members of this family is that they may all participate in regulating protein-protein interactions [].
Probab=21.21  E-value=6.6e+02  Score=23.18  Aligned_cols=33  Identities=15%  Similarity=0.272  Sum_probs=20.4

Q ss_pred             HHHHHHHhHHHHHHhHHHHHHHHHHHhhchHHH
Q 009839           73 IAEALDNHLTAVQRDHELKSQIEERKIRSDAAY  105 (524)
Q Consensus        73 ~~e~~~~~~~~~q~~~e~~~q~ee~~~r~~~a~  105 (524)
                      |=-.|-.||+.++++-+-.+....||.--|+.+
T Consensus        12 mFG~LlGTL~kf~~e~~k~~~~~~rR~eie~rl   44 (131)
T PF04696_consen   12 MFGGLLGTLQKFKKEEEKKTEQQKRRAEIEKRL   44 (131)
T ss_pred             HHHHHHHHHHHHHHhHHhccHHHHHHHHHHHHH
Confidence            334566899999997655555555554444333


No 95 
>PF04747 DUF612:  Protein of unknown function, DUF612;  InterPro: IPR006836 This family includes several uncharacterised proteins from Caenorhabditis elegans.
Probab=20.93  E-value=8.9e+02  Score=26.94  Aligned_cols=14  Identities=43%  Similarity=0.458  Sum_probs=6.9

Q ss_pred             HHHHHHHHHHHHHH
Q 009839          113 RALQEEKIRQEKVK  126 (524)
Q Consensus       113 ~a~~e~k~~qek~k  126 (524)
                      ||.||+..++=||.
T Consensus       112 raa~eee~k~wka~  125 (510)
T PF04747_consen  112 RAAQEEEHKKWKAE  125 (510)
T ss_pred             hhhhhHHHHHHHHH
Confidence            45555554444433


No 96 
>cd03200 GST_C_JTV1 GST_C family, JTV-1 subfamily; composed of uncharacterized proteins with similarity to the translation product of the human JTV-1 gene. Human JTV-1, a gene of unknown function, initiates within the human PMS2 gene promoter, but is transcribed from the opposite strand. PMS2 encodes a protein involved in DNA mismatch repair and is mutated in a subset of patients with hereditary nonpolyposis colon cancer. It is unknown whether the expression of JTV-1 affects that of PMS2, or vice versa, as a result of their juxtaposition. JTV-1 is up-regulated while PMS2 is down-regulated in tumor cell spheroids that show increased resistance to anticancer cytotoxic drugs compared with tumor cell monolayers indicating that suppressed DNA mismatch repair may be a mechanism for multicellular resistance to alkylating agents.
Probab=20.44  E-value=2.6e+02  Score=23.73  Aligned_cols=50  Identities=18%  Similarity=0.296  Sum_probs=36.9

Q ss_pred             HHHHHHhCCCCCccchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Q 009839          406 AWLARFLNALPANIYTAVALNAFLQLAGFALFKKYKSQFRKILDNIYDNF  455 (524)
Q Consensus       406 ~WLARiLN~~P~~~ita~vL~afLevAG~~L~~~YG~QF~KLL~lI~~d~  455 (524)
                      +||||.++..|.+.+..+=+..|++.+...|...-...+.+.+..+-..+
T Consensus         2 r~~~~~~~~~~~~~~~~~~vd~~~d~~~~~l~~~~~~~~~~~l~~le~~L   51 (96)
T cd03200           2 RFLYRLLGPAPNAPNAATNIDSWVDTAIFQLAEGSSKEKAAVLRALNSAL   51 (96)
T ss_pred             chHHHHhcccCCCchHHHHHHHHHHHHHHHHhcCCHHHHHHHHHHHHHHH
Confidence            68999988777777778888889998776666555567777777765544


Done!