Query         007784
Match_columns 590
No_of_seqs    221 out of 923
Neff          8.1 
Searched_HMMs 46136
Date          Thu Mar 28 15:17:54 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/007784.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/007784hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG1134 Uncharacterized conser 100.0  7E-101  2E-105  854.8  53.1  564    1-571   135-709 (728)
  2 COG5594 Uncharacterized integr 100.0 6.4E-97  1E-101  795.3  44.2  533    1-537   148-721 (827)
  3 PF02714 DUF221:  Domain of unk 100.0   3E-68 6.4E-73  555.4  36.3  323  180-502     1-325 (325)
  4 PF04547 Anoctamin:  Calcium-ac  99.2 1.2E-08 2.7E-13  111.4  28.9  266  218-502   107-397 (452)
  5 PF14703 DUF4463:  Domain of un  99.1 1.4E-10 2.9E-15   96.4   6.6   71   91-161     1-85  (85)
  6 KOG2513 Protein required for m  98.1  0.0033 7.1E-08   68.4  27.0  249  222-501   260-555 (647)
  7 TIGR01659 sex-lethal sex-letha  97.1  0.0014 3.1E-08   68.8   8.0   41   50-96    104-144 (346)
  8 KOG0144 RNA-binding protein CU  96.2   0.016 3.6E-07   60.2   8.0  135   52-201    33-189 (510)
  9 TIGR01628 PABP-1234 polyadenyl  96.2   0.017 3.7E-07   65.1   8.9  170   55-235     2-200 (562)
 10 PLN03134 glycine-rich RNA-bind  95.7   0.093   2E-06   48.0  10.1   37   52-94     33-69  (144)
 11 TIGR01661 ELAV_HUD_SF ELAV/HuD  95.5   0.044 9.6E-07   57.7   8.4   37   53-95      3-39  (352)
 12 TIGR01648 hnRNP-R-Q heterogene  95.5   0.051 1.1E-06   60.6   8.8   38   52-95     57-94  (578)
 13 TIGR01628 PABP-1234 polyadenyl  93.7    0.59 1.3E-05   52.7  12.0   37   53-95    178-214 (562)
 14 TIGR01661 ELAV_HUD_SF ELAV/HuD  93.5    0.25 5.3E-06   52.0   8.1   36   53-94    269-304 (352)
 15 TIGR01648 hnRNP-R-Q heterogene  93.5     0.4 8.7E-06   53.6   9.9   39  176-214   268-308 (578)
 16 KOG0149 Predicted RNA-binding   93.3    0.24 5.1E-06   48.0   6.8   33   56-94     15-47  (247)
 17 KOG4211 Splicing factor hnRNP-  91.9    0.28   6E-06   52.3   5.6   37   51-94      8-44  (510)
 18 TIGR01622 SF-CC1 splicing fact  91.5    0.52 1.1E-05   51.6   7.7   38   52-95     88-125 (457)
 19 KOG0117 Heterogeneous nuclear   91.5     1.1 2.5E-05   47.2   9.5  125   52-203    82-234 (506)
 20 TIGR01645 half-pint poly-U bin  91.5    0.48   1E-05   53.2   7.3   38   52-95    106-143 (612)
 21 KOG0148 Apoptosis-promoting RN  90.8    0.48 1.1E-05   46.8   5.7  150   53-234     6-185 (321)
 22 PLN03121 nucleic acid binding   90.4    0.45 9.8E-06   46.7   5.1   37   52-94      4-40  (243)
 23 TIGR01642 U2AF_lg U2 snRNP aux  90.0     1.2 2.7E-05   49.3   9.1   36   53-94    295-330 (509)
 24 PF00076 RRM_1:  RNA recognitio  89.6    0.51 1.1E-05   36.3   4.1   33   56-94      1-33  (70)
 25 TIGR01622 SF-CC1 splicing fact  89.1     1.5 3.2E-05   48.0   8.6   39   51-95    184-222 (457)
 26 PF04059 RRM_2:  RNA recognitio  89.0    0.71 1.5E-05   39.0   4.6   38   54-95      2-39  (97)
 27 PLN03120 nucleic acid binding   88.1    0.77 1.7E-05   45.8   4.9   35   53-93      4-38  (260)
 28 KOG2514 Uncharacterized conser  87.7     4.8  0.0001   46.1  11.3   53  283-335   436-488 (861)
 29 smart00362 RRM_2 RNA recogniti  87.5    0.98 2.1E-05   34.2   4.4   34   55-94      1-34  (72)
 30 KOG0145 RNA-binding protein EL  87.1     5.9 0.00013   39.0  10.1  145   55-213    43-209 (360)
 31 PF14259 RRM_6:  RNA recognitio  86.3       1 2.2E-05   35.0   3.9   32   56-93      1-32  (70)
 32 PF13893 RRM_5:  RNA recognitio  84.2     1.6 3.5E-05   32.4   3.9   24  177-200    21-44  (56)
 33 PF07810 TMC:  TMC domain;  Int  82.8      11 0.00023   32.8   8.8   54  415-473    47-105 (111)
 34 KOG0109 RNA-binding protein LA  82.6     1.4   3E-05   44.1   3.7   37   56-98      5-41  (346)
 35 KOG1548 Transcription elongati  81.6     6.2 0.00013   40.6   7.9   44  157-200   286-337 (382)
 36 cd00590 RRM RRM (RNA recogniti  81.3     2.7 5.9E-05   31.9   4.5   34   55-94      1-34  (74)
 37 KOG1365 RNA-binding protein Fu  78.2      17 0.00038   37.9   9.9   27  173-199   320-346 (508)
 38 KOG4206 Spliceosomal protein s  76.2     2.6 5.5E-05   40.8   3.2   45  175-219    50-96  (221)
 39 PF00076 RRM_1:  RNA recognitio  75.3     3.1 6.7E-05   31.8   3.1   26  174-199    36-61  (70)
 40 KOG0125 Ataxin 2-binding prote  75.2     7.4 0.00016   39.8   6.3   39   52-96     95-133 (376)
 41 smart00361 RRM_1 RNA recogniti  74.5     3.8 8.3E-05   32.1   3.4   26  175-200    35-60  (70)
 42 PF14259 RRM_6:  RNA recognitio  71.6       4 8.7E-05   31.5   2.9   24  175-198    37-60  (70)
 43 TIGR01659 sex-lethal sex-letha  70.0     6.1 0.00013   41.6   4.7   37   52-94    192-228 (346)
 44 PF14257 DUF4349:  Domain of un  69.3 1.3E+02  0.0028   30.2  15.1   77   72-170   105-184 (262)
 45 KOG0107 Alternative splicing f  68.7     4.5 9.7E-05   37.7   2.9   36  174-209    44-81  (195)
 46 KOG0123 Polyadenylate-binding   66.2      21 0.00045   38.0   7.8   34   56-95     79-112 (369)
 47 KOG0122 Translation initiation  65.9     6.8 0.00015   38.4   3.6   37   52-94    188-224 (270)
 48 smart00360 RRM RNA recognition  65.5     8.5 0.00018   28.6   3.6   30   58-93      1-30  (71)
 49 KOG0117 Heterogeneous nuclear   65.0      12 0.00027   39.7   5.5   84  151-234    94-185 (506)
 50 KOG0127 Nucleolar protein fibr  63.0     9.3  0.0002   41.6   4.3   35   54-94    293-327 (678)
 51 PF07292 NID:  Nmi/IFP 35 domai  62.4     1.3 2.8E-05   36.7  -1.7   25   50-78     49-73  (88)
 52 smart00360 RRM RNA recognition  61.8     9.6 0.00021   28.3   3.3   24  175-198    36-59  (71)
 53 smart00362 RRM_2 RNA recogniti  60.9      10 0.00022   28.3   3.3   25  175-199    37-61  (72)
 54 COG0724 RNA-binding proteins (  60.2      13 0.00028   36.4   4.8   37   53-95    115-151 (306)
 55 TIGR01649 hnRNP-L_PTB hnRNP-L/  58.5      14 0.00029   40.9   4.9   36   53-94      2-37  (481)
 56 KOG0146 RNA-binding protein ET  57.2      21 0.00045   35.5   5.2   51  174-236    57-112 (371)
 57 cd00590 RRM RRM (RNA recogniti  52.7      17 0.00036   27.3   3.3   25  176-200    39-63  (74)
 58 PF15176 LRR19-TM:  Leucine-ric  50.7      46   0.001   28.1   5.5   24  471-494     8-31  (102)
 59 TIGR01645 half-pint poly-U bin  49.8      21 0.00045   40.4   4.6   36   53-94    204-239 (612)
 60 PF14605 Nup35_RRM_2:  Nup53/35  48.3      25 0.00055   26.0   3.4   32   54-92      2-33  (53)
 61 TIGR01649 hnRNP-L_PTB hnRNP-L/  46.2      31 0.00068   38.0   5.3   38   52-95    274-312 (481)
 62 KOG0132 RNA polymerase II C-te  45.6      15 0.00033   41.8   2.6   40   50-95    418-457 (894)
 63 PF02654 CobS:  Cobalamin-5-pho  44.7 2.9E+02  0.0063   27.2  11.4  123  406-532    86-213 (235)
 64 PF02388 FemAB:  FemAB family;   44.5 1.9E+02  0.0041   31.2  10.8   83   82-186   227-315 (406)
 65 PLN03120 nucleic acid binding   43.4      41  0.0009   33.7   5.0   35  176-211    42-78  (260)
 66 KOG0122 Translation initiation  41.2      32  0.0007   33.9   3.7   36  175-210   229-266 (270)
 67 KOG4208 Nucleolar RNA-binding   40.1      27 0.00059   33.5   3.0   25  174-198    89-113 (214)
 68 PF06790 UPF0259:  Uncharacteri  39.4 3.4E+02  0.0075   27.1  10.8   81  315-395    71-153 (248)
 69 KOG4212 RNA-binding protein hn  38.6      43 0.00093   35.7   4.4   43   49-96     40-82  (608)
 70 KOG4050 Glutamate transporter   38.1 1.8E+02   0.004   26.8   7.8   44  208-251    32-76  (188)
 71 KOG1457 RNA binding protein (c  37.1      46   0.001   32.4   4.1   25   53-81     34-58  (284)
 72 PF14362 DUF4407:  Domain of un  36.6 1.4E+02  0.0029   30.7   7.9   60  444-503    46-107 (301)
 73 KOG2150 CCR4-NOT transcription  35.3   1E+02  0.0023   34.2   6.9   24  145-168   119-142 (575)
 74 PF10309 DUF2414:  Protein of u  35.2 1.2E+02  0.0027   23.3   5.4   39   54-97      6-53  (62)
 75 PF06570 DUF1129:  Protein of u  33.9 3.8E+02  0.0083   25.7  10.2   21  512-532   182-202 (206)
 76 PF11874 DUF3394:  Domain of un  33.7      52  0.0011   31.2   3.8   60  486-545     8-67  (183)
 77 KOG3142 Prenylated rab accepto  32.2      58  0.0013   31.0   3.9   45  420-464    64-109 (187)
 78 TIGR01642 U2AF_lg U2 snRNP aux  32.0      82  0.0018   34.8   5.8   36  175-210   335-372 (509)
 79 PF09874 DUF2101:  Predicted me  31.9 1.9E+02  0.0041   27.8   7.1   96  437-542    50-151 (206)
 80 KOG0113 U1 small nuclear ribon  31.9      60  0.0013   33.0   4.1   36   53-94    101-136 (335)
 81 PF11823 DUF3343:  Protein of u  30.6      71  0.0015   25.1   3.7   36  178-216     2-37  (73)
 82 KOG0130 RNA-binding protein RB  30.5 1.2E+02  0.0025   27.3   5.1   39   51-95     70-108 (170)
 83 COG5570 Uncharacterized small   30.3 2.3E+02  0.0049   21.0   5.7   21   96-116     5-25  (57)
 84 PF11608 Limkain-b1:  Limkain b  30.3      94   0.002   25.6   4.2   41  176-216    38-80  (90)
 85 KOG0107 Alternative splicing f  30.1      98  0.0021   29.1   4.8   41   51-97      8-48  (195)
 86 KOG0114 Predicted RNA-binding   29.7      49  0.0011   28.3   2.6   24  175-198    55-78  (124)
 87 KOG0144 RNA-binding protein CU  29.2      54  0.0012   35.0   3.4   27  175-201    74-100 (510)
 88 KOG4205 RNA-binding protein mu  28.7      63  0.0014   33.4   3.8   38   54-97     98-135 (311)
 89 KOG0105 Alternative splicing f  28.4      62  0.0013   30.6   3.3   32   52-89      5-36  (241)
 90 PF05620 DUF788:  Protein of un  27.0 3.6E+02  0.0078   25.2   8.3   62  456-517    56-126 (170)
 91 COG4605 CeuC ABC-type enteroch  26.9   7E+02   0.015   25.6  13.2   80  419-505   210-291 (316)
 92 PF03208 PRA1:  PRA1 family pro  26.6 2.2E+02  0.0048   25.8   6.7   37  428-464    43-80  (153)
 93 PLN03121 nucleic acid binding   26.0 1.1E+02  0.0023   30.5   4.6   21  175-195    42-62  (243)
 94 PRK11020 hypothetical protein;  25.8 2.7E+02  0.0059   24.1   6.4   48   96-169     5-52  (118)
 95 KOG0125 Ataxin 2-binding prote  25.1      64  0.0014   33.2   3.0   50  175-224   134-195 (376)
 96 PLN03213 repressor of silencin  24.9 1.1E+02  0.0024   33.2   4.8   38   51-94      8-45  (759)
 97 PF15159 PIG-Y:  Phosphatidylin  24.8      66  0.0014   25.6   2.4   26  438-463    43-68  (72)
 98 PF04059 RRM_2:  RNA recognitio  24.6      78  0.0017   26.8   3.0   26  175-200    43-68  (97)
 99 KOG0105 Alternative splicing f  24.3 1.3E+02  0.0028   28.5   4.6   29   49-81    111-139 (241)
100 KOG0131 Splicing factor 3b, su  24.2      69  0.0015   30.3   2.8   40   50-95      6-45  (203)
101 KOG0071 GTP-binding ADP-ribosy  24.1 1.3E+02  0.0028   27.4   4.3   60   54-114    54-113 (180)
102 KOG0153 Predicted RNA-binding   24.0      79  0.0017   32.8   3.4   45  175-224   262-309 (377)
103 KOG0108 mRNA cleavage and poly  23.8      76  0.0017   34.5   3.5   36   54-95     19-54  (435)
104 KOG0718 Molecular chaperone (D  23.6 4.9E+02   0.011   28.5   9.2   33  432-464   372-404 (546)
105 PF11945 WASH_WAHD:  WAHD domai  22.3 2.9E+02  0.0062   28.5   7.1   39  149-187    44-82  (297)
106 PF08946 Osmo_CC:  Osmosensory   21.5 1.2E+02  0.0025   21.8   2.8   19  152-170    16-34  (46)
107 COG5438 Predicted multitransme  21.2 7.4E+02   0.016   26.3   9.8   59  283-341   206-264 (385)
108 KOG4212 RNA-binding protein hn  20.6 1.8E+02   0.004   31.2   5.3   40  173-212    82-123 (608)

No 1  
>KOG1134 consensus Uncharacterized conserved protein [General function prediction only]
Probab=100.00  E-value=7.3e-101  Score=854.76  Aligned_cols=564  Identities=39%  Similarity=0.688  Sum_probs=525.1

Q ss_pred             CCCCCCCCCcchhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcCCCCCCcccEEEEcCCCCCCCCCChHHHHHHHHhh
Q 007784            1 MGNITAKSSRLWAFLVATYWVSFVTYFLLWRGYKHVSELRADALMSPEVRPQQFAVLVRDLPDLPKGQSRKEQVDSYFKA   80 (590)
Q Consensus         1 i~Ni~~~s~~lw~h~~~~~~~~~~~~~~l~~e~~~~~~~R~~~l~~~~~~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~   80 (590)
                      ||||+.+|+++|+|++++|++++++|+++++||++++.+|++++.++..++++.|++++|+|+ ..+++..+..+++|+.
T Consensus       135 ~snv~~~s~~lw~Hv~~~y~~~~~~~~~l~~e~~~~~~~R~~~l~~~~~~~~~~s~~~~~~~~-~~~~s~~~~~~~~~~~  213 (728)
T KOG1134|consen  135 ISNVQPGSSLLWAHVFFTYLFTFFTLFILYREYKHVASIRQAYLASPKYRPDQSSVLVRNVPP-PDGVSVSVIVRHFFSL  213 (728)
T ss_pred             heeccCCCCCEEEEeehhHHHHHHHHHHHHHHHHHHHHHHHHHHhCcCcCccccchhhhcccC-CCCCchhhHHhhhhhc
Confidence            689999999999999999999999999999999999999999999999999999999999993 3334557777888888


Q ss_pred             hCCCceeEEEEeccchhHHHHHHHHHHHH-HHHHHHHHHHhhcccCCCCCCCCCcccccccCCCCccccHHHHHHHHHHH
Q 007784           81 IYPDTFYRSMVVTNNKEANKIYEELEGYK-KKLARAEAVYAESKSAGKPEGTRPTIKTGFLGLLGKRVDAIEYYNEKIKE  159 (590)
Q Consensus        81 ~~p~~v~~v~~~~d~~~l~~L~~~r~~~~-~~Le~~~~~~~~~k~~~~~~~~rP~~~~~~~~~~g~kvd~i~~~~~~l~~  159 (590)
                      .+|+++.++++++|..++.++.+++++.. +++.....+..     .++. +||++|.++||++|+|||+||||++|+++
T Consensus       214 ~~~~~~~~~~~~~~~~~l~~l~~~~~k~~~~~l~~~~~~~~-----~~~~-~rP~~k~~~~~l~gkkvdai~yy~~kl~~  287 (728)
T KOG1134|consen  214 NHPVKVRSHQVVYNESKLSKLLSKLKKLRENKLYKEHKRLK-----SNPK-KRPKRKLGFCGLFGKKVDAIDYYSEKLQE  287 (728)
T ss_pred             cCCceeehhHHHhhHHHHHHHHHHHHHHhHHHHHHhhhhhc-----cccc-cCCcceeeeeeeecceecHHHHHHHHHHH
Confidence            88899999999999999999999999984 33333222211     1122 89999999999999999999999999999


Q ss_pred             HHHHHHHHHhhhhhccccceEEEEecCHHHHHHHHHhcccCCCCceeeeeCCCCCCeeeCCcCcchHHHHHHHHHHHHHH
Q 007784          160 IIPKLEAEQKITLKEKQLGAALVFFTSRVAAASAAQSLHAQLVDTWTVSDAPESRELIWNNLNIKFFQRQIRQYVVYVIV  239 (590)
Q Consensus       160 l~~~I~~~~~~~~~~~~~~~AFVtF~s~~~a~~a~q~~~~~~~~~~~v~~AP~P~DI~W~NL~~~~~~r~~R~~~~~~~~  239 (590)
                      ++++|+++|+...++++.+.|||||+|+.+|+.|+|..++.++..|.++.||||+||.|+|+..+..+|+.|++++++++
T Consensus       288 l~~~i~~~~~~~~~~~~~~~aFVtf~sr~~A~~~aq~~~~~~~~~w~~~~APeP~Di~W~nl~i~~~~~~~~~~~~~~~~  367 (728)
T KOG1134|consen  288 LSEDIEELRESLYEEKPLPAAFVTFKSRYGAAVAAQTQQSLNPTKWLTEFAPEPRDIYWDNLAISYVERYLRRFLVNVAL  367 (728)
T ss_pred             HHHHHHHHHHHHHhcCCCceEEEEEEeeHHHHHHHHhhhcCCCCceEEEecCCcccceecccccHHHHHHHHHHHHHHHH
Confidence            99999999998877778999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             HHHHHHHHhHHHHHHhhcchhhHhhhcccchhhhcchhHHHHHHhHhHHHHHHHHHHHHHHHHHHHHhccCCCchhHHHH
Q 007784          240 ALTIMFYMIPIGLISALTTLDNLKKILPFLKPVINITALKTVLEAYLPQIALIVFLALLPKLLLFLSKTEGIPAVSHAVR  319 (590)
Q Consensus       240 ~~l~if~~iPv~~v~~l~~~~~l~~~~p~l~~~~~~~~~~~~i~~~lp~l~l~i~n~llp~ii~~ls~~e~~~s~S~~~~  319 (590)
                      +++++||++|+++|++++|+++|++.+||++.+.+.++++++++|+||++++.++++++|.++++++++|||.|+|+.|+
T Consensus       368 ~~li~f~~iPva~V~~l~nl~~l~~~~Pflk~i~~~~~i~~vI~gfLP~l~l~~~~~~lP~~l~~ls~~eG~~s~S~~e~  447 (728)
T KOG1134|consen  368 FLLLFFWIIPVAFVQALTNLEGLSKVFPFLKPILEMKFISSVITGFLPTLALVIFLALLPPFLRYLSKLEGLISRSEEER  447 (728)
T ss_pred             HHHHHHHHHHHHHHHHHHhhhhhhhccchhhhhhhcchHHHHHHhhhHHHHHHHHHHHHHHHHHHHHHhcCccchhHHHH
Confidence            99999999999999999999999999999999998899999999999999999999999999999999999999999999


Q ss_pred             HHHHHHHHHHHHHHHHHHhhhhhHHHHHHHHhcCchHHHHHHHHhCCcchhHHHHHHHHHHhhhhhHHhhhHHHHHHHHH
Q 007784          320 AASGKYFYFTVLNVFIGVTVGGTLFKTFKSIEKDPNSIVDVLANSLPGNATFFLTYVALQFFVGYGLELSRIVPLIIYHL  399 (590)
Q Consensus       320 s~~~k~f~f~~vn~~lv~~l~~~~~~~l~~~~~~p~~i~~~l~~~lp~~s~FFi~yii~~~~~~~~~~llr~~~l~~~~~  399 (590)
                      +.+.|+|+|+++|+|++++++|++++.+..++++|.+++..+|.++|++++||++|++++|+.|.+++++|+.|++++++
T Consensus       448 ~a~~k~~~F~~~nvFl~~~l~~sa~~~~~~~l~~p~~i~~~la~~lP~~a~Ff~~yii~~g~~g~~~ellrl~~Li~~~i  527 (728)
T KOG1134|consen  448 SALNKYYIFLLVNVFLVVTLSGSALRQLLSILSTPRLIPKLLAAALPKQASFFITYIITSGWAGFAGELLRLVPLIIYLL  527 (728)
T ss_pred             HHHHhHHHHHHhhhHHHhhhhHHHHHHHHHHhcCHhHHHHHHhhhChhhHHHHHHHHHHhccchhhHHHhcchhHHHHHH
Confidence            99999999999999999999999999999998889999999999999999999999999999999999999999999999


Q ss_pred             HHhhccCCHHHHHHhcCC-CCCCCcccchhHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCCCCccc
Q 007784          400 KRKYLCKTEAELKEAWFP-GDLGYGTRVPSDMLIVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAYESYGR  478 (590)
Q Consensus       400 ~~~~~~~T~re~~~~~~~-~~f~~~~~y~~~l~~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~es~G~  478 (590)
                      ++.+..+|+|++++.+++ +.+++|..||..+++++|+++||+++|+|+|||++||+++|+|||||++|||.++|||||+
T Consensus       528 ~~~~~~~t~~~~~e~~~p~~~~~~g~~yP~~~~~f~i~i~YsviaPlILpF~lvyF~l~y~vyr~ql~yvy~~~yes~g~  607 (728)
T KOG1134|consen  528 KKLFLKSTPRDREERYEPLSSFYFGTIYPRILLIFTIGICYSVIAPLILPFGLVYFCLAYLVYRYQLIYVYNQKYESGGR  607 (728)
T ss_pred             HHHHcccchhhhhhhcCCccccchhhhccHHHHHHHHHHHHHHhhHHHHHHHHHHHHHHHHHHhhhhheeeccccccccc
Confidence            999999999999999988 7899999999999999999999999999999999999999999999999999999999999


Q ss_pred             cHHHHHHHHHHHHHHHHHHHHHHHhhcccchh-hhhHHHHHHHHHHHHHHHhhccccccccchHHHhhhcccC----CCc
Q 007784          479 MWPHMFLRLVAALLLYQITMLGYFGSKKFIYV-GFLIPLPILSLIFVYICQKRFYKSFSDTALEVASRELKET----PSM  553 (590)
Q Consensus       479 ~~~~~~~~~~~~l~l~q~~~~g~f~lk~~~~~-~~~~~l~~~t~~~~~~~~~~~~~~~~~~pl~~~~~~d~~~----~~~  553 (590)
                      +||.+++++++|++++|++|+|+|++|+.+.+ .+++|++++|+++|.+|+.+|.|.+.++|++.+..+|..+    ++.
T Consensus       608 ~wp~ih~~ii~~l~l~ql~l~gl~~~k~~~~~s~~~~~l~~lTi~~~~~c~~rf~p~f~~~~~~~~~~~d~~~~~~~~~~  687 (728)
T KOG1134|consen  608 FWPDIHRRIIFGLILFQLILFGLFSLKKGAVASVLLFPLIVLTILFHIYCKGRFLPLFIAYPIEEAEVDDTLDEEREPNM  687 (728)
T ss_pred             chHHHHHHHHHHHHHHHHHHHHHHHhccccccchHHHHHHHHHHHHHHHHhhhccccccccchhhhhhccCCccccCCCh
Confidence            99999999999999999999999999998664 5999999999999999999999999999999999776442    222


Q ss_pred             ----cccccccCCCCCCCCCCC
Q 007784          554 ----EHIFRSYIPLSLNSEKVD  571 (590)
Q Consensus       554 ----~~~~~~Y~~p~l~~~~~~  571 (590)
                          +...++|.+|.+.+.+++
T Consensus       688 ~~~~~~~~~~~~~p~~~~~~~~  709 (728)
T KOG1134|consen  688 ENLYNYLKSAYVLPVFLSGSDS  709 (728)
T ss_pred             hhccccccccccCccccccccc
Confidence                457999999999987744


No 2  
>COG5594 Uncharacterized integral membrane protein [Function unknown]
Probab=100.00  E-value=6.4e-97  Score=795.31  Aligned_cols=533  Identities=28%  Similarity=0.489  Sum_probs=495.4

Q ss_pred             CCCCCCCCCcchhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcCCC--CCC-------cccEEEEcCCCCCCCCCChH
Q 007784            1 MGNITAKSSRLWAFLVATYWVSFVTYFLLWRGYKHVSELRADALMSPE--VRP-------QQFAVLVRDLPDLPKGQSRK   71 (590)
Q Consensus         1 i~Ni~~~s~~lw~h~~~~~~~~~~~~~~l~~e~~~~~~~R~~~l~~~~--~~~-------s~yTVlV~~IP~~~~~~~~~   71 (590)
                      |+|++. ++++|+|++..|++.++++|.+++|++.|..+||++++++.  ...       +++||+++++|.++++   +
T Consensus       148 ~~Nv~~-~n~~~aHvf~~~~f~~~vlfii~~el~~y~~lr~a~~~~p~y~qs~~~~~~~~ssRTvlis~LP~~~~~---~  223 (827)
T COG5594         148 ISNVSP-SNRLYAHVFLSWFFFGYVLFIIFRELRFYVVLRQAYLRSPLYQQSLLTLQNNLSSRTVLISGLPSELRS---D  223 (827)
T ss_pred             hhcccC-CCceeeeeehhHHHHHHHHHHHHHHHHHHHHHHHHHHccHHHHHHHHhhccCCCCceEEeecCChhhcC---c
Confidence            578865 79999999999999999999999999999999999998876  233       8999999999999998   8


Q ss_pred             HHHHHHHhhhCCCceeEEEEeccchhHHHHHHHHHHHHHHHHHHHHHHhhc----------cc----------------C
Q 007784           72 EQVDSYFKAIYPDTFYRSMVVTNNKEANKIYEELEGYKKKLARAEAVYAES----------KS----------------A  125 (590)
Q Consensus        72 ~~L~~~F~~~~p~~v~~v~~~~d~~~l~~L~~~r~~~~~~Le~~~~~~~~~----------k~----------------~  125 (590)
                      ++|+++|+++--+++.+..+|||.+.++++.++|++..+++|.+..++..+          |+                .
T Consensus       224 e~L~~~~~kl~~~~i~~~~l~~~~~~l~~l~k~R~ki~~klE~~~~~~~~~~~K~~~~~~~K~~~~L~~~~~k~~~~~~~  303 (827)
T COG5594         224 EELKELFDKLKVGEIDSDVLCRDLGTLQELYKERDKILKKLEKALNELLNKLLKKSHLKTNKKSGKLTPSRKKEFEILPE  303 (827)
T ss_pred             hhHHHHHhhcCeeeeccchhhhhhHHHHHHHHhHHHHHHHHHHHHHHHHHHHHHHhhHhhccCCCCCCCcccccchhhhh
Confidence            889999999987888889999999999999999999999999988765321          11                0


Q ss_pred             CCCCCCCCccccccc--CCCCccccHHHHHHHHHHHHHHHHHHHHhhhhhccccceEEEEecCHHHHHHHHHhcccCCCC
Q 007784          126 GKPEGTRPTIKTGFL--GLLGKRVDAIEYYNEKIKEIIPKLEAEQKITLKEKQLGAALVFFTSRVAAASAAQSLHAQLVD  203 (590)
Q Consensus       126 ~~~~~~rP~~~~~~~--~~~g~kvd~i~~~~~~l~~l~~~I~~~~~~~~~~~~~~~AFVtF~s~~~a~~a~q~~~~~~~~  203 (590)
                      ..|+++||+||.+-.  +++|||||+|||+++++.+++++|+++|+...+..+.++|||||+|+..||+|+|.+..+++.
T Consensus       304 y~~~~~Rp~~~i~k~~~~i~gKkVdaI~y~s~~l~~l~~~i~~~r~~~~~~t~~~~~FItFkSq~~Aq~~aQ~~~~sr~~  383 (827)
T COG5594         304 YVPDKKRPKHRIKKLNKGIFGKKVDAIDYYSAKLTKLDAEIENARKSLYENTPTKSGFITFKSQASAQIAAQSQIYSRVL  383 (827)
T ss_pred             hccccccchhhhhhhhhhhccceecHHHHHHHHHHHHHHHHHHHHhCccccCccccEEEEEehhHHHHHHHHhhhhhhhh
Confidence            235678999997744  678999999999999999999999999998876677889999999999999999999888887


Q ss_pred             cee-eeeCCCCCCeeeCCcCcchHHHHHHHHHHHHHHHHHHHHHHhHHHHHHhhcchhhHhhhcccchhhhc-chhHHHH
Q 007784          204 TWT-VSDAPESRELIWNNLNIKFFQRQIRQYVVYVIVALTIMFYMIPIGLISALTTLDNLKKILPFLKPVIN-ITALKTV  281 (590)
Q Consensus       204 ~~~-v~~AP~P~DI~W~NL~~~~~~r~~R~~~~~~~~~~l~if~~iPv~~v~~l~~~~~l~~~~p~l~~~~~-~~~~~~~  281 (590)
                      ... ++.||+|+||+|+|+..++++|..|++.++++.++++++|++|||+++.++|++++++.+||++.+.+ .|+++++
T Consensus       384 ~~~~v~iapaPnDi~W~Nl~ls~~~r~~k~~~~ni~~il~II~w~~pVa~v~~i~Nl~~l~~~~p~l~~il~~~~~l~~i  463 (827)
T COG5594         384 GKLKVEIAPAPNDIIWDNLRLSRKERLFKRISANILFILLIILWAFPVAFVGTISNLNTLSSLWPFLKFILKDPPFLAGI  463 (827)
T ss_pred             cceeeeecCCccccccccchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcchhHhhhhHHHHHHHhccHHHHHH
Confidence            655 99999999999999999999999999999999999999999999999999999999999999998875 4589999


Q ss_pred             HHhHhHHHHHHHHHHHHHHHHHHHHhccCCCchhHHHHHHHHHHHHHHHHHHHHHHhhhhhHHHHHHHHhcCchHHHHHH
Q 007784          282 LEAYLPQIALIVFLALLPKLLLFLSKTEGIPAVSHAVRAASGKYFYFTVLNVFIGVTVGGTLFKTFKSIEKDPNSIVDVL  361 (590)
Q Consensus       282 i~~~lp~l~l~i~n~llp~ii~~ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~lv~~l~~~~~~~l~~~~~~p~~i~~~l  361 (590)
                      ++|+||++++.+++.++|+++++|+.+||..|+|+.|..++.|+|.|+|+|.|+|.+++++..+.+.++.++|.++..++
T Consensus       464 ltglLptv~~~~l~~ivP~fir~Ls~~qG~~S~se~E~~~~~k~~~f~fv~~FlV~Tl~s~fss~v~~~~ke~~s~~~ll  543 (827)
T COG5594         464 LTGLLPTVALSLLMSIVPYFIRWLSYMQGLVSYSEEEIYVQNKYFAFLFVNLFLVVTLASSFSSIVWSLLKEPTSIMTLL  543 (827)
T ss_pred             HHhhhhHHHHHHHHHHhHHHHHHHHHhcCccchHHHHHHHHhhhhhheeeeehheeeehhHHHHHHHHHhcChHhHHHHH
Confidence            99999999999999999999999999999999999999999999999999999999999988888889999999999999


Q ss_pred             HHhCCcchhHHHHHHHHHHhhhhhHHhhhHHHHHHHHHHHhhccCCHHHHH-HhcCCCCCCCcccchhHHHHHHHHHHhh
Q 007784          362 ANSLPGNATFFLTYVALQFFVGYGLELSRIVPLIIYHLKRKYLCKTEAELK-EAWFPGDLGYGTRVPSDMLIVTIVFCYS  440 (590)
Q Consensus       362 ~~~lp~~s~FFi~yii~~~~~~~~~~llr~~~l~~~~~~~~~~~~T~re~~-~~~~~~~f~~~~~y~~~l~~~~i~l~Ys  440 (590)
                      |+++|++|+||++||+++|+.+.+++|+|+.+|+++.+++++.++|||++. +...++.|+||..||+.+.+++|+++||
T Consensus       544 A~~lpk~SnFfi~~iilqgl~~~~~~LLqi~~Ll~~~vl~kf~~~TpR~k~nr~~~~~~f~~G~v~P~~~~l~~I~icYS  623 (827)
T COG5594         544 ANNLPKASNFFISYIILQGLSGFPGTLLQIVPLLLSLVLGKFKDSTPRQKWNRLETPPSFQFGTVLPQPILLFTITICYS  623 (827)
T ss_pred             HhccHHHHHHHHHHHHHhcccccchHHHHHHHHHHHHhhhhhcCCChHHHHhhccCCCccccccccchhHHHHHHHHHHH
Confidence            999999999999999999999999999999999998999999999999984 5556888999999999999999999999


Q ss_pred             hhhhHHHHHHHHHHHHHHHHHHhhheeeecCCCCCccccHHHHHHHHHHHHHHHHHHHHHHHhhcccch-hhhhHHHHHH
Q 007784          441 CIAPLIIPFGVVYFALGWLILRNQALKVYVPAYESYGRMWPHMFLRLVAALLLYQITMLGYFGSKKFIY-VGFLIPLPIL  519 (590)
Q Consensus       441 ~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~es~G~~~~~~~~~~~~~l~l~q~~~~g~f~lk~~~~-~~~~~~l~~~  519 (590)
                      +++|+|+.||+++|++.|+++||+++|+++.++||||+.||.+++|+++|+++||+||+|+|++.++++ +.+++|++++
T Consensus       624 iisPlILlf~~v~F~~~ylaykY~l~Yv~~~~~es~G~~w~~al~qiivGl~l~qv~l~glf~~~k~~~ls~~~~p~~~~  703 (827)
T COG5594         624 IISPLILLFGAVYFILNYLAYKYNLIYVSNHSPESGGGYWPRALFQIIVGLYLFQVCLLGLFSLAKGWGLSVLLFPLIVF  703 (827)
T ss_pred             HHhHHHHHHHHHHHHHHHHHHHHHhhhccCCCcccCCCccHHHHHHHHHHHHHHHHHHHHHHHhcCcceeEeehHHHHHH
Confidence            999999999999999999999999999999999999999999999999999999999999999998866 4599999999


Q ss_pred             HHHHHHHHHhhccccccc
Q 007784          520 SLIFVYICQKRFYKSFSD  537 (590)
Q Consensus       520 t~~~~~~~~~~~~~~~~~  537 (590)
                      |+++|.+|+..|.|+.++
T Consensus       704 Tvi~~~~~~~~f~pl~~~  721 (827)
T COG5594         704 TVIFHYYFKKMFDPLSKY  721 (827)
T ss_pred             HHHHHHHHHHhhcccccc
Confidence            999999999999966543


No 3  
>PF02714 DUF221:  Domain of unknown function DUF221;  InterPro: IPR003864 This domain is found in a family of hypothetical transmembrane proteins none of which have any known function, the aligned region is at 538 residues at maximum length.; GO: 0016020 membrane
Probab=100.00  E-value=3e-68  Score=555.39  Aligned_cols=323  Identities=42%  Similarity=0.746  Sum_probs=313.1

Q ss_pred             EEEEecCHHHHHHHHHhcccCCCCceeeeeCCCCCCeeeCCcCcchHHHHHHHHHHHHHHHHHHHHHHhHHHHHHhhcch
Q 007784          180 ALVFFTSRVAAASAAQSLHAQLVDTWTVSDAPESRELIWNNLNIKFFQRQIRQYVVYVIVALTIMFYMIPIGLISALTTL  259 (590)
Q Consensus       180 AFVtF~s~~~a~~a~q~~~~~~~~~~~v~~AP~P~DI~W~NL~~~~~~r~~R~~~~~~~~~~l~if~~iPv~~v~~l~~~  259 (590)
                      |||||+++++|+.|+|..++++|.+|++++||||+||+|+||+.+..+|..|++++++++++++++|++|++++++++|+
T Consensus         1 aFVtF~~~~~a~~~~q~~~~~~~~~~~v~~APeP~DI~W~NL~~~~~~r~~R~~~~~~~~~~l~i~~~ipv~~v~~l~~l   80 (325)
T PF02714_consen    1 AFVTFNSQKSAQIALQLLLSKRPNSWRVSPAPEPDDIIWENLSISSKQRFLRRIIVNILLFLLIIFWTIPVAFVSALSNL   80 (325)
T ss_pred             CEEEECCHHHHHHHHHHHhcCCCCCceEeeCCCcccccccccCCChHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHcc
Confidence            79999999999999999999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             hhHhhhcccchhhhc-chhHHHHHHhHhHHHHHHHHHHHHHHHHHHHHhccCCCchhHHHHHHHHHHHHHHHHHHHHHHh
Q 007784          260 DNLKKILPFLKPVIN-ITALKTVLEAYLPQIALIVFLALLPKLLLFLSKTEGIPAVSHAVRAASGKYFYFTVLNVFIGVT  338 (590)
Q Consensus       260 ~~l~~~~p~l~~~~~-~~~~~~~i~~~lp~l~l~i~n~llp~ii~~ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~lv~~  338 (590)
                      +++++..|+++++.+ ++...++++|++|+++++++|.++|.++++++++|||.|+|+.|+++++|+|+|+++|++++++
T Consensus        81 ~~l~~~~~~l~~~~~~~~~~~~~i~~~lp~l~l~~~~~llp~ii~~ls~~e~~~s~S~~~~sv~~k~f~f~~~n~~lv~~  160 (325)
T PF02714_consen   81 DTLKKVIPFLQWIISFSPWLLSLIQGILPSLLLSIFNALLPIIIRFLSKFEGHKSRSEVERSVLRKLFFFLFFNVFLVPS  160 (325)
T ss_pred             cchhccchhhHHHhhccchhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhcCCCchhHHHHHHHHHHHHHHHHHHHHHHH
Confidence            999999999988854 4577899999999999999999999999999999999999999999999999999999999999


Q ss_pred             hhhhHHHHHHHHhcCchHHHHHHHHhCCcchhHHHHHHHHHHhhhhhHHhhhHHHHHHHHHHHhhccCCHHHHHHhc-CC
Q 007784          339 VGGTLFKTFKSIEKDPNSIVDVLANSLPGNATFFLTYVALQFFVGYGLELSRIVPLIIYHLKRKYLCKTEAELKEAW-FP  417 (590)
Q Consensus       339 l~~~~~~~l~~~~~~p~~i~~~l~~~lp~~s~FFi~yii~~~~~~~~~~llr~~~l~~~~~~~~~~~~T~re~~~~~-~~  417 (590)
                      +++++++.+.++.++|+++.+.+|.++|++++||++|++++++++.+++++|+.+++++.+++++..+||||+++.+ ++
T Consensus       161 l~~~~~~~~~~~~~~~~~i~~~l~~~lp~~s~ffi~~ii~~~~~~~~~~Ll~~~~l~~~~~~~~~~~~t~r~~~~~~~~~  240 (325)
T PF02714_consen  161 LAGTILSALKNIINNPGSILQLLGNFLPNSSNFFINYIILQAFIGSPLELLRPPPLIIYYIRRKFFSKTPRELNELYTEP  240 (325)
T ss_pred             hhHHHHHHHHHHHhCcchHHHHHHHHhhhhhHHHHHHHHHhcchhhHHHHHHHHHHHHHHHHHHhcCCCHHHHHHhcCCC
Confidence            99999999999999999999999999999999999999999999999999999999988887777779999999988 99


Q ss_pred             CCCCCcccchhHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCCCCccccHHHHHHHHHHHHHHHHHH
Q 007784          418 GDLGYGTRVPSDMLIVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAYESYGRMWPHMFLRLVAALLLYQIT  497 (590)
Q Consensus       418 ~~f~~~~~y~~~l~~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~es~G~~~~~~~~~~~~~l~l~q~~  497 (590)
                      ++|+||..||..+++++++++||+++|+++|+|++||++.|++||||++|||++++||||++||.+++++++|++++|++
T Consensus       241 ~~f~~~~~ya~~l~v~~i~l~ys~i~Plil~~~~~yf~l~y~v~ky~llyvy~~~~es~G~~~~~~~~~~~~~l~i~q~~  320 (325)
T PF02714_consen  241 PPFDYGYQYAQMLLVFFIGLFYSPIAPLILPFGLVYFLLKYFVDKYNLLYVYRPKYESGGRLWPTAFNRLLFGLVIFQFT  320 (325)
T ss_pred             CCCcchHHHHHHHHHHHHHHHHHhhhhHHHHHHHHHHHHHHHHHHhheeeeccCCCCCCchHHHHHHHHHHHHHHHHHHH
Confidence            99999999999999999999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             HHHHH
Q 007784          498 MLGYF  502 (590)
Q Consensus       498 ~~g~f  502 (590)
                      |+|+|
T Consensus       321 ~~g~f  325 (325)
T PF02714_consen  321 MIGLF  325 (325)
T ss_pred             HHHhC
Confidence            99986


No 4  
>PF04547 Anoctamin:  Calcium-activated chloride channel;  InterPro: IPR007632 This family contains the anoctamin/TMEM16 proteins which are thought to be calcium-dependent chloride channel [].
Probab=99.19  E-value=1.2e-08  Score=111.35  Aligned_cols=266  Identities=16%  Similarity=0.170  Sum_probs=160.7

Q ss_pred             eCCcCcchHHHHHHHHHHHHHHHHHHHHHHhHHHHHHhhcchhh-HhhhcccchhhhcchhHHHHHHhHhHHHHHHHHHH
Q 007784          218 WNNLNIKFFQRQIRQYVVYVIVALTIMFYMIPIGLISALTTLDN-LKKILPFLKPVINITALKTVLEAYLPQIALIVFLA  296 (590)
Q Consensus       218 W~NL~~~~~~r~~R~~~~~~~~~~l~if~~iPv~~v~~l~~~~~-l~~~~p~l~~~~~~~~~~~~i~~~lp~l~l~i~n~  296 (590)
                      ..+...+.++|..|..++..+++++++.   -++++.++..++. +.+.....    ......+++.+++-++++.++|.
T Consensus       107 ~~~~~~p~~~r~~r~~~s~~ivl~~i~i---~~~~~~~~~~~~~~~~~~~~~~----~~~~~~~~~~~vl~~v~i~il~~  179 (452)
T PF04547_consen  107 EMEPYYPPWKRILRYLVSVPIVLLFILI---VIGIVIGVFYLRIYLTEIYSGP----GKQFLASLIPTVLNAVVILILNF  179 (452)
T ss_pred             CCccCCcHHHHhhhhhhhHHHHHHHHHH---HHHHHHHHHHHHHHHHHHhccc----chhHHHHHHHHHHHHHHHHhhhh
Confidence            4456677888888886665554443322   1222222222211 11110000    01123344455555556666777


Q ss_pred             HHHHHHHHHHhccCCCchhHHHHHHHHHHHHHHHHHHHHHHhhhhhHHHHHHHHhcCchHHHHHHHHhCCcchhHHHHHH
Q 007784          297 LLPKLLLFLSKTEGIPAVSHAVRAASGKYFYFTVLNVFIGVTVGGTLFKTFKSIEKDPNSIVDVLANSLPGNATFFLTYV  376 (590)
Q Consensus       297 llp~ii~~ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~lv~~l~~~~~~~l~~~~~~p~~i~~~l~~~lp~~s~FFi~yi  376 (590)
                      +...+...+.++|.|+|.|+.|.+...|.|.|+++|.+...... +.+....+.-=+| ...+        -+.-++.++
T Consensus       180 iy~~~a~~Lt~~EnhrT~~~ye~sli~K~F~f~fvn~y~~Lfyi-aF~~~~~~~~~~~-~~~~--------L~~ql~~~~  249 (452)
T PF04547_consen  180 IYRKLAKKLTDWENHRTESEYENSLIIKVFLFQFVNSYAPLFYI-AFFYGVRQEECQP-CLSR--------LRIQLFTIM  249 (452)
T ss_pred             HHHHHHHHHHHhccccchHHHHHHHHHHHHHHHHHHHHHHHHHH-HHHHhhcccccCC-CHHH--------HHHHHHHHH
Confidence            78888899999999999999999999999999999999855443 2222110000011 1111        122334444


Q ss_pred             HHHHhhhhhHHhhhHHHHHHHHHHHhhccCCHHH------------------HHHhcCCCCCCCc---ccchhHHHHHHH
Q 007784          377 ALQFFVGYGLELSRIVPLIIYHLKRKYLCKTEAE------------------LKEAWFPGDLGYG---TRVPSDMLIVTI  435 (590)
Q Consensus       377 i~~~~~~~~~~llr~~~l~~~~~~~~~~~~T~re------------------~~~~~~~~~f~~~---~~y~~~l~~~~i  435 (590)
                      +++-+.+...+.  +.|.+.+..+++-..+..++                  -.+-...++++..   ..|..+..-+..
T Consensus       250 ~~~qi~~~~~e~--~~P~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~l~~y~~~g~~~dY~emviQFGy  327 (452)
T PF04547_consen  250 VTKQIINNLLEV--VLPYLKKRYRRKKIRKKQRKKQQDERQENEEENQFLQQWEKEYELPPYDPDGLFDDYLEMVIQFGY  327 (452)
T ss_pred             HHHHHHHHHHHH--HHHHHHHHHHHHHHHhhhhhcccccccccccccchHHHHHHHhcCCCCCcCCchHHHHHHHHHHHH
Confidence            455455555554  35555544433211110000                  0111234555543   789999999999


Q ss_pred             HHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCC---CCccccHHHHHHHHHHHHHHHHHHHHHHH
Q 007784          436 VFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAY---ESYGRMWPHMFLRLVAALLLYQITMLGYF  502 (590)
Q Consensus       436 ~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~---es~G~~~~~~~~~~~~~l~l~q~~~~g~f  502 (590)
                      ...|+++.|+...++++.-++-.-+|++.+++.++||.   .++=-.|-.++..+...-++....++++.
T Consensus       328 v~lF~~afPlapl~allnN~~eir~D~~Kl~~~~rRP~p~~~~~IG~W~~il~~i~~lav~tN~~li~~~  397 (452)
T PF04547_consen  328 VTLFSAAFPLAPLFALLNNIVEIRLDAFKLLYLYRRPVPRRASSIGIWNNILEIISWLAVITNAALIAFT  397 (452)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhHHhCCCCcccccchhhhHHHHHHHHHHHHHHHHHHHHhh
Confidence            99999999999999999999999999999999998653   22224798988887777777666666554


No 5  
>PF14703 DUF4463:  Domain of unknown function (DUF4463)
Probab=99.11  E-value=1.4e-10  Score=96.39  Aligned_cols=71  Identities=41%  Similarity=0.701  Sum_probs=57.9

Q ss_pred             EeccchhHHHHHHHHHHHHHHHHHHHHHHhhcccC---CCC----------CCCCCcccccccCCCC-ccccHHHHHHHH
Q 007784           91 VVTNNKEANKIYEELEGYKKKLARAEAVYAESKSA---GKP----------EGTRPTIKTGFLGLLG-KRVDAIEYYNEK  156 (590)
Q Consensus        91 ~~~d~~~l~~L~~~r~~~~~~Le~~~~~~~~~k~~---~~~----------~~~rP~~~~~~~~~~g-~kvd~i~~~~~~  156 (590)
                      ++||+++|.+|+++|+++.++||.++.+|.+..+.   ..|          ...||.++.|++|++| ++||+||||++|
T Consensus         1 i~rd~~~L~~Lv~~R~~~~~kLE~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~g~~kVDaIdyy~~e   80 (85)
T PF14703_consen    1 ICRDWSKLEKLVEEREKAVRKLESAESKYLKNANKRPKKRPKKKKKSESSSNKKRPRHRTGFLGLFGGKKVDAIDYYREE   80 (85)
T ss_pred             CcCCHHHHHHHHHHHHHHHHHHHHHHHHHHhhhhhccccCCccccCccccccccCCCCCCCcCCCCCCCcchHHHHHHHH
Confidence            58999999999999999999999999998764320   000          1246677779999888 999999999999


Q ss_pred             HHHHH
Q 007784          157 IKEII  161 (590)
Q Consensus       157 l~~l~  161 (590)
                      |++|+
T Consensus        81 l~~Ln   85 (85)
T PF14703_consen   81 LKELN   85 (85)
T ss_pred             HHHhC
Confidence            99875


No 6  
>KOG2513 consensus Protein required for meiotic chromosome segregation [Cell cycle control, cell division, chromosome partitioning]
Probab=98.06  E-value=0.0033  Score=68.41  Aligned_cols=249  Identities=18%  Similarity=0.242  Sum_probs=140.3

Q ss_pred             CcchHHHHHHHHHHHHHHHHHHHHHHhHHHHHHhhcchhhHhhhcccchhhhcchhHHHHHHhHhHHHHHHHHHHHHHHH
Q 007784          222 NIKFFQRQIRQYVVYVIVALTIMFYMIPIGLISALTTLDNLKKILPFLKPVINITALKTVLEAYLPQIALIVFLALLPKL  301 (590)
Q Consensus       222 ~~~~~~r~~R~~~~~~~~~~l~if~~iPv~~v~~l~~~~~l~~~~p~l~~~~~~~~~~~~i~~~lp~l~l~i~n~llp~i  301 (590)
                      ..+.|.|.+|+..+.+-++++++....++.+...-  ++.      |.......| +.+ +-.++|++++.++..++..+
T Consensus       260 ~yp~w~~~~~~~~vsvPv~l~c~~i~l~f~l~~f~--ie~------~~~s~~~~~-~~s-ils~lP~iv~~~li~~~t~~  329 (647)
T KOG2513|consen  260 YYPEWKRILRRYLVSVPVILLCLCILLSFMLYCFQ--IEV------WVLSDYGGP-LIS-ILSYLPTIVYAVLIPVLTRI  329 (647)
T ss_pred             cccHHHHHHHHHHhhhHHHHHHHHHHHHHHHHHHH--HHH------HHHHHcCCc-hHH-HHHHHHHHHHHHHHHHHHHH
Confidence            45677888888888877776665555554443321  111      111111223 223 34678988888877766655


Q ss_pred             HHH----HHhccCCCchhHHHHHHHHHHHHHHHHHHHHHHhhhhhHHHHHHHHhcCchHHHHHHHHhCCcchhHHHHHHH
Q 007784          302 LLF----LSKTEGIPAVSHAVRAASGKYFYFTVLNVFIGVTVGGTLFKTFKSIEKDPNSIVDVLANSLPGNATFFLTYVA  377 (590)
Q Consensus       302 i~~----ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~lv~~l~~~~~~~l~~~~~~p~~i~~~l~~~lp~~s~FFi~yii  377 (590)
                      -++    |.++|.|.++|..+++...|.+.|+|+|.++-....+-+..       |-...-..++.-+-.      +.++
T Consensus       330 Y~k~Ae~Lt~~EN~r~~s~y~~hli~K~~lf~f~nsy~sLFyi~f~l~-------d~~~Lk~~l~~~li~------sQ~l  396 (647)
T KOG2513|consen  330 YKKLAEFLTKLENHRLESAYQKHLIAKVFLFNFVNSYLSLFYIAFLLR-------DMELLKQQLATLLIT------SQSL  396 (647)
T ss_pred             HHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhc-------cHHHHHHHHHHHHHH------HHHH
Confidence            554    55899999999999999999999999999985544332211       111122222221110      0000


Q ss_pred             HHHhhhhhHHhhhHHHHHH----------HHHHHhhc---cCCHHHHH---------------Hhc--------CC--CC
Q 007784          378 LQFFVGYGLELSRIVPLII----------YHLKRKYL---CKTEAELK---------------EAW--------FP--GD  419 (590)
Q Consensus       378 ~~~~~~~~~~llr~~~l~~----------~~~~~~~~---~~T~re~~---------------~~~--------~~--~~  419 (590)
                      .     ..++...  |.+.          +...+.+.   ..++.+.+               +..        +.  .+
T Consensus       397 ~-----~~~e~~~--p~f~~~~~r~~~~~~f~t~~~ae~~~s~~~~i~~~~~~~~~~s~~~~a~~~~~~~qa~~E~~~~~  469 (647)
T KOG2513|consen  397 L-----NLMEIAL--PYFKIRTKRYENYIRFRTKSFAEELASAQAKIDGESPGFPAPSREPEAQLFPSLKQAELESGLAE  469 (647)
T ss_pred             H-----HHHhhcc--hHHHHhhhhhhhhhhHHHHHHHHhhccchhhhcccccCCCCcccccchhhcccchhhhhcchhhh
Confidence            0     0111100  0000          00000000   00111111               000        01  11


Q ss_pred             CC-CcccchhHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCC----CCccccHHHHHHHHHHHHHHH
Q 007784          420 LG-YGTRVPSDMLIVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAY----ESYGRMWPHMFLRLVAALLLY  494 (590)
Q Consensus       420 f~-~~~~y~~~l~~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~----es~G~~~~~~~~~~~~~l~l~  494 (590)
                      +| --..|=.+.+-|-..+.||++.|+-..+|++--++.+=+|-+.++.+.+||.    ++=| .|..++..+-+--++.
T Consensus       470 ydgtf~Dylel~lQFGyvVlFS~~~PLA~~~aLvnNv~eirsda~Kl~~~~krPfp~r~~~IG-~Wq~~l~~lSvls~vt  548 (647)
T KOG2513|consen  470 YDGTFDDYLELLLQFGYVVLFSCAFPLAAIFALVNNVIEIRSDALKLCLVLKRPFPRRVANIG-AWQNALELLSVLSCVT  548 (647)
T ss_pred             hcchhHHHHHHHHHhhHHHHHHhHhhHHHHHHHHHHHhhhhHHHHHHHHhcCCCCcchhhhhH-HHHHHHHHHHHHHHHH
Confidence            12 2234556777888899999999999999999999999999999999998775    4555 5888876655444443


Q ss_pred             HHHHHHH
Q 007784          495 QITMLGY  501 (590)
Q Consensus       495 q~~~~g~  501 (590)
                      -..++|+
T Consensus       549 ncaLi~~  555 (647)
T KOG2513|consen  549 NCALIGM  555 (647)
T ss_pred             hHHHHhc
Confidence            3334443


No 7  
>TIGR01659 sex-lethal sex-lethal family splicing factor. This model describes the sex-lethal family of splicing factors found in Dipteran insects. The sex-lethal phenotype, however, may be limited to the Melanogasters and closely related species. In Drosophila the protein acts as an inhibitor of splicing. This subfamily is most closely related to the ELAV/HUD subfamily of splicing factors (TIGR01661).
Probab=97.10  E-value=0.0014  Score=68.75  Aligned_cols=41  Identities=15%  Similarity=0.256  Sum_probs=34.8

Q ss_pred             CCcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccch
Q 007784           50 RPQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNK   96 (590)
Q Consensus        50 ~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~   96 (590)
                      .+++.+|.|.|||.+++    +++|+++|+++  +.|.+|.++.|..
T Consensus       104 ~~~~~~LfVgnLp~~~t----e~~L~~lF~~~--G~V~~v~i~~d~~  144 (346)
T TIGR01659       104 NNSGTNLIVNYLPQDMT----DRELYALFRTI--GPINTCRIMRDYK  144 (346)
T ss_pred             CCCCcEEEEeCCCCCCC----HHHHHHHHHhc--CCEEEEEEEecCC
Confidence            35678999999999987    69999999997  5699999988753


No 8  
>KOG0144 consensus RNA-binding protein CUGBP1/BRUNO (RRM superfamily) [RNA processing and modification]
Probab=96.18  E-value=0.016  Score=60.16  Aligned_cols=135  Identities=17%  Similarity=0.287  Sum_probs=74.2

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhHHH------HHHHHHHHHHHHHHHHHHHhhcccC
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEANK------IYEELEGYKKKLARAEAVYAESKSA  125 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l~~------L~~~r~~~~~~Le~~~~~~~~~k~~  125 (590)
                      +.--+.|--||+...    +++|+++||++  |.|.+|.+.+|-..=..      ....|+++.+    +...+...|+-
T Consensus        33 ~~vKlfVgqIprt~s----E~dlr~lFe~y--g~V~einl~kDk~t~~s~gcCFv~~~trk~a~~----a~~Alhn~ktl  102 (510)
T KOG0144|consen   33 SAVKLFVGQIPRTAS----EKDLRELFEKY--GNVYEINLIKDKSTGQSKGCCFVKYYTRKEADE----AINALHNQKTL  102 (510)
T ss_pred             hhhhheeccCCcccc----HHHHHHHHHHh--CceeEEEeecccccCcccceEEEEeccHHHHHH----HHHHhhccccc
Confidence            344577999999775    79999999998  78999999987532100      0011222211    11111111110


Q ss_pred             -----------CCCCCCCC-cccccccCCCCccccHHHHHHHHHHHHHHH---HHHHHh-hhhhccccceEEEEecCHHH
Q 007784          126 -----------GKPEGTRP-TIKTGFLGLLGKRVDAIEYYNEKIKEIIPK---LEAEQK-ITLKEKQLGAALVFFTSRVA  189 (590)
Q Consensus       126 -----------~~~~~~rP-~~~~~~~~~~g~kvd~i~~~~~~l~~l~~~---I~~~~~-~~~~~~~~~~AFVtF~s~~~  189 (590)
                                 .+.|++|- ..+.-|.|+..|+.     -+++++++-.+   |++.+- +.......|+|||+|.+.+.
T Consensus       103 pG~~~pvqvk~Ad~E~er~~~e~KLFvg~lsK~~-----te~evr~iFs~fG~Ied~~ilrd~~~~sRGcaFV~fstke~  177 (510)
T KOG0144|consen  103 PGMHHPVQVKYADGERERIVEERKLFVGMLSKQC-----TENEVREIFSRFGHIEDCYILRDPDGLSRGCAFVKFSTKEM  177 (510)
T ss_pred             CCCCcceeecccchhhhccccchhhhhhhccccc-----cHHHHHHHHHhhCccchhhheecccccccceeEEEEehHHH
Confidence                       01112221 11222445555554     23455555443   232211 11134578999999999999


Q ss_pred             HHHHHHhcccCC
Q 007784          190 AASAAQSLHAQL  201 (590)
Q Consensus       190 a~~a~q~~~~~~  201 (590)
                      |..|...++...
T Consensus       178 A~~Aika~ng~~  189 (510)
T KOG0144|consen  178 AVAAIKALNGTQ  189 (510)
T ss_pred             HHHHHHhhccce
Confidence            999998877643


No 9  
>TIGR01628 PABP-1234 polyadenylate binding protein, human types 1, 2, 3, 4 family. There are four paralogs in Homo sapiens which are expressed in testis, platelets, broadly expressed, or of unknown tissue range.
Probab=96.15  E-value=0.017  Score=65.10  Aligned_cols=170  Identities=18%  Similarity=0.208  Sum_probs=85.3

Q ss_pred             EEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhHHH------HHHHHHHHHHHHHHHHHHHhhcccCC-C
Q 007784           55 AVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEANK------IYEELEGYKKKLARAEAVYAESKSAG-K  127 (590)
Q Consensus        55 TVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l~~------L~~~r~~~~~~Le~~~~~~~~~k~~~-~  127 (590)
                      ||.|.|||.+++    +++|+++|+++  |.|.+|.+++|...-..      -....+.+.+-++.........+.-. .
T Consensus         2 sl~VgnLp~~vt----e~~L~~~F~~~--G~v~~v~v~~d~~t~~s~G~afV~F~~~~~A~~Al~~ln~~~i~gk~i~i~   75 (562)
T TIGR01628         2 SLYVGDLDPDVT----EAKLYDLFKPF--GPVLSVRVCRDSVTRRSLGYGYVNFQNPADAERALETMNFKRLGGKPIRIM   75 (562)
T ss_pred             eEEEeCCCCCCC----HHHHHHHHHhc--CCEEEEEEEecCCCCCcceEEEEEECCHHHHHHHHHHhCCCEECCeeEEee
Confidence            799999999986    79999999998  67999999988541000      01222333333332211000000000 0


Q ss_pred             CCCCCCcccc-c----ccCCCCccccHHHHHHHHHHHHHHH---HHHHHhhh-hhccccceEEEEecCHHHHHHHHHhcc
Q 007784          128 PEGTRPTIKT-G----FLGLLGKRVDAIEYYNEKIKEIIPK---LEAEQKIT-LKEKQLGAALVFFTSRVAAASAAQSLH  198 (590)
Q Consensus       128 ~~~~rP~~~~-~----~~~~~g~kvd~i~~~~~~l~~l~~~---I~~~~~~~-~~~~~~~~AFVtF~s~~~a~~a~q~~~  198 (590)
                      .....|..+. +    +.+-..+.+|.     +.|.++-.+   |...+-.. ...+..|.|||.|.+.++|..|.+.+.
T Consensus        76 ~s~~~~~~~~~~~~~vfV~nLp~~~~~-----~~L~~~F~~~G~i~~~~i~~~~~g~skg~afV~F~~~e~A~~Ai~~ln  150 (562)
T TIGR01628        76 WSQRDPSLRRSGVGNIFVKNLDKSVDN-----KALFDTFSKFGNILSCKVATDENGKSRGYGFVHFEKEESAKAAIQKVN  150 (562)
T ss_pred             cccccccccccCCCceEEcCCCccCCH-----HHHHHHHHhcCCcceeEeeecCCCCcccEEEEEECCHHHHHHHHHHhc
Confidence            0001111111 1    11111122221     222222222   11110000 122457899999999999999998764


Q ss_pred             cCC--CCceeee-----------eCCCCCCeeeCCcCcchHHHHHHHHHH
Q 007784          199 AQL--VDTWTVS-----------DAPESRELIWNNLNIKFFQRQIRQYVV  235 (590)
Q Consensus       199 ~~~--~~~~~v~-----------~AP~P~DI~W~NL~~~~~~r~~R~~~~  235 (590)
                      ...  ...+.+.           ..+..+.|.-.||..+..+..++.++.
T Consensus       151 g~~~~~~~i~v~~~~~~~~~~~~~~~~~~~l~V~nl~~~~tee~L~~~F~  200 (562)
T TIGR01628       151 GMLLNDKEVYVGRFIKKHEREAAPLKKFTNLYVKNLDPSVNEDKLRELFA  200 (562)
T ss_pred             ccEecCceEEEeccccccccccccccCCCeEEEeCCCCcCCHHHHHHHHH
Confidence            321  1112211           223345578888888777776776554


No 10 
>PLN03134 glycine-rich RNA-binding protein 4; Provisional
Probab=95.71  E-value=0.093  Score=47.96  Aligned_cols=37  Identities=8%  Similarity=0.115  Sum_probs=30.1

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      ...+|.|.|||.+.+    +++|+++|+++  |.|.++.++.|
T Consensus        33 ~~~~lfVgnL~~~~t----e~~L~~~F~~~--G~I~~v~i~~d   69 (144)
T PLN03134         33 MSTKLFIGGLSWGTD----DASLRDAFAHF--GDVVDAKVIVD   69 (144)
T ss_pred             CCCEEEEeCCCCCCC----HHHHHHHHhcC--CCeEEEEEEec
Confidence            355899999999886    79999999986  67888876553


No 11 
>TIGR01661 ELAV_HUD_SF ELAV/HuD family splicing factor. These proteins contain 3 RNA-recognition motifs (rrm: pfam00076).
Probab=95.54  E-value=0.044  Score=57.68  Aligned_cols=37  Identities=22%  Similarity=0.381  Sum_probs=32.5

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      .-+|+|.|||.+++    +++|+++|+++  |.|.+|.+++|-
T Consensus         3 ~~~l~V~nLp~~~~----e~~l~~~F~~~--G~i~~v~i~~d~   39 (352)
T TIGR01661         3 KTNLIVNYLPQTMT----QEEIRSLFTSI--GEIESCKLVRDK   39 (352)
T ss_pred             CcEEEEeCCCCCCC----HHHHHHHHHcc--CCEEEEEEEEcC
Confidence            35899999999887    79999999997  689999999874


No 12 
>TIGR01648 hnRNP-R-Q heterogeneous nuclear ribonucleoprotein R, Q family. Sequences in this subfamily include the human heterogeneous nuclear ribonucleoproteins (hnRNP) R, Q and APOBEC-1 complementation factor (aka APOBEC-1 stimulating protein). These proteins contain three RNA recognition domains (rrm: pfam00076) and a somewhat variable C-terminal domain.
Probab=95.48  E-value=0.051  Score=60.59  Aligned_cols=38  Identities=13%  Similarity=0.257  Sum_probs=33.2

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      +..+|.|.|||.++.    +++|++.|+++  |.|.++.+.+|.
T Consensus        57 ~~~~lFVgnLp~~~t----Ed~L~~~F~~~--G~I~~vrl~~D~   94 (578)
T TIGR01648        57 RGCEVFVGKIPRDLY----EDELVPLFEKA--GPIYELRLMMDF   94 (578)
T ss_pred             CCCEEEeCCCCCCCC----HHHHHHHHHhh--CCEEEEEEEECC
Confidence            457999999999886    79999999997  679999998884


No 13 
>TIGR01628 PABP-1234 polyadenylate binding protein, human types 1, 2, 3, 4 family. There are four paralogs in Homo sapiens which are expressed in testis, platelets, broadly expressed, or of unknown tissue range.
Probab=93.67  E-value=0.59  Score=52.67  Aligned_cols=37  Identities=11%  Similarity=0.234  Sum_probs=30.5

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ..+|.|+|+|.+.+    +++|+++|+++  |.|.++.+..|.
T Consensus       178 ~~~l~V~nl~~~~t----ee~L~~~F~~f--G~i~~~~i~~~~  214 (562)
T TIGR01628       178 FTNLYVKNLDPSVN----EDKLRELFAKF--GEITSAAVMKDG  214 (562)
T ss_pred             CCeEEEeCCCCcCC----HHHHHHHHHhc--CCEEEEEEEECC
Confidence            45799999999886    79999999987  678888877653


No 14 
>TIGR01661 ELAV_HUD_SF ELAV/HuD family splicing factor. These proteins contain 3 RNA-recognition motifs (rrm: pfam00076).
Probab=93.50  E-value=0.25  Score=52.01  Aligned_cols=36  Identities=8%  Similarity=0.211  Sum_probs=29.9

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .++|.|.|||.+..    +++|+++|+.+  |.|.++.+++|
T Consensus       269 ~~~lfV~NL~~~~~----e~~L~~~F~~f--G~v~~v~i~~d  304 (352)
T TIGR01661       269 GYCIFVYNLSPDTD----ETVLWQLFGPF--GAVQNVKIIRD  304 (352)
T ss_pred             CcEEEEeCCCCCCC----HHHHHHHHHhC--CCeEEEEEeEc
Confidence            35799999998765    79999999987  67888887764


No 15 
>TIGR01648 hnRNP-R-Q heterogeneous nuclear ribonucleoprotein R, Q family. Sequences in this subfamily include the human heterogeneous nuclear ribonucleoproteins (hnRNP) R, Q and APOBEC-1 complementation factor (aka APOBEC-1 stimulating protein). These proteins contain three RNA recognition domains (rrm: pfam00076) and a somewhat variable C-terminal domain.
Probab=93.45  E-value=0.4  Score=53.60  Aligned_cols=39  Identities=23%  Similarity=0.150  Sum_probs=29.9

Q ss_pred             ccceEEEEecCHHHHHHHHHhcccC--CCCceeeeeCCCCC
Q 007784          176 QLGAALVFFTSRVAAASAAQSLHAQ--LVDTWTVSDAPESR  214 (590)
Q Consensus       176 ~~~~AFVtF~s~~~a~~a~q~~~~~--~~~~~~v~~AP~P~  214 (590)
                      ..+.|||+|++.++|..|.+.+...  ....++|..|..|+
T Consensus       268 ~rgfAFVeF~s~e~A~kAi~~lnG~~i~Gr~I~V~~Akp~~  308 (578)
T TIGR01648       268 IRDYAFVHFEDREDAVKAMDELNGKELEGSEIEVTLAKPVD  308 (578)
T ss_pred             ecCeEEEEeCCHHHHHHHHHHhCCCEECCEEEEEEEccCCC
Confidence            4679999999999999999877654  33457777776553


No 16 
>KOG0149 consensus Predicted RNA-binding protein SEB4 (RRM superfamily) [General function prediction only]
Probab=93.34  E-value=0.24  Score=48.01  Aligned_cols=33  Identities=24%  Similarity=0.442  Sum_probs=26.8

Q ss_pred             EEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           56 VLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        56 VlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      |.|-|+|-+..    ++.|++||+++  |+|++..++-|
T Consensus        15 ifVggL~w~T~----~~~l~~yFeqf--GeI~eavvitd   47 (247)
T KOG0149|consen   15 IFVGGLAWETH----KETLRRYFEQF--GEIVEAVVITD   47 (247)
T ss_pred             EEEcCcccccc----hHHHHHHHHHh--CceEEEEEEec
Confidence            89999998876    69999999998  67776665543


No 17 
>KOG4211 consensus Splicing factor hnRNP-F and related RNA-binding proteins [RNA processing and modification]
Probab=91.91  E-value=0.28  Score=52.28  Aligned_cols=37  Identities=16%  Similarity=0.263  Sum_probs=29.7

Q ss_pred             CcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           51 PQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        51 ~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .+.+-|.++++|-+.+    .++|.+||+..   .|+++.+.++
T Consensus         8 ~~~~~vr~rGLPwsat----~~ei~~Ff~~~---~I~~~~~~r~   44 (510)
T KOG4211|consen    8 STAFEVRLRGLPWSAT----EKEILDFFSNC---GIENLEIPRR   44 (510)
T ss_pred             CcceEEEecCCCcccc----HHHHHHHHhcC---ceeEEEEecc
Confidence            3568899999999886    69999999875   5777766665


No 18 
>TIGR01622 SF-CC1 splicing factor, CC1-like family. A homologous gene from Plasmodium falciparum was identified in the course of the analysis of that genome at TIGR and was included in the model.
Probab=91.53  E-value=0.52  Score=51.55  Aligned_cols=38  Identities=11%  Similarity=0.233  Sum_probs=32.6

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ..+||.|.|||.+..    +++|+++|+++  |.|.+|.++.|.
T Consensus        88 ~~~~l~V~nlp~~~~----~~~l~~~F~~~--G~v~~v~i~~d~  125 (457)
T TIGR01622        88 DDRTVFVLQLALKAR----ERDLYEFFSKV--GKVRDVQCIKDR  125 (457)
T ss_pred             CCcEEEEeCCCCCCC----HHHHHHHHHhc--CCeeEEEEeecC
Confidence            367999999999886    68999999997  689999998763


No 19 
>KOG0117 consensus Heterogeneous nuclear ribonucleoprotein R (RRM superfamily) [RNA processing and modification]
Probab=91.50  E-value=1.1  Score=47.21  Aligned_cols=125  Identities=24%  Similarity=0.282  Sum_probs=69.4

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc-chhHH--------HHHHHHHHHHHHHHHHHHHHhhc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN-NKEAN--------KIYEELEGYKKKLARAEAVYAES  122 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d-~~~l~--------~L~~~r~~~~~~Le~~~~~~~~~  122 (590)
                      .-.-|.|-+||.|+.    +++|.-.|++.  |++-++.+-.| .+.-.        .--++-+++.+.|...+      
T Consensus        82 ~G~EVfvGkIPrD~~----EdeLvplfEki--G~I~elRLMmD~~sG~nRGYAFVtf~~Ke~Aq~Aik~lnn~E------  149 (506)
T KOG0117|consen   82 RGCEVFVGKIPRDVF----EDELVPLFEKI--GKIYELRLMMDPFSGDNRGYAFVTFCTKEEAQEAIKELNNYE------  149 (506)
T ss_pred             CCceEEecCCCcccc----chhhHHHHHhc--cceeeEEEeecccCCCCcceEEEEeecHHHHHHHHHHhhCcc------
Confidence            345799999999987    68999999997  66766666665 11000        00112223333333221      


Q ss_pred             ccCCCCCCCCCccccccc------CC-CC--ccccHHHHHHHHHHHHHHHHHHHHhh----------hhhccccceEEEE
Q 007784          123 KSAGKPEGTRPTIKTGFL------GL-LG--KRVDAIEYYNEKIKEIIPKLEAEQKI----------TLKEKQLGAALVF  183 (590)
Q Consensus       123 k~~~~~~~~rP~~~~~~~------~~-~g--~kvd~i~~~~~~l~~l~~~I~~~~~~----------~~~~~~~~~AFVt  183 (590)
                              .||....|+|      .+ .|  .|..    .+   +++.+++++.-+-          ..+.+..|-|||.
T Consensus       150 --------ir~GK~igvc~Svan~RLFiG~IPK~k----~k---eeIlee~~kVteGVvdVivy~~p~dk~KNRGFaFve  214 (506)
T KOG0117|consen  150 --------IRPGKLLGVCVSVANCRLFIGNIPKTK----KK---EEILEEMKKVTEGVVDVIVYPSPDDKTKNRGFAFVE  214 (506)
T ss_pred             --------ccCCCEeEEEEeeecceeEeccCCccc----cH---HHHHHHHHhhCCCeeEEEEecCccccccccceEEEE
Confidence                    2343334432      12 12  2221    11   2222223221110          0234679999999


Q ss_pred             ecCHHHHHHHHHhcccCCCC
Q 007784          184 FTSRVAAASAAQSLHAQLVD  203 (590)
Q Consensus       184 F~s~~~a~~a~q~~~~~~~~  203 (590)
                      +.|-.+|.++.|.+.+.+-.
T Consensus       215 Ye~H~~Aa~aRrKl~~g~~k  234 (506)
T KOG0117|consen  215 YESHRAAAMARRKLMPGKIK  234 (506)
T ss_pred             eecchhHHHHHhhccCCcee
Confidence            99999999999988766543


No 20 
>TIGR01645 half-pint poly-U binding splicing factor, half-pint family. In the case of PUF60 (GP|6176532), in complex with p54, and in the presence of U2AF, facilitates association of U2 snRNP with pre-mRNA.
Probab=91.45  E-value=0.48  Score=53.21  Aligned_cols=38  Identities=8%  Similarity=0.044  Sum_probs=32.6

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ..++|.|.|||.+.+    +++|+++|+++  |.|.+|.+.+|-
T Consensus       106 ~~~rLfVGnLp~~~t----Ee~Lr~lF~~f--G~I~sV~I~~D~  143 (612)
T TIGR01645       106 IMCRVYVGSISFELR----EDTIRRAFDPF--GPIKSINMSWDP  143 (612)
T ss_pred             CCCEEEEcCCCCCCC----HHHHHHHHHcc--CCEEEEEEeecC
Confidence            457999999999886    79999999997  679999998874


No 21 
>KOG0148 consensus Apoptosis-promoting RNA-binding protein TIA-1/TIAR (RRM superfamily) [RNA processing and modification; Translation, ribosomal structure and biogenesis]
Probab=90.84  E-value=0.48  Score=46.76  Aligned_cols=150  Identities=19%  Similarity=0.294  Sum_probs=83.0

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhHHHHHHHHHHHHHHHHHHHHHHhhcccCCCC-CCC
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEANKIYEELEGYKKKLARAEAVYAESKSAGKP-EGT  131 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l~~L~~~r~~~~~~Le~~~~~~~~~k~~~~~-~~~  131 (590)
                      -+|+.|-|+..+.+    ++-|...|+++  |.|.++.+++|                ++.-..+        ..| ...
T Consensus         6 prtlyvgnld~~vt----e~~i~~lf~qi--g~v~~~k~i~~----------------e~~v~wa--------~~p~nQs   55 (321)
T KOG0148|consen    6 PRTLYVGNLDSTVT----EDFIATLFNQI--GSVTKTKVIFD----------------ELKVNWA--------TAPGNQS   55 (321)
T ss_pred             CceEEeeccChhhH----HHHHHHHHHhc--cccccceeehh----------------hhccccc--------cCcccCC
Confidence            38999999998876    67788889887  67888888887                1111100        011 122


Q ss_pred             CCcccccccCCCCccccHHHHHHHHHHHHHH---HHHHHH--hhhhhccccceEEEEecCHHHHHHHHHhccc-------
Q 007784          132 RPTIKTGFLGLLGKRVDAIEYYNEKIKEIIP---KLEAEQ--KITLKEKQLGAALVFFTSRVAAASAAQSLHA-------  199 (590)
Q Consensus       132 rP~~~~~~~~~~g~kvd~i~~~~~~l~~l~~---~I~~~~--~~~~~~~~~~~AFVtF~s~~~a~~a~q~~~~-------  199 (590)
                      +|+.+.++--..|.-+..|++  ++|++.-.   +|.+.+  ++....|.-|++||+|-+.++|..|.|....       
T Consensus        56 k~t~~~hfhvfvgdls~eI~~--e~lr~aF~pFGevS~akvirD~~T~KsKGYgFVSf~~k~dAEnAI~~MnGqWlG~R~  133 (321)
T KOG0148|consen   56 KPTSNQHFHVFVGDLSPEIDN--EKLREAFAPFGEVSDAKVIRDMNTGKSKGYGFVSFPNKEDAENAIQQMNGQWLGRRT  133 (321)
T ss_pred             CCccccceeEEehhcchhcch--HHHHHHhccccccccceEeecccCCcccceeEEeccchHHHHHHHHHhCCeeeccce
Confidence            444443321123433333432  33333322   222222  1122346789999999999999999876421       


Q ss_pred             -------CCCC-------ce---eeeeCCCCCCeeeCCcCcchHHHHHHHHH
Q 007784          200 -------QLVD-------TW---TVSDAPESRELIWNNLNIKFFQRQIRQYV  234 (590)
Q Consensus       200 -------~~~~-------~~---~v~~AP~P~DI~W~NL~~~~~~r~~R~~~  234 (590)
                             ++|.       .+   .-..+|.-..|.-.|+.-...+..+|+.+
T Consensus       134 IRTNWATRKp~e~n~~~ltfdeV~NQssp~NtsVY~G~I~~~lte~~mr~~F  185 (321)
T KOG0148|consen  134 IRTNWATRKPSEMNGKPLTFDEVYNQSSPDNTSVYVGNIASGLTEDLMRQTF  185 (321)
T ss_pred             eeccccccCccccCCCCccHHHHhccCCCCCceEEeCCcCccccHHHHHHhc
Confidence                   1221       11   11345555666666666555555555543


No 22 
>PLN03121 nucleic acid binding protein; Provisional
Probab=90.37  E-value=0.45  Score=46.70  Aligned_cols=37  Identities=11%  Similarity=0.241  Sum_probs=32.2

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .-|||.|+||+.+.+    +++|++||+..  |+|.+|.+.+|
T Consensus         4 ~g~TV~V~NLS~~tT----E~dLrefFS~~--G~I~~V~I~~D   40 (243)
T PLN03121          4 GGYTAEVTNLSPKAT----EKDVYDFFSHC--GAIEHVEIIRS   40 (243)
T ss_pred             CceEEEEecCCCCCC----HHHHHHHHHhc--CCeEEEEEecC
Confidence            349999999999886    79999999986  88999988754


No 23 
>TIGR01642 U2AF_lg U2 snRNP auxilliary factor, large subunit, splicing factor. Members of this subfamily are found in plants, metazoa and fungi.
Probab=90.01  E-value=1.2  Score=49.30  Aligned_cols=36  Identities=8%  Similarity=0.236  Sum_probs=30.4

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      ..+|.|.|||.++.    +++|+++|+++  |.|..+.++.|
T Consensus       295 ~~~l~v~nlp~~~~----~~~l~~~f~~~--G~i~~~~~~~~  330 (509)
T TIGR01642       295 KDRIYIGNLPLYLG----EDQIKELLESF--GDLKAFNLIKD  330 (509)
T ss_pred             CCEEEEeCCCCCCC----HHHHHHHHHhc--CCeeEEEEEec
Confidence            47899999999876    79999999997  56888877765


No 24 
>PF00076 RRM_1:  RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain);  InterPro: IPR000504 Many eukaryotic proteins containing one or more copies of a putative RNA-binding domain of about 90 amino acids are known to bind single-stranded RNAs [, , ]. The largest group of single strand RNA-binding proteins is the eukaryotic RNA recognition motif (RRM) family that contains an eight amino acid RNP-1 consensus sequence [, ]. RRM proteins have a variety of RNA binding preferences and functions, and include heterogeneous nuclear ribonucleoproteins (hnRNPs), proteins implicated in regulation of alternative splicing (SR, U2AF, Sxl), protein components of small nuclear ribonucleoproteins (U1 and U2 snRNPs), and proteins that regulate RNA stability and translation (PABP, La, Hu) [, , ]. The RRM in heterodimeric splicing factor U2 snRNP auxiliary factor (U2AF) appears to have two RRM-like domains with specialised features for protein recognition []. The motif also appears in a few single stranded DNA binding proteins. The typical RRM consists of four anti-parallel beta-strands and two alpha-helices arranged in a beta-alpha-beta-beta-alpha-beta fold with side chains that stack with RNA bases. Specificity of RNA binding is determined by multiple contacts with surrounding amino acids. A third helix is present during RNA binding in some cases []. The RRM is reviewed in a number of publications [, , ].; GO: 0003676 nucleic acid binding; PDB: 2RNE_A 2DGO_A 2DO4_A 1YTY_B 2VOO_B 2VOP_A 2VON_B 1ZH5_B 2VOD_A 1S79_A ....
Probab=89.64  E-value=0.51  Score=36.34  Aligned_cols=33  Identities=21%  Similarity=0.373  Sum_probs=27.8

Q ss_pred             EEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           56 VLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        56 VlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      |.|.|||.+..    +++|+++|+++  |.+..+.+..|
T Consensus         1 l~v~nlp~~~t----~~~l~~~f~~~--g~i~~~~~~~~   33 (70)
T PF00076_consen    1 LYVGNLPPDVT----EEELRDFFSQF--GKIESIKVMRN   33 (70)
T ss_dssp             EEEESETTTSS----HHHHHHHHHTT--STEEEEEEEEE
T ss_pred             cEEcCCCCcCC----HHHHHHHHHHh--hhccccccccc
Confidence            68999999887    79999999996  66787877765


No 25 
>TIGR01622 SF-CC1 splicing factor, CC1-like family. A homologous gene from Plasmodium falciparum was identified in the course of the analysis of that genome at TIGR and was included in the model.
Probab=89.05  E-value=1.5  Score=48.04  Aligned_cols=39  Identities=10%  Similarity=0.162  Sum_probs=32.2

Q ss_pred             CcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           51 PQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        51 ~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      +...||.|.|||.+++    +++|+++|+.+  |.|.+|.+.+|.
T Consensus       184 p~~~~l~v~nl~~~~t----e~~l~~~f~~~--G~i~~v~~~~d~  222 (457)
T TIGR01622       184 PNFLKLYVGNLHFNIT----EQELRQIFEPF--GDIEDVQLHRDP  222 (457)
T ss_pred             CCCCEEEEcCCCCCCC----HHHHHHHHHhc--CCeEEEEEEEcC
Confidence            4468999999999876    79999999987  678888887654


No 26 
>PF04059 RRM_2:  RNA recognition motif 2;  InterPro: IPR007201 This RNA recognition motif 2 is found in Meiosis protein mei2. It is found C-terminal to the RNA-binding region RNP-1 (IPR000504 from INTERPRO).
Probab=88.97  E-value=0.71  Score=39.01  Aligned_cols=38  Identities=11%  Similarity=0.206  Sum_probs=29.5

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      -|||++|||...+    .+.|.+.+++.++|++.=+.+..|.
T Consensus         2 TTvMirNIPn~~t----~~~L~~~l~~~~~g~yDF~YLPiDf   39 (97)
T PF04059_consen    2 TTVMIRNIPNKYT----QEMLIQILDEHFKGKYDFFYLPIDF   39 (97)
T ss_pred             eeEEEecCCCCCC----HHHHHHHHHHhccCcceEEEeeeec
Confidence            3999999999887    6888888888887876655555553


No 27 
>PLN03120 nucleic acid binding protein; Provisional
Probab=88.06  E-value=0.77  Score=45.76  Aligned_cols=35  Identities=9%  Similarity=0.085  Sum_probs=30.5

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEec
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVT   93 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~   93 (590)
                      .+||.|.|||.+.+    +++|++||+.+  |+|.+|.+..
T Consensus         4 ~rtVfVgNLs~~tT----E~dLrefFS~~--G~I~~V~I~~   38 (260)
T PLN03120          4 VRTVKVSNVSLKAT----ERDIKEFFSFS--GDIEYVEMQS   38 (260)
T ss_pred             CCEEEEeCCCCCCC----HHHHHHHHHhc--CCeEEEEEee
Confidence            47999999999876    79999999987  7899998764


No 28 
>KOG2514 consensus Uncharacterized conserved protein [Function unknown]
Probab=87.71  E-value=4.8  Score=46.11  Aligned_cols=53  Identities=17%  Similarity=0.223  Sum_probs=43.2

Q ss_pred             HhHhHHHHHHHHHHHHHHHHHHHHhccCCCchhHHHHHHHHHHHHHHHHHHHH
Q 007784          283 EAYLPQIALIVFLALLPKLLLFLSKTEGIPAVSHAVRAASGKYFYFTVLNVFI  335 (590)
Q Consensus       283 ~~~lp~l~l~i~n~llp~ii~~ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~l  335 (590)
                      +..+-.+++.++|.+---+..++...|.+.|.|+.|.|+.-|.|+||++|.-.
T Consensus       436 a~~in~~~i~~L~~iy~~~a~~lt~~e~prTe~~~ensl~~KiflfqfvN~ys  488 (861)
T KOG2514|consen  436 AVIINLVVIMILNAIYSNLASRLTNLENPRTESEFENSLILKIFLFQFVNYYS  488 (861)
T ss_pred             HHHHHHHHHHHHHHHhhhHHHHHhhhcCccchhhhcchhHHHHHHHHHHHhcC
Confidence            33344455566677777778899999999999999999999999999999754


No 29 
>smart00362 RRM_2 RNA recognition motif.
Probab=87.54  E-value=0.98  Score=34.24  Aligned_cols=34  Identities=15%  Similarity=0.292  Sum_probs=27.3

Q ss_pred             EEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           55 AVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        55 TVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      ||.|+|+|.+..    +++|+++|+++  |.+.++.+..+
T Consensus         1 ~v~i~~l~~~~~----~~~l~~~~~~~--g~v~~~~~~~~   34 (72)
T smart00362        1 TLFVGNLPPDVT----EEDLKELFSKF--GPIESVKIPKD   34 (72)
T ss_pred             CEEEcCCCCcCC----HHHHHHHHHhc--CCEEEEEEecC
Confidence            689999999876    68999999987  56777766654


No 30 
>KOG0145 consensus RNA-binding protein ELAV/HU (RRM superfamily) [RNA processing and modification]
Probab=87.11  E-value=5.9  Score=39.02  Aligned_cols=145  Identities=19%  Similarity=0.226  Sum_probs=80.0

Q ss_pred             EEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhHHHH-------H--HHHHHHHHHHHHHHHHHhhcccC
Q 007784           55 AVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEANKI-------Y--EELEGYKKKLARAEAVYAESKSA  125 (590)
Q Consensus        55 TVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l~~L-------~--~~r~~~~~~Le~~~~~~~~~k~~  125 (590)
                      -+.|.-+|.+++    +++++..|.+.  |+++++.+++|--.=+.|       .  ++.+++...|.....+   +|+ 
T Consensus        43 NLIvNYLPQ~MT----qdE~rSLF~Si--GeiEScKLvRDKitGqSLGYGFVNYv~p~DAe~AintlNGLrLQ---~KT-  112 (360)
T KOG0145|consen   43 NLIVNYLPQNMT----QDELRSLFGSI--GEIESCKLVRDKITGQSLGYGFVNYVRPKDAEKAINTLNGLRLQ---NKT-  112 (360)
T ss_pred             eeeeeecccccC----HHHHHHHhhcc--cceeeeeeeeccccccccccceeeecChHHHHHHHhhhcceeec---cce-
Confidence            366788999987    68999999887  789999999985221111       1  2333344433332211   110 


Q ss_pred             CCCCCCCCccc---ccccCCCC-ccccHHHHHHHHHHHHHHHHHHH-Hhhhhh----ccccceEEEEecCHHHHHHHHHh
Q 007784          126 GKPEGTRPTIK---TGFLGLLG-KRVDAIEYYNEKIKEIIPKLEAE-QKITLK----EKQLGAALVFFTSRVAAASAAQS  196 (590)
Q Consensus       126 ~~~~~~rP~~~---~~~~~~~g-~kvd~i~~~~~~l~~l~~~I~~~-~~~~~~----~~~~~~AFVtF~s~~~a~~a~q~  196 (590)
                      -+-+=.||...   ..-+-..| +|.    -.++|++.+-.+.-+. -.+++.    .-..|.+||-|+....|..|...
T Consensus       113 IKVSyARPSs~~Ik~aNLYvSGlPkt----MtqkelE~iFs~fGrIItSRiL~dqvtg~srGVgFiRFDKr~EAe~AIk~  188 (360)
T KOG0145|consen  113 IKVSYARPSSDSIKDANLYVSGLPKT----MTQKELEQIFSPFGRIITSRILVDQVTGLSRGVGFIRFDKRIEAEEAIKG  188 (360)
T ss_pred             EEEEeccCChhhhcccceEEecCCcc----chHHHHHHHHHHhhhhhhhhhhhhcccceecceeEEEecchhHHHHHHHh
Confidence            01111244321   10000112 121    1245555555433321 122222    34579999999999999999999


Q ss_pred             cccCCCCc----eeeeeCCCC
Q 007784          197 LHAQLVDT----WTVSDAPES  213 (590)
Q Consensus       197 ~~~~~~~~----~~v~~AP~P  213 (590)
                      +...+|..    ..|+-|-.|
T Consensus       189 lNG~~P~g~tepItVKFannP  209 (360)
T KOG0145|consen  189 LNGQKPSGCTEPITVKFANNP  209 (360)
T ss_pred             ccCCCCCCCCCCeEEEecCCc
Confidence            88777753    345555555


No 31 
>PF14259 RRM_6:  RNA recognition motif (a.k.a. RRM, RBD, or RNP domain); PDB: 2DNN_A 1WI6_A 2EVZ_A 2ADC_A 1QM9_A 2KG1_A 2HGN_A 1U2F_A 2G4B_A 2HZC_A ....
Probab=86.33  E-value=1  Score=35.01  Aligned_cols=32  Identities=16%  Similarity=0.426  Sum_probs=25.3

Q ss_pred             EEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEec
Q 007784           56 VLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVT   93 (590)
Q Consensus        56 VlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~   93 (590)
                      |+|+|||.+..    +++|.++|+.+  |.|.++.+..
T Consensus         1 v~i~nlp~~~~----~~~l~~~f~~~--g~v~~v~~~~   32 (70)
T PF14259_consen    1 VYISNLPPSTT----EEDLRNFFSRF--GPVEKVRLIK   32 (70)
T ss_dssp             EEEESSTTT------HHHHHHHCTTS--SBEEEEEEEE
T ss_pred             CEEeCCCCCCC----HHHHHHHHHhc--CCcceEEEEe
Confidence            68999999875    79999999987  5688887763


No 32 
>PF13893 RRM_5:  RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain); PDB: 2PE8_A 2PEH_A 2D9O_A 1A9N_D 2DIT_A 3S6E_A 2LQ5_A 1SJQ_A 2AD9_A 1X4D_A ....
Probab=84.18  E-value=1.6  Score=32.37  Aligned_cols=24  Identities=33%  Similarity=0.343  Sum_probs=21.2

Q ss_pred             cceEEEEecCHHHHHHHHHhcccC
Q 007784          177 LGAALVFFTSRVAAASAAQSLHAQ  200 (590)
Q Consensus       177 ~~~AFVtF~s~~~a~~a~q~~~~~  200 (590)
                      .+.|||+|.+.++|..|.+.++..
T Consensus        21 ~~~a~V~f~~~~~A~~a~~~l~~~   44 (56)
T PF13893_consen   21 RGFAFVEFASVEDAQKAIEQLNGR   44 (56)
T ss_dssp             TTEEEEEESSHHHHHHHHHHHTTS
T ss_pred             CCEEEEEECCHHHHHHHHHHhCCC
Confidence            599999999999999999987654


No 33 
>PF07810 TMC:  TMC domain;  InterPro: IPR012496 These sequences are similar to a region conserved amongst various protein products of the transmembrane channel-like (TMC) gene family, such as Transmembrane channel-like protein 3 (Q7TN63 from SWISSPROT) and EVIN2 (Q8IU68 from SWISSPROT) - this region is termed the TMC domain []. Mutations in these genes are implicated in a number of human conditions, such as deafness and epidermodysplasia verruciformis []. TMC proteins are thought to have important cellular roles, and may be modifiers of ion channels or transporters []. ; GO: 0016021 integral to membrane
Probab=82.81  E-value=11  Score=32.82  Aligned_cols=54  Identities=13%  Similarity=0.093  Sum_probs=42.2

Q ss_pred             cCCCCCCCccc-----chhHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCC
Q 007784          415 WFPGDLGYGTR-----VPSDMLIVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAY  473 (590)
Q Consensus       415 ~~~~~f~~~~~-----y~~~l~~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~  473 (590)
                      ...++|+.+..     |++  .+..+|++|||..|+   ++.+-+++.+++.|+.+++.++|+.
T Consensus        47 ~g~~eF~i~~nvL~liY~Q--tl~WiG~ffsPlLP~---i~~ik~~i~FYvKk~sll~~c~p~~  105 (111)
T PF07810_consen   47 PGKPEFDIPKNVLDLIYNQ--TLVWIGMFFSPLLPA---INVIKLFILFYVKKFSLLYNCQPPQ  105 (111)
T ss_pred             CCCCCccHhhhHHHHHHcc--hhhhhhHHhchhHHH---HHHHHHHHHHHHHHHHHHHhcCCCC
Confidence            45678887765     444  367889999888777   5677788899999999999998764


No 34 
>KOG0109 consensus RNA-binding protein LARK, contains RRM and retroviral-type Zn-finger domains [RNA processing and modification; General function prediction only]
Probab=82.56  E-value=1.4  Score=44.05  Aligned_cols=37  Identities=16%  Similarity=0.312  Sum_probs=31.5

Q ss_pred             EEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhH
Q 007784           56 VLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEA   98 (590)
Q Consensus        56 VlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l   98 (590)
                      +.|-|+|.+..    +++|+..|+++  |+|.++-|+.|+.=+
T Consensus         5 LFIGNLp~~~~----~~elr~lFe~y--gkVlECDIvKNYgFV   41 (346)
T KOG0109|consen    5 LFIGNLPREAT----EQELRSLFEQY--GKVLECDIVKNYGFV   41 (346)
T ss_pred             hhccCCCcccc----hHHHHHHHHhh--CceEeeeeecccceE
Confidence            56889998876    69999999998  899999999887643


No 35 
>KOG1548 consensus Transcription elongation factor TAT-SF1 [Transcription]
Probab=81.58  E-value=6.2  Score=40.58  Aligned_cols=44  Identities=16%  Similarity=0.195  Sum_probs=35.0

Q ss_pred             HHHHHHHHHHHHhhhh--------hccccceEEEEecCHHHHHHHHHhcccC
Q 007784          157 IKEIIPKLEAEQKITL--------KEKQLGAALVFFTSRVAAASAAQSLHAQ  200 (590)
Q Consensus       157 l~~l~~~I~~~~~~~~--------~~~~~~~AFVtF~s~~~a~~a~q~~~~~  200 (590)
                      +.++++.+.++..+..        ...+-|.|=|+|++...|..|.|.++.+
T Consensus       286 ~~dlkedl~eec~K~G~v~~vvv~d~hPdGvvtV~f~n~eeA~~ciq~m~GR  337 (382)
T KOG1548|consen  286 LNDLKEDLTEECEKFGQVRKVVVYDRHPDGVVTVSFRNNEEADQCIQTMDGR  337 (382)
T ss_pred             HHHHHHHHHHHHHHhCCcceEEEeccCCCceeEEEeCChHHHHHHHHHhcCe
Confidence            6777777777766552        3467899999999999999999998754


No 36 
>cd00590 RRM RRM (RNA recognition motif), also known as RBD (RNA binding domain) or RNP (ribonucleoprotein domain), is a highly abundant domain in eukaryotes found in proteins involved in post-transcriptional gene expression processes including mRNA and rRNA processing, RNA export, and RNA stability. This domain is 90 amino acids in length and consists of a four-stranded beta-sheet packed against two alpha-helices.  RRM usually interacts with ssRNA, but is also known to interact with ssDNA as well as proteins. RRM binds a variable number of nucleotides, ranging from two to eight.  The active site includes three aromatic side-chains located within the conserved RNP1 and RNP2 motifs of the domain. The RRM domain is found in a variety heterogeneous nuclear ribonucleoproteins (hnRNPs), proteins implicated in regulation of alternative splicing, and protein components of small nuclear ribonucleoproteins (snRNPs).
Probab=81.33  E-value=2.7  Score=31.87  Aligned_cols=34  Identities=18%  Similarity=0.320  Sum_probs=27.2

Q ss_pred             EEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           55 AVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        55 TVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      +|.|+|+|.+..    +++++++|+++  |.+.++.+..+
T Consensus         1 ~i~i~~l~~~~~----~~~i~~~~~~~--g~i~~~~~~~~   34 (74)
T cd00590           1 TLFVGNLPPDVT----EEDLRELFSKF--GKVESVRIVRD   34 (74)
T ss_pred             CEEEeCCCCccC----HHHHHHHHHhc--CCEEEEEEeeC
Confidence            588999999875    79999999997  66777766553


No 37 
>KOG1365 consensus RNA-binding protein Fusilli, contains RRM domain [RNA processing and modification; General function prediction only]
Probab=78.19  E-value=17  Score=37.86  Aligned_cols=27  Identities=26%  Similarity=0.327  Sum_probs=23.1

Q ss_pred             hccccceEEEEecCHHHHHHHHHhccc
Q 007784          173 KEKQLGAALVFFTSRVAAASAAQSLHA  199 (590)
Q Consensus       173 ~~~~~~~AFVtF~s~~~a~~a~q~~~~  199 (590)
                      +..++|-|||.|++.++|..|+|..|.
T Consensus       320 qGrPSGeAFIqm~nae~a~aaaqk~hk  346 (508)
T KOG1365|consen  320 QGRPSGEAFIQMRNAERARAAAQKCHK  346 (508)
T ss_pred             CCCcChhhhhhhhhhHHHHHHHHHHHH
Confidence            346799999999999999999987654


No 38 
>KOG4206 consensus Spliceosomal protein snRNP-U1A/U2B [RNA processing and modification]
Probab=76.24  E-value=2.6  Score=40.81  Aligned_cols=45  Identities=24%  Similarity=0.273  Sum_probs=33.2

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccCC--CCceeeeeCCCCCCeeeC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQL--VDTWTVSDAPESRELIWN  219 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~~--~~~~~v~~AP~P~DI~W~  219 (590)
                      +-.|.|||+|++..+|..|...++.-.  ...++++.|-+++||+=.
T Consensus        50 KmRGQA~VvFk~~~~As~A~r~l~gfpFygK~mriqyA~s~sdii~~   96 (221)
T KOG4206|consen   50 KMRGQAFVVFKETEAASAALRALQGFPFYGKPMRIQYAKSDSDIIAQ   96 (221)
T ss_pred             CccCceEEEecChhHHHHHHHHhcCCcccCchhheecccCccchhhc
Confidence            458999999999999888877654321  224567788888888755


No 39 
>PF00076 RRM_1:  RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain);  InterPro: IPR000504 Many eukaryotic proteins containing one or more copies of a putative RNA-binding domain of about 90 amino acids are known to bind single-stranded RNAs [, , ]. The largest group of single strand RNA-binding proteins is the eukaryotic RNA recognition motif (RRM) family that contains an eight amino acid RNP-1 consensus sequence [, ]. RRM proteins have a variety of RNA binding preferences and functions, and include heterogeneous nuclear ribonucleoproteins (hnRNPs), proteins implicated in regulation of alternative splicing (SR, U2AF, Sxl), protein components of small nuclear ribonucleoproteins (U1 and U2 snRNPs), and proteins that regulate RNA stability and translation (PABP, La, Hu) [, , ]. The RRM in heterodimeric splicing factor U2 snRNP auxiliary factor (U2AF) appears to have two RRM-like domains with specialised features for protein recognition []. The motif also appears in a few single stranded DNA binding proteins. The typical RRM consists of four anti-parallel beta-strands and two alpha-helices arranged in a beta-alpha-beta-beta-alpha-beta fold with side chains that stack with RNA bases. Specificity of RNA binding is determined by multiple contacts with surrounding amino acids. A third helix is present during RNA binding in some cases []. The RRM is reviewed in a number of publications [, , ].; GO: 0003676 nucleic acid binding; PDB: 2RNE_A 2DGO_A 2DO4_A 1YTY_B 2VOO_B 2VOP_A 2VON_B 1ZH5_B 2VOD_A 1S79_A ....
Probab=75.29  E-value=3.1  Score=31.79  Aligned_cols=26  Identities=35%  Similarity=0.353  Sum_probs=22.4

Q ss_pred             ccccceEEEEecCHHHHHHHHHhccc
Q 007784          174 EKQLGAALVFFTSRVAAASAAQSLHA  199 (590)
Q Consensus       174 ~~~~~~AFVtF~s~~~a~~a~q~~~~  199 (590)
                      .+..+.|||+|++.++|..|.+.++.
T Consensus        36 ~~~~~~a~V~F~~~~~a~~a~~~l~g   61 (70)
T PF00076_consen   36 GKSKGYAFVEFESEEDAEKALEELNG   61 (70)
T ss_dssp             SSEEEEEEEEESSHHHHHHHHHHHTT
T ss_pred             ccccceEEEEEcCHHHHHHHHHHcCC
Confidence            35689999999999999999987654


No 40 
>KOG0125 consensus Ataxin 2-binding protein (RRM superfamily) [General function prediction only]
Probab=75.23  E-value=7.4  Score=39.75  Aligned_cols=39  Identities=10%  Similarity=0.206  Sum_probs=34.2

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccch
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNK   96 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~   96 (590)
                      ...-+.|.|||=..+|    .+|+..|+++  |+|.+|.|++|.+
T Consensus        95 ~pkRLhVSNIPFrFRd----pDL~aMF~kf--G~VldVEIIfNER  133 (376)
T KOG0125|consen   95 TPKRLHVSNIPFRFRD----PDLRAMFEKF--GKVLDVEIIFNER  133 (376)
T ss_pred             CCceeEeecCCccccC----ccHHHHHHhh--CceeeEEEEeccC
Confidence            3567999999999985    7899999998  8899999999864


No 41 
>smart00361 RRM_1 RNA recognition motif.
Probab=74.54  E-value=3.8  Score=32.06  Aligned_cols=26  Identities=23%  Similarity=0.308  Sum_probs=22.1

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQ  200 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~  200 (590)
                      ...|.|||+|++..+|..|.+.++..
T Consensus        35 ~~rG~~fV~f~~~~dA~~A~~~l~g~   60 (70)
T smart00361       35 HKRGNVYITFERSEDAARAIVDLNGR   60 (70)
T ss_pred             CCcEEEEEEECCHHHHHHHHHHhCCC
Confidence            34688999999999999999887654


No 42 
>PF14259 RRM_6:  RNA recognition motif (a.k.a. RRM, RBD, or RNP domain); PDB: 2DNN_A 1WI6_A 2EVZ_A 2ADC_A 1QM9_A 2KG1_A 2HGN_A 1U2F_A 2G4B_A 2HZC_A ....
Probab=71.65  E-value=4  Score=31.51  Aligned_cols=24  Identities=33%  Similarity=0.340  Sum_probs=21.4

Q ss_pred             cccceEEEEecCHHHHHHHHHhcc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLH  198 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~  198 (590)
                      ...+.|||+|.|+.+|..|.+..+
T Consensus        37 ~~~~~a~v~f~~~~~a~~al~~~~   60 (70)
T PF14259_consen   37 QSRGFAFVEFSSEEDAKRALELLN   60 (70)
T ss_dssp             SEEEEEEEEESSHHHHHHHHHHHT
T ss_pred             ccCCEEEEEeCCHHHHHHHHHHCC
Confidence            458999999999999999998764


No 43 
>TIGR01659 sex-lethal sex-lethal family splicing factor. This model describes the sex-lethal family of splicing factors found in Dipteran insects. The sex-lethal phenotype, however, may be limited to the Melanogasters and closely related species. In Drosophila the protein acts as an inhibitor of splicing. This subfamily is most closely related to the ELAV/HUD subfamily of splicing factors (TIGR01661).
Probab=70.05  E-value=6.1  Score=41.60  Aligned_cols=37  Identities=16%  Similarity=0.352  Sum_probs=31.4

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .+.+|.|.|||.+++    +++|+++|+++  +.|.++.+.+|
T Consensus       192 ~~~~lfV~nLp~~vt----ee~L~~~F~~f--G~V~~v~i~~d  228 (346)
T TIGR01659       192 KDTNLYVTNLPRTIT----DDQLDTIFGKY--GQIVQKNILRD  228 (346)
T ss_pred             ccceeEEeCCCCccc----HHHHHHHHHhc--CCEEEEEEeec
Confidence            467899999999886    68999999987  67888887765


No 44 
>PF14257 DUF4349:  Domain of unknown function (DUF4349)
Probab=69.28  E-value=1.3e+02  Score=30.17  Aligned_cols=77  Identities=9%  Similarity=0.180  Sum_probs=40.7

Q ss_pred             HHHHHHHhhhCC-CceeEEEE-eccc-hhHHHHHHHHHHHHHHHHHHHHHHhhcccCCCCCCCCCcccccccCCCCcccc
Q 007784           72 EQVDSYFKAIYP-DTFYRSMV-VTNN-KEANKIYEELEGYKKKLARAEAVYAESKSAGKPEGTRPTIKTGFLGLLGKRVD  148 (590)
Q Consensus        72 ~~L~~~F~~~~p-~~v~~v~~-~~d~-~~l~~L~~~r~~~~~~Le~~~~~~~~~k~~~~~~~~rP~~~~~~~~~~g~kvd  148 (590)
                      +.+.++.+++-. |.|.+-.+ .-|+ .++.++..+.+.+..+.+++...+.+                      .++++
T Consensus       105 ~~~~~~l~~l~~~g~v~~~~~~~~DvT~~y~D~~arl~~l~~~~~rl~~ll~k----------------------a~~~~  162 (262)
T PF14257_consen  105 DKFDSFLDELSELGKVTSRNISSEDVTEQYVDLEARLKNLEAEEERLLELLEK----------------------AKTVE  162 (262)
T ss_pred             HHHHHHHHHHhccCceeeeeccccchHHHHHHHHHHHHHHHHHHHHHHHHHHh----------------------cCCHH
Confidence            445555555432 45554444 2343 33445555555544444444443321                      12344


Q ss_pred             HHHHHHHHHHHHHHHHHHHHhh
Q 007784          149 AIEYYNEKIKEIIPKLEAEQKI  170 (590)
Q Consensus       149 ~i~~~~~~l~~l~~~I~~~~~~  170 (590)
                      .+--.+++|.+++.+|+..+.+
T Consensus       163 d~l~ie~~L~~v~~eIe~~~~~  184 (262)
T PF14257_consen  163 DLLEIERELSRVRSEIEQLEGQ  184 (262)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHH
Confidence            4555678888888888876554


No 45 
>KOG0107 consensus Alternative splicing factor SRp20/9G8 (RRM superfamily) [RNA processing and modification]
Probab=68.65  E-value=4.5  Score=37.67  Aligned_cols=36  Identities=22%  Similarity=0.123  Sum_probs=28.6

Q ss_pred             ccccceEEEEecCHHHHHHHHHhcccCC--CCceeeee
Q 007784          174 EKQLGAALVFFTSRVAAASAAQSLHAQL--VDTWTVSD  209 (590)
Q Consensus       174 ~~~~~~AFVtF~s~~~a~~a~q~~~~~~--~~~~~v~~  209 (590)
                      ..+-|.|||+|++..+|..|...+....  ..++.|+.
T Consensus        44 rnPPGfAFVEFed~RDA~DAvr~LDG~~~cG~r~rVE~   81 (195)
T KOG0107|consen   44 RNPPGFAFVEFEDPRDAEDAVRYLDGKDICGSRIRVEL   81 (195)
T ss_pred             ecCCCceEEeccCcccHHHHHhhcCCccccCceEEEEe
Confidence            4678999999999999999998886655  34566654


No 46 
>KOG0123 consensus Polyadenylate-binding protein (RRM superfamily) [RNA processing and modification; Translation, ribosomal structure and biogenesis]
Probab=66.18  E-value=21  Score=37.96  Aligned_cols=34  Identities=15%  Similarity=0.314  Sum_probs=28.7

Q ss_pred             EEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           56 VLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        56 VlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      |.|.|+|+++++    +.|.++|+.+  |.|.++.+..|.
T Consensus        79 ~~i~nl~~~~~~----~~~~d~f~~~--g~ilS~kv~~~~  112 (369)
T KOG0123|consen   79 VFIKNLDESIDN----KSLYDTFSEF--GNILSCKVATDE  112 (369)
T ss_pred             eeecCCCcccCc----HHHHHHHHhh--cCeeEEEEEEcC
Confidence            999999999875    8899999998  788888776644


No 47 
>KOG0122 consensus Translation initiation factor 3, subunit g (eIF-3g) [Translation, ribosomal structure and biogenesis]
Probab=65.91  E-value=6.8  Score=38.40  Aligned_cols=37  Identities=14%  Similarity=0.345  Sum_probs=30.9

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      ..-||.|+|+|.+++    +++|++.|..+  |.+.++.+++|
T Consensus       188 D~~tvRvtNLsed~~----E~dL~eLf~~f--g~i~rvylard  224 (270)
T KOG0122|consen  188 DEATVRVTNLSEDMR----EDDLEELFRPF--GPITRVYLARD  224 (270)
T ss_pred             ccceeEEecCccccC----hhHHHHHhhcc--CccceeEEEEc
Confidence            456999999999987    68899998876  56888888875


No 48 
>smart00360 RRM RNA recognition motif.
Probab=65.48  E-value=8.5  Score=28.62  Aligned_cols=30  Identities=20%  Similarity=0.294  Sum_probs=23.1

Q ss_pred             EcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEec
Q 007784           58 VRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVT   93 (590)
Q Consensus        58 V~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~   93 (590)
                      |.|+|.+..    +++|+++|+++  |.|.++.+..
T Consensus         1 i~~l~~~~~----~~~l~~~f~~~--g~v~~~~i~~   30 (71)
T smart00360        1 VGNLPPDVT----EEELRELFSKF--GKIESVRLVR   30 (71)
T ss_pred             CCCCCcccC----HHHHHHHHHhh--CCEeEEEEEe
Confidence            578888776    68999999987  5677776554


No 49 
>KOG0117 consensus Heterogeneous nuclear ribonucleoprotein R (RRM superfamily) [RNA processing and modification]
Probab=65.01  E-value=12  Score=39.75  Aligned_cols=84  Identities=14%  Similarity=0.155  Sum_probs=55.6

Q ss_pred             HHHHHHHHHHHHHHHH---HHh--hhhhccccceEEEEecCHHHHHHHHHhcccC---CCCceeeeeCCCCCCeeeCCcC
Q 007784          151 EYYNEKIKEIIPKLEA---EQK--ITLKEKQLGAALVFFTSRVAAASAAQSLHAQ---LVDTWTVSDAPESRELIWNNLN  222 (590)
Q Consensus       151 ~~~~~~l~~l~~~I~~---~~~--~~~~~~~~~~AFVtF~s~~~a~~a~q~~~~~---~~~~~~v~~AP~P~DI~W~NL~  222 (590)
                      |-++++|.-+-++|-+   .|-  +..+....|+|||||.+-..|+.|...+++.   ....+.|...-.-.-..=.|+-
T Consensus        94 D~~EdeLvplfEkiG~I~elRLMmD~~sG~nRGYAFVtf~~Ke~Aq~Aik~lnn~Eir~GK~igvc~Svan~RLFiG~IP  173 (506)
T KOG0117|consen   94 DVFEDELVPLFEKIGKIYELRLMMDPFSGDNRGYAFVTFCTKEEAQEAIKELNNYEIRPGKLLGVCVSVANCRLFIGNIP  173 (506)
T ss_pred             cccchhhHHHHHhccceeeEEEeecccCCCCcceEEEEeecHHHHHHHHHHhhCccccCCCEeEEEEeeecceeEeccCC
Confidence            3467788777776654   221  1134567899999999999999999988765   2233445555555666667777


Q ss_pred             cchHHHHHHHHH
Q 007784          223 IKFFQRQIRQYV  234 (590)
Q Consensus       223 ~~~~~r~~R~~~  234 (590)
                      .++.+--++.-+
T Consensus       174 K~k~keeIlee~  185 (506)
T KOG0117|consen  174 KTKKKEEILEEM  185 (506)
T ss_pred             ccccHHHHHHHH
Confidence            766655554443


No 50 
>KOG0127 consensus Nucleolar protein fibrillarin NOP77 (RRM superfamily) [RNA processing and modification]
Probab=63.03  E-value=9.3  Score=41.64  Aligned_cols=35  Identities=23%  Similarity=0.376  Sum_probs=30.0

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      +||.|+|+|-+.+    +++|.++|+++  |+|..+.+|.|
T Consensus       293 ~tVFvRNL~fD~t----EEel~~~fskF--G~v~ya~iV~~  327 (678)
T KOG0127|consen  293 KTVFVRNLPFDTT----EEELKEHFSKF--GEVKYAIIVKD  327 (678)
T ss_pred             ceEEEecCCcccc----HHHHHHHHHhh--ccceeEEEEec
Confidence            8999999998876    79999999998  67777777754


No 51 
>PF07292 NID:  Nmi/IFP 35 domain (NID);  InterPro: IPR009909 This entry represents a domain of approximately 90 residues that is tandemly repeated within interferon-induced 35 kDa protein (IFP 35) and the homologous N-myc-interactor (Nmi). This domain mediates Nmi-Nmi protein interactions and subcellular localisation [].
Probab=62.36  E-value=1.3  Score=36.69  Aligned_cols=25  Identities=24%  Similarity=0.408  Sum_probs=18.3

Q ss_pred             CCcccEEEEcCCCCCCCCCChHHHHHHHH
Q 007784           50 RPQQFAVLVRDLPDLPKGQSRKEQVDSYF   78 (590)
Q Consensus        50 ~~s~yTVlV~~IP~~~~~~~~~~~L~~~F   78 (590)
                      ..|.+||+|+|||..+.    ++.|++..
T Consensus        49 ~vs~rtVlvsgip~~l~----ee~l~D~L   73 (88)
T PF07292_consen   49 GVSKRTVLVSGIPDVLD----EEELRDKL   73 (88)
T ss_pred             cccCCEEEEeCCCCCCC----hhhheeeE
Confidence            46789999999998554    55555543


No 52 
>smart00360 RRM RNA recognition motif.
Probab=61.77  E-value=9.6  Score=28.32  Aligned_cols=24  Identities=38%  Similarity=0.397  Sum_probs=20.7

Q ss_pred             cccceEEEEecCHHHHHHHHHhcc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLH  198 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~  198 (590)
                      +..+.|||+|++..+|..|.+.++
T Consensus        36 ~~~~~a~v~f~~~~~a~~a~~~~~   59 (71)
T smart00360       36 KSKGFAFVEFESEEDAEKALEALN   59 (71)
T ss_pred             CCCceEEEEeCCHHHHHHHHHHcC
Confidence            447899999999999999988765


No 53 
>smart00362 RRM_2 RNA recognition motif.
Probab=60.85  E-value=10  Score=28.35  Aligned_cols=25  Identities=36%  Similarity=0.393  Sum_probs=21.1

Q ss_pred             cccceEEEEecCHHHHHHHHHhccc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHA  199 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~  199 (590)
                      ...+.|||+|++..+|..|.+.++.
T Consensus        37 ~~~~~~~v~f~~~~~a~~a~~~~~~   61 (72)
T smart00362       37 KSKGFAFVEFESEEDAEKAIEALNG   61 (72)
T ss_pred             CCCceEEEEeCCHHHHHHHHHHhCC
Confidence            3569999999999999999887653


No 54 
>COG0724 RNA-binding proteins (RRM domain) [General function prediction only]
Probab=60.23  E-value=13  Score=36.35  Aligned_cols=37  Identities=22%  Similarity=0.322  Sum_probs=30.6

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      .+||.|.|||.+.+    +++|.++|.++  |.+.++.+.+|-
T Consensus       115 ~~~l~v~nL~~~~~----~~~l~~~F~~~--g~~~~~~~~~d~  151 (306)
T COG0724         115 NNTLFVGNLPYDVT----EEDLRELFKKF--GPVKRVRLVRDR  151 (306)
T ss_pred             CceEEEeCCCCCCC----HHHHHHHHHhc--CceeEEEeeecc
Confidence            49999999998886    79999999998  557777776653


No 55 
>TIGR01649 hnRNP-L_PTB hnRNP-L/PTB/hephaestus splicing factor family. Included in this family of heterogeneous ribonucleoproteins are PTB (polypyrimidine tract binding protein ) and hnRNP-L. These proteins contain four RNA recognition motifs (rrm: pfam00067).
Probab=58.48  E-value=14  Score=40.92  Aligned_cols=36  Identities=17%  Similarity=0.162  Sum_probs=30.8

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      +++|.|.|||.+..    +++|++.|+++  |.|.++.++.+
T Consensus         2 s~vv~V~nLp~~~t----e~~L~~~f~~f--G~V~~v~i~~~   37 (481)
T TIGR01649         2 SPVVHVRNLPQDVV----EADLVEALIPF--GPVSYVMMLPG   37 (481)
T ss_pred             ccEEEEcCCCCCCC----HHHHHHHHHhc--CCeeEEEEECC
Confidence            47999999999876    79999999997  77988887764


No 56 
>KOG0146 consensus RNA-binding protein ETR-3 (RRM superfamily) [RNA processing and modification]
Probab=57.15  E-value=21  Score=35.51  Aligned_cols=51  Identities=25%  Similarity=0.264  Sum_probs=38.7

Q ss_pred             ccccceEEEEecCHHHHHHHHHhcccCCC-----CceeeeeCCCCCCeeeCCcCcchHHHHHHHHHHH
Q 007784          174 EKQLGAALVFFTSRVAAASAAQSLHAQLV-----DTWTVSDAPESRELIWNNLNIKFFQRQIRQYVVY  236 (590)
Q Consensus       174 ~~~~~~AFVtF~s~~~a~~a~q~~~~~~~-----~~~~v~~AP~P~DI~W~NL~~~~~~r~~R~~~~~  236 (590)
                      ....|+|||-|++..+|+.|...+|.++.     ..+.|+.|            -+.++|.+||.--.
T Consensus        57 g~sKGCAFVKf~s~~eAqaAI~aLHgSqTmpGASSSLVVK~A------------DTdkER~lRRMQQm  112 (371)
T KOG0146|consen   57 GNSKGCAFVKFSSHAEAQAAINALHGSQTMPGASSSLVVKFA------------DTDKERTLRRMQQM  112 (371)
T ss_pred             CCCCCceEEEeccchHHHHHHHHhcccccCCCCccceEEEec------------cchHHHHHHHHHHH
Confidence            35689999999999999999999998653     24566655            35678888886433


No 57 
>cd00590 RRM RRM (RNA recognition motif), also known as RBD (RNA binding domain) or RNP (ribonucleoprotein domain), is a highly abundant domain in eukaryotes found in proteins involved in post-transcriptional gene expression processes including mRNA and rRNA processing, RNA export, and RNA stability. This domain is 90 amino acids in length and consists of a four-stranded beta-sheet packed against two alpha-helices.  RRM usually interacts with ssRNA, but is also known to interact with ssDNA as well as proteins. RRM binds a variable number of nucleotides, ranging from two to eight.  The active site includes three aromatic side-chains located within the conserved RNP1 and RNP2 motifs of the domain. The RRM domain is found in a variety heterogeneous nuclear ribonucleoproteins (hnRNPs), proteins implicated in regulation of alternative splicing, and protein components of small nuclear ribonucleoproteins (snRNPs).
Probab=52.71  E-value=17  Score=27.29  Aligned_cols=25  Identities=28%  Similarity=0.343  Sum_probs=21.5

Q ss_pred             ccceEEEEecCHHHHHHHHHhcccC
Q 007784          176 QLGAALVFFTSRVAAASAAQSLHAQ  200 (590)
Q Consensus       176 ~~~~AFVtF~s~~~a~~a~q~~~~~  200 (590)
                      ..+.|||+|++.++|+.|.+.++..
T Consensus        39 ~~~~~~v~f~s~~~a~~a~~~~~~~   63 (74)
T cd00590          39 SKGFAFVEFEDEEDAEKALEALNGK   63 (74)
T ss_pred             cceEEEEEECCHHHHHHHHHHhCCC
Confidence            4789999999999999999876554


No 58 
>PF15176 LRR19-TM:  Leucine-rich repeat family 19 TM domain
Probab=50.71  E-value=46  Score=28.12  Aligned_cols=24  Identities=33%  Similarity=0.546  Sum_probs=16.4

Q ss_pred             CCCCCccccHHHHHHHHHHHHHHH
Q 007784          471 PAYESYGRMWPHMFLRLVAALLLY  494 (590)
Q Consensus       471 ~~~es~G~~~~~~~~~~~~~l~l~  494 (590)
                      |....+|+-||.+...++.++.++
T Consensus         8 ~~~~~~g~sW~~LVGVv~~al~~S   31 (102)
T PF15176_consen    8 PGPGEGGRSWPFLVGVVVTALVTS   31 (102)
T ss_pred             CCCCCCCcccHhHHHHHHHHHHHH
Confidence            556778999998776555555443


No 59 
>TIGR01645 half-pint poly-U binding splicing factor, half-pint family. In the case of PUF60 (GP|6176532), in complex with p54, and in the presence of U2AF, facilitates association of U2 snRNP with pre-mRNA.
Probab=49.80  E-value=21  Score=40.44  Aligned_cols=36  Identities=11%  Similarity=0.144  Sum_probs=30.7

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .++|.|.|||.+..    +++|+++|+.+  |.|.++.+.+|
T Consensus       204 ~~rLfVgnLp~~vt----eedLk~lFs~F--G~I~svrl~~D  239 (612)
T TIGR01645       204 FNRIYVASVHPDLS----ETDIKSVFEAF--GEIVKCQLARA  239 (612)
T ss_pred             cceEEeecCCCCCC----HHHHHHHHhhc--CCeeEEEEEec
Confidence            46999999999886    68999999987  67888887765


No 60 
>PF14605 Nup35_RRM_2:  Nup53/35/40-type RNA recognition motif
Probab=48.35  E-value=25  Score=25.98  Aligned_cols=32  Identities=19%  Similarity=0.120  Sum_probs=23.9

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEe
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVV   92 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~   92 (590)
                      .+|-|+|.|++.     .+.+.+||.++  |++.++.+.
T Consensus         2 ~wI~V~Gf~~~~-----~~~vl~~F~~f--GeI~~~~~~   33 (53)
T PF14605_consen    2 TWISVSGFPPDL-----AEEVLEHFASF--GEIVDIYVP   33 (53)
T ss_pred             cEEEEEeECchH-----HHHHHHHHHhc--CCEEEEEcC
Confidence            589999999865     46778899985  667665444


No 61 
>TIGR01649 hnRNP-L_PTB hnRNP-L/PTB/hephaestus splicing factor family. Included in this family of heterogeneous ribonucleoproteins are PTB (polypyrimidine tract binding protein ) and hnRNP-L. These proteins contain four RNA recognition motifs (rrm: pfam00067).
Probab=46.24  E-value=31  Score=38.04  Aligned_cols=38  Identities=13%  Similarity=0.124  Sum_probs=31.7

Q ss_pred             cccEEEEcCCCCC-CCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           52 QQFAVLVRDLPDL-PKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        52 s~yTVlV~~IP~~-~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ...+|+|.|||.+ .+    +++|++.|+++  |.|.+|.+.+|-
T Consensus       274 ~~~~l~v~nL~~~~vt----~~~L~~lF~~y--G~V~~vki~~~~  312 (481)
T TIGR01649       274 PGSVLMVSGLHQEKVN----CDRLFNLFCVY--GNVERVKFMKNK  312 (481)
T ss_pred             CCCEEEEeCCCCCCCC----HHHHHHHHHhc--CCeEEEEEEeCC
Confidence            4579999999974 54    79999999987  789999888764


No 62 
>KOG0132 consensus RNA polymerase II C-terminal domain-binding protein RA4, contains RPR and RRM domains [RNA processing and modification; Transcription]
Probab=45.55  E-value=15  Score=41.76  Aligned_cols=40  Identities=8%  Similarity=0.190  Sum_probs=33.6

Q ss_pred             CCcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           50 RPQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        50 ~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ...++|+.|.+||++++    +++|++.|+++  |+|.+|.+.-+.
T Consensus       418 sV~SrTLwvG~i~k~v~----e~dL~~~feef--GeiqSi~li~~R  457 (894)
T KOG0132|consen  418 SVCSRTLWVGGIPKNVT----EQDLANLFEEF--GEIQSIILIPPR  457 (894)
T ss_pred             eEeeeeeeeccccchhh----HHHHHHHHHhc--ccceeEeeccCC
Confidence            35688999999999987    79999999998  778888777554


No 63 
>PF02654 CobS:  Cobalamin-5-phosphate synthase;  InterPro: IPR003805 Cobalamin (vitamin B12) is a structurally complex cofactor, consisting of a modified tetrapyrrole with a centrally chelated cobalt. Cobalamin is usually found in one of two biologically active forms: methylcobalamin and adocobalamin. Most prokaryotes, as well as animals, have cobalamin-dependent enzymes, whereas plants and fungi do not appear to use it. In bacteria and archaea, these include methionine synthase, ribonucleotide reductase, glutamate and methylmalonyl-CoA mutases, ethanolamine ammonia lyase, and diol dehydratase []. In mammals, cobalamin is obtained through the diet, and is required for methionine synthase and methylmalonyl-CoA mutase [].  There are at least two distinct cobalamin biosynthetic pathways in bacteria []:  Aerobic pathway that requires oxygen and in which cobalt is inserted late in the pathway []; found in Pseudomonas denitrificans and Rhodobacter capsulatus. Anaerobic pathway in which cobalt insertion is the first committed step towards cobalamin synthesis []; found in Salmonella typhimurium, Bacillus megaterium, and Propionibacterium freudenreichii subsp. shermanii.   Either pathway can be divided into two parts: (1) corrin ring synthesis (differs in aerobic and anaerobic pathways) and (2) adenosylation of corrin ring, attachment of aminopropanol arm, and assembly of the nucleotide loop (common to both pathways) []. There are about 30 enzymes involved in either pathway, where those involved in the aerobic pathway are prefixed Cob and those of the anaerobic pathway Cbi. Several of these enzymes are pathway-specific: CbiD, CbiG, and CbiK are specific to the anaerobic route of S. typhimurium, whereas CobE, CobF, CobG, CobN, CobS, CobT, and CobW are unique to the aerobic pathway of P. denitrificans. This entry represents the CobS protein, a cobalamin-5-phosphate synthase that catyalzes the reactions:  Adenosylcobinamide-GDP + alpha-ribazole-5'-P = adenosylcobalamin-5'-phosphate + GMP Adenosylcobinamide-GDP + alpha-ribazole = adenosylcobalamin + GMP  The protein product from these catalyses is associated with a large complex of proteins and is induced by cobinamide. CobS is involved in part III of cobalamin biosynthesis, one of the late steps in adenosylcobalamin synthesis that, together with CobU, CobT, and CobC proteins, defines the nucleotide loop assembly pathway [, ].; GO: 0008818 cobalamin 5'-phosphate synthase activity, 0009236 cobalamin biosynthetic process
Probab=44.71  E-value=2.9e+02  Score=27.24  Aligned_cols=123  Identities=15%  Similarity=0.169  Sum_probs=58.3

Q ss_pred             CCHHHHHHhcCCCCCCCcccchhHHHHHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhhe---eeecCCCCCccccHHH
Q 007784          406 KTEAELKEAWFPGDLGYGTRVPSDMLIVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQAL---KVYVPAYESYGRMWPH  482 (590)
Q Consensus       406 ~T~re~~~~~~~~~f~~~~~y~~~l~~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~ll---yvy~~~~es~G~~~~~  482 (590)
                      ++++++.|..+.+.  .|. |+....++.+.+-|+.++-+...-......+....-|...+   ...+|+.+.-|+.+..
T Consensus        86 ~~~er~LeIMKDsr--iG~-~Gv~al~~~lllk~~~l~~l~~~~~~~~l~i~~~~~r~~~~~~~~~~~p~~~Glg~~f~~  162 (235)
T PF02654_consen   86 RDRERRLEIMKDSR--IGA-FGVLALVLVLLLKYAALSSLPSHGLALALLIAPVLARLSMLLLAAFSKPRPEGLGALFVG  162 (235)
T ss_pred             CCHHHHHHHHhCCC--CCh-HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhCCCCCCcchhHHhc
Confidence            34444455555443  332 45555666666556555554433333334444455565443   2234555555655543


Q ss_pred             HH--HHHHHHHHHHHHHHHHHHhhcccchhhhhHHHHHHHHHHHHHHHhhcc
Q 007784          483 MF--LRLVAALLLYQITMLGYFGSKKFIYVGFLIPLPILSLIFVYICQKRFY  532 (590)
Q Consensus       483 ~~--~~~~~~l~l~q~~~~g~f~lk~~~~~~~~~~l~~~t~~~~~~~~~~~~  532 (590)
                      -.  +++..+.++.=+..+.+.... .......+...+.+.++.+++++++.
T Consensus       163 ~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~~~~r~lG  213 (235)
T PF02654_consen  163 SAKKRQVLIALIILLLLALFLGGIP-WIGLLALLVALLLALLLARYARRRLG  213 (235)
T ss_pred             cCChhHHHHHHHHHHHHHHHHhhhH-HHHHHHHHHHHHHHHHHHHHHHHHcC
Confidence            22  344445444322222111111 11122334445567778888888874


No 64 
>PF02388 FemAB:  FemAB family;  InterPro: IPR003447 The femAB operon codes for two nearly identical approximately 50kDa proteins involved in the formation of the Staphylococcal pentaglycine interpeptide bridge in peptidoglycan []. These proteins are also considered as a factor influencing the level of methicillin resistance [].; GO: 0016755 transferase activity, transferring amino-acyl groups; PDB: 1XE4_A 1NE9_A 3GKR_A 1XIX_A 1P4N_A 1XF8_A 1LRZ_A.
Probab=44.52  E-value=1.9e+02  Score=31.20  Aligned_cols=83  Identities=19%  Similarity=0.408  Sum_probs=47.1

Q ss_pred             CCCceeEEEEe-ccchh-HHHHHHHHHHHHHHHHHHHHHHhhcccCCCCCCCCCcccccccCCCCccccHHHHHHHHHHH
Q 007784           82 YPDTFYRSMVV-TNNKE-ANKIYEELEGYKKKLARAEAVYAESKSAGKPEGTRPTIKTGFLGLLGKRVDAIEYYNEKIKE  159 (590)
Q Consensus        82 ~p~~v~~v~~~-~d~~~-l~~L~~~r~~~~~~Le~~~~~~~~~k~~~~~~~~rP~~~~~~~~~~g~kvd~i~~~~~~l~~  159 (590)
                      ||+. ....++ +|.++ +..+.++++++.++++....++.++          |           ++-..+.-++++++.
T Consensus       227 f~d~-a~~~~A~l~~~~~~~~l~~~~~~~~~~i~~l~~~l~~~----------~-----------k~~~k~~~~~~q~~~  284 (406)
T PF02388_consen  227 FGDK-AKFFLAELNGKEYLESLQEKLEKLEKEIEKLEEKLEKN----------P-----------KKKNKLKELEEQLAS  284 (406)
T ss_dssp             CCCC-EEEEEEEECCHHHHHHHHHHHHHHHHHHHHHHHHHHH-----------T-----------HHHHHHHHHHHHHHH
T ss_pred             cCCC-eEEEEEEEcHHHHHHHHHHHHHHHHHHHHHHHHHHHhC----------c-----------chhhHHHHHHHHHHH
Confidence            4666 334444 57755 4677777888888888877766532          1           011123445667777


Q ss_pred             HHHHHHHHHhhh---hhc-cccceEEEEecC
Q 007784          160 IIPKLEAEQKIT---LKE-KQLGAALVFFTS  186 (590)
Q Consensus       160 l~~~I~~~~~~~---~~~-~~~~~AFVtF~s  186 (590)
                      ++++|++.++-.   .+. .-.+.-||.+.+
T Consensus       285 ~~k~~~~~~~~~~~~~~~~~la~~l~~~~g~  315 (406)
T PF02388_consen  285 LEKRIEEAEELIAEYGDEIPLAGALFIYYGD  315 (406)
T ss_dssp             HHHHHHHHHHHHHHH-SEEEEEEEEEEEETT
T ss_pred             HHHHHHHHHHHHHhcCCcceEEEEEEEEECC
Confidence            777776655422   111 235556676654


No 65 
>PLN03120 nucleic acid binding protein; Provisional
Probab=43.36  E-value=41  Score=33.72  Aligned_cols=35  Identities=23%  Similarity=0.207  Sum_probs=25.0

Q ss_pred             ccceEEEEecCHHHHHHHHHhcccC--CCCceeeeeCC
Q 007784          176 QLGAALVFFTSRVAAASAAQSLHAQ--LVDTWTVSDAP  211 (590)
Q Consensus       176 ~~~~AFVtF~s~~~a~~a~q~~~~~--~~~~~~v~~AP  211 (590)
                      ..+.|||||+++.+|..|.. +...  .+..+.|.+|+
T Consensus        42 ~~GfAFVtF~d~eaAe~All-LnG~~l~gr~V~Vt~a~   78 (260)
T PLN03120         42 RSQIAYVTFKDPQGAETALL-LSGATIVDQSVTITPAE   78 (260)
T ss_pred             CCCEEEEEeCcHHHHHHHHH-hcCCeeCCceEEEEecc
Confidence            46899999999999999985 3322  23445666654


No 66 
>KOG0122 consensus Translation initiation factor 3, subunit g (eIF-3g) [Translation, ribosomal structure and biogenesis]
Probab=41.21  E-value=32  Score=33.90  Aligned_cols=36  Identities=33%  Similarity=0.226  Sum_probs=26.9

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccCCCC--ceeeeeC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQLVD--TWTVSDA  210 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~~~~--~~~v~~A  210 (590)
                      ...|-|||||.++++|+.|...+....-+  .++|+.+
T Consensus       229 ~~kGFAFVtF~sRddA~rAI~~LnG~gyd~LILrvEws  266 (270)
T KOG0122|consen  229 LSKGFAFVTFESRDDAARAIADLNGYGYDNLILRVEWS  266 (270)
T ss_pred             cccceEEEEEecHHHHHHHHHHccCcccceEEEEEEec
Confidence            45789999999999999999887655433  3445543


No 67 
>KOG4208 consensus Nucleolar RNA-binding protein NIFK [General function prediction only]
Probab=40.05  E-value=27  Score=33.52  Aligned_cols=25  Identities=32%  Similarity=0.352  Sum_probs=21.4

Q ss_pred             ccccceEEEEecCHHHHHHHHHhcc
Q 007784          174 EKQLGAALVFFTSRVAAASAAQSLH  198 (590)
Q Consensus       174 ~~~~~~AFVtF~s~~~a~~a~q~~~  198 (590)
                      .+.-|+|||.|++.+-|.+|+.+..
T Consensus        89 GNSKgYAFVEFEs~eVA~IaAETMN  113 (214)
T KOG4208|consen   89 GNSKGYAFVEFESEEVAKIAAETMN  113 (214)
T ss_pred             CCcCceEEEEeccHHHHHHHHHHhh
Confidence            3567899999999999999998754


No 68 
>PF06790 UPF0259:  Uncharacterised protein family (UPF0259);  InterPro: IPR009627 This is a group of proteins of unknown function.
Probab=39.37  E-value=3.4e+02  Score=27.12  Aligned_cols=81  Identities=19%  Similarity=0.247  Sum_probs=46.5

Q ss_pred             hHHHHHHHHHHHHHHHHHHHHH-HhhhhhHHHHHHHHhc-CchHHHHHHHHhCCcchhHHHHHHHHHHhhhhhHHhhhHH
Q 007784          315 SHAVRAASGKYFYFTVLNVFIG-VTVGGTLFKTFKSIEK-DPNSIVDVLANSLPGNATFFLTYVALQFFVGYGLELSRIV  392 (590)
Q Consensus       315 S~~~~s~~~k~f~f~~vn~~lv-~~l~~~~~~~l~~~~~-~p~~i~~~l~~~lp~~s~FFi~yii~~~~~~~~~~llr~~  392 (590)
                      |..|..+.-|......+...+. +.+.|++...++...+ ++.+..+.++.++|.--.+++-.++..-++..++-++=++
T Consensus        71 s~eqq~~ll~~sa~~~~s~Lig~~lL~g~li~li~~~s~g~~~s~~~~i~~~~~~lp~LllL~~l~tllI~lG~~L~ivP  150 (248)
T PF06790_consen   71 SPEQQNVLLKASAASTFSSLIGNTLLSGGLITLIQAVSNGQRVSILQAIGASLPLLPRLLLLIFLCTLLIQLGFMLFIVP  150 (248)
T ss_pred             CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCchHHHHHHHHHHHHHHHHHHHHHHHHHHHHhHHHHHHH
Confidence            5666677777777666655555 3344555555555443 4557777888877765445544444443444555555455


Q ss_pred             HHH
Q 007784          393 PLI  395 (590)
Q Consensus       393 ~l~  395 (590)
                      ++.
T Consensus       151 GI~  153 (248)
T PF06790_consen  151 GII  153 (248)
T ss_pred             HHH
Confidence            543


No 69 
>KOG4212 consensus RNA-binding protein hnRNP-M [RNA processing and modification]
Probab=38.59  E-value=43  Score=35.69  Aligned_cols=43  Identities=7%  Similarity=0.125  Sum_probs=34.5

Q ss_pred             CCCcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccch
Q 007784           49 VRPQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNK   96 (590)
Q Consensus        49 ~~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~   96 (590)
                      ....+++|.|+|||-+.+    =+.|++.+++.. ++|..|.+..|..
T Consensus        40 ~~~r~R~vfItNIpyd~r----WqdLKdLvrekv-Gev~yveLl~D~~   82 (608)
T KOG4212|consen   40 VAARDRSVFITNIPYDYR----WQDLKDLVREKV-GEVEYVELLFDES   82 (608)
T ss_pred             cccccceEEEecCcchhh----hHhHHHHHHHhc-CceEeeeeecccC
Confidence            345678899999999987    478999998874 6788888888753


No 70 
>KOG4050 consensus Glutamate transporter EAAC1-interacting protein GTRAP3-18 [Amino acid transport and metabolism; Signal transduction mechanisms]
Probab=38.07  E-value=1.8e+02  Score=26.80  Aligned_cols=44  Identities=20%  Similarity=0.316  Sum_probs=23.4

Q ss_pred             eeCCCCCCe-eeCCcCcchHHHHHHHHHHHHHHHHHHHHHHhHHH
Q 007784          208 SDAPESREL-IWNNLNIKFFQRQIRQYVVYVIVALTIMFYMIPIG  251 (590)
Q Consensus       208 ~~AP~P~DI-~W~NL~~~~~~r~~R~~~~~~~~~~l~if~~iPv~  251 (590)
                      ..+|+|+|. .|.|=-++.---+--+.++.+++...+..+.-|--
T Consensus        32 fa~Pd~~D~~kW~nRVisNLLYyQTNYfv~~it~~~l~~f~sp~~   76 (188)
T KOG4050|consen   32 FARPDFNDFKKWNNRVISNLLYYQTNYFVTFITLFLLHGFISPQD   76 (188)
T ss_pred             ccCCCCccHHHHHHHHHHHHHHHHHhHHHHHHHHHHHHHHcCHHH
Confidence            468999998 67775554333333344444444443333444443


No 71 
>KOG1457 consensus RNA binding protein (contains RRM repeats) [General function prediction only]
Probab=37.13  E-value=46  Score=32.36  Aligned_cols=25  Identities=20%  Similarity=0.361  Sum_probs=21.1

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhh
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAI   81 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~   81 (590)
                      -+|+.|.|+|.|..    ..+|...|+++
T Consensus        34 VRTLFVSGLP~DvK----pREiynLFR~f   58 (284)
T KOG1457|consen   34 VRTLFVSGLPNDVK----PREIYNLFRRF   58 (284)
T ss_pred             cceeeeccCCcccC----HHHHHHHhccC
Confidence            48999999999887    68888888775


No 72 
>PF14362 DUF4407:  Domain of unknown function (DUF4407)
Probab=36.55  E-value=1.4e+02  Score=30.71  Aligned_cols=60  Identities=18%  Similarity=0.220  Sum_probs=42.0

Q ss_pred             hHHHHHHHHHHHHHHHHHHhhheeeecCCC--CCccccHHHHHHHHHHHHHHHHHHHHHHHh
Q 007784          444 PLIIPFGVVYFALGWLILRNQALKVYVPAY--ESYGRMWPHMFLRLVAALLLYQITMLGYFG  503 (590)
Q Consensus       444 Plil~~~~~yf~~~y~v~Ky~llyvy~~~~--es~G~~~~~~~~~~~~~l~l~q~~~~g~f~  503 (590)
                      |..+++|+++.++-+-+||+-+.-+.+...  .-.+..+|+++--+++|+++++....-+|.
T Consensus        46 ~~ai~~glvwgl~I~~lDR~ivss~~~~~~~~~~~~~~~~R~~lAvliaivIs~pl~l~iF~  107 (301)
T PF14362_consen   46 WAAIPFGLVWGLVIFNLDRFIVSSIRKSDGSRKRLLQALPRLLLAVLIAIVISEPLELKIFE  107 (301)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHhccccccchHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            889999999999999999999887654322  111235556656667777777776665653


No 73 
>KOG2150 consensus CCR4-NOT transcriptional regulation complex, NOT5 subunit [Transcription]
Probab=35.33  E-value=1e+02  Score=34.19  Aligned_cols=24  Identities=13%  Similarity=0.436  Sum_probs=19.5

Q ss_pred             ccccHHHHHHHHHHHHHHHHHHHH
Q 007784          145 KRVDAIEYYNEKIKEIIPKLEAEQ  168 (590)
Q Consensus       145 ~kvd~i~~~~~~l~~l~~~I~~~~  168 (590)
                      +|-|..+|+...+++|+.+++..+
T Consensus       119 ek~d~~~wi~~~ideLe~q~d~~e  142 (575)
T KOG2150|consen  119 EKRDTMDWISNQIDELERQVDSFE  142 (575)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHH
Confidence            456789999999999999887643


No 74 
>PF10309 DUF2414:  Protein of unknown function (DUF2414);  InterPro: IPR019416  This entry contains proteins that have no known function. 
Probab=35.20  E-value=1.2e+02  Score=23.32  Aligned_cols=39  Identities=23%  Similarity=0.338  Sum_probs=28.6

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhh----CCCcee-----EEEEeccchh
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAI----YPDTFY-----RSMVVTNNKE   97 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~----~p~~v~-----~v~~~~d~~~   97 (590)
                      -+|.|+|+.. +.    .+++++||.++    .|.+|+     ++++++...+
T Consensus         6 eavhirGvd~-ls----T~dI~~y~~~y~~~~~~~~IEWIdDtScNvvf~d~~   53 (62)
T PF10309_consen    6 EAVHIRGVDE-LS----TDDIKAYFSEYFDEEGPFRIEWIDDTSCNVVFKDEE   53 (62)
T ss_pred             ceEEEEcCCC-CC----HHHHHHHHHHhcccCCCceEEEecCCcEEEEECCHH
Confidence            5899999853 43    68999999999    455554     5688886543


No 75 
>PF06570 DUF1129:  Protein of unknown function (DUF1129);  InterPro: IPR009214 There are currently no experimental data for members of this group or their homologues. However, these proteins contain predicted integral membrane proteins (with several transmembrane segments).
Probab=33.86  E-value=3.8e+02  Score=25.72  Aligned_cols=21  Identities=10%  Similarity=0.396  Sum_probs=13.9

Q ss_pred             hhHHHHHHHHHHHHHHHhhcc
Q 007784          512 FLIPLPILSLIFVYICQKRFY  532 (590)
Q Consensus       512 ~~~~l~~~t~~~~~~~~~~~~  532 (590)
                      ..+.+-++++...+|.+++|.
T Consensus       182 ~~iiig~i~~~~~~~lkkk~~  202 (206)
T PF06570_consen  182 VYIIIGVIAFALRFYLKKKYN  202 (206)
T ss_pred             HHHHHHHHHHHHHHHHHHHhC
Confidence            344445556677888888874


No 76 
>PF11874 DUF3394:  Domain of unknown function (DUF3394);  InterPro: IPR021814  This domain is functionally uncharacterised. This domain is found in bacteria. This presumed domain is about 190 amino acids in length. This domain is found associated with PF06808 from PFAM. 
Probab=33.75  E-value=52  Score=31.25  Aligned_cols=60  Identities=13%  Similarity=0.227  Sum_probs=46.0

Q ss_pred             HHHHHHHHHHHHHHHHHhhcccchhhhhHHHHHHHHHHHHHHHhhccccccccchHHHhh
Q 007784          486 RLVAALLLYQITMLGYFGSKKFIYVGFLIPLPILSLIFVYICQKRFYKSFSDTALEVASR  545 (590)
Q Consensus       486 ~~~~~l~l~q~~~~g~f~lk~~~~~~~~~~l~~~t~~~~~~~~~~~~~~~~~~pl~~~~~  545 (590)
                      ..++|+++|-..+-|+|..|+-++-.+++.+..++.+-=.+.-.+..|+.++.|.....+
T Consensus         8 ~a~~~~l~F~aatqg~f~~r~~~~E~~~ll~~~f~lf~P~~~~d~i~ppy~~~p~~~~~~   67 (183)
T PF11874_consen    8 TALIAMLAFAAATQGWFLTRNKWWESVLLLLIAFTLFRPGFWMDMIYPPYEEVPPSELVQ   67 (183)
T ss_pred             HHHHHHHHHHHHhcceeeecchHHHHHHHHHHHHHHhCchHHHHhccCccccCCHHHHHH
Confidence            456778888888889998888777666666677777777777888889999998776553


No 77 
>KOG3142 consensus Prenylated rab acceptor 1 [Intracellular trafficking, secretion, and vesicular transport]
Probab=32.21  E-value=58  Score=31.01  Aligned_cols=45  Identities=18%  Similarity=0.116  Sum_probs=26.7

Q ss_pred             CCCcccchhHHHHHHHHHHhhhh-hhHHHHHHHHHHHHHHHHHHhh
Q 007784          420 LGYGTRVPSDMLIVTIVFCYSCI-APLIIPFGVVYFALGWLILRNQ  464 (590)
Q Consensus       420 f~~~~~y~~~l~~~~i~l~Ys~i-~Plil~~~~~yf~~~y~v~Ky~  464 (590)
                      .|+.+.=.+...++.+.++||.+ .|+.+.+-...++..++.|++.
T Consensus        64 ~Nl~yF~~NY~~iv~~~~~~sLi~~P~~Livl~~lv~~w~~LY~~r  109 (187)
T KOG3142|consen   64 RNLSYFRVNYVIIVAILLFLSLITHPLSLIVLLALVAAWLFLYFLR  109 (187)
T ss_pred             HHHHHHHHhHHHHHHHHHHHHHHHhHHHHHHHHHHHHHHHheeeec
Confidence            34444445666677777777766 5666666555555555554443


No 78 
>TIGR01642 U2AF_lg U2 snRNP auxilliary factor, large subunit, splicing factor. Members of this subfamily are found in plants, metazoa and fungi.
Probab=31.95  E-value=82  Score=34.79  Aligned_cols=36  Identities=17%  Similarity=0.131  Sum_probs=26.6

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccCC--CCceeeeeC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQL--VDTWTVSDA  210 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~~--~~~~~v~~A  210 (590)
                      +..|.|||+|.+..+|..|.+.+....  ...+.|..|
T Consensus       335 ~~~g~afv~f~~~~~a~~A~~~l~g~~~~~~~l~v~~a  372 (509)
T TIGR01642       335 LSKGYAFCEYKDPSVTDVAIAALNGKDTGDNKLHVQRA  372 (509)
T ss_pred             CcCeEEEEEECCHHHHHHHHHHcCCCEECCeEEEEEEC
Confidence            457899999999999999998875443  234555544


No 79 
>PF09874 DUF2101:  Predicted membrane protein (DUF2101);  InterPro: IPR018663  This family of conserved hypothetical proteins has no known function. 
Probab=31.91  E-value=1.9e+02  Score=27.83  Aligned_cols=96  Identities=18%  Similarity=0.299  Sum_probs=51.7

Q ss_pred             HHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCCCCccccHHHHHHHHHHHHHHHHH-HHHHHHhhccc---ch-hh
Q 007784          437 FCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAYESYGRMWPHMFLRLVAALLLYQI-TMLGYFGSKKF---IY-VG  511 (590)
Q Consensus       437 l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~es~G~~~~~~~~~~~~~l~l~q~-~~~g~f~lk~~---~~-~~  511 (590)
                      .++..-.|+.++.+++||+...++-+.|.=..++.          .+.+....|+-+.-+ +..|...+++.   .. ..
T Consensus        50 ~v~~~~~~~~i~~~i~yf~yLrYiL~~~~~f~id~----------epYR~FY~~Isli~~l~~~gyvlvr~~s~~~~~y~  119 (206)
T PF09874_consen   50 YVFFISPLILIPLFIFYFIYLRYILIRNRNFMIDF----------EPYRFFYYGISLIGFLSFLGYVLVRRFSFEVYPYY  119 (206)
T ss_pred             HHHHHhHHHHHHHHHHHHHHHHHHHhccceeEech----------hHHHHHHHHHhhhhheeecchhhheeccchhhhHH
Confidence            34444566777778888887766655555444432          122333333332222 22344444443   11 22


Q ss_pred             -hhHHHHHHHHHHHHHHHhhccccccccchHH
Q 007784          512 -FLIPLPILSLIFVYICQKRFYKSFSDTALEV  542 (590)
Q Consensus       512 -~~~~l~~~t~~~~~~~~~~~~~~~~~~pl~~  542 (590)
                       .++...+..+.|.++.+.+|.|.+-+--.++
T Consensus       120 ~yL~~v~laVl~fr~~Fr~ky~RdyTyG~VeE  151 (206)
T PF09874_consen  120 TYLGFVFLAVLAFRYYFRSKYGRDYTYGVVEE  151 (206)
T ss_pred             HHHHHHHHHHHHHhhheeeeecccceeEEEEE
Confidence             2222333456688899999999887765543


No 80 
>KOG0113 consensus U1 small nuclear ribonucleoprotein (RRM superfamily) [RNA processing and modification]
Probab=31.88  E-value=60  Score=33.00  Aligned_cols=36  Identities=14%  Similarity=0.136  Sum_probs=31.6

Q ss_pred             ccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           53 QFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        53 ~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      -.|++|--|+-++.    +.+|++.|+.+  |.|.++.+|+|
T Consensus       101 y~TLFv~RLnydT~----EskLrreF~~Y--G~IkrirlV~d  136 (335)
T KOG0113|consen  101 YKTLFVARLNYDTS----ESKLRREFEKY--GPIKRIRLVRD  136 (335)
T ss_pred             cceeeeeecccccc----HHHHHHHHHhc--CcceeEEEeee
Confidence            45999999998765    79999999998  67999999998


No 81 
>PF11823 DUF3343:  Protein of unknown function (DUF3343);  InterPro: IPR021778  This family of proteins are functionally uncharacterised. This protein is found in bacteria and archaea. Proteins in this family are typically between 78 to 102 amino acids in length. 
Probab=30.61  E-value=71  Score=25.14  Aligned_cols=36  Identities=28%  Similarity=0.242  Sum_probs=27.0

Q ss_pred             ceEEEEecCHHHHHHHHHhcccCCCCceeeeeCCCCCCe
Q 007784          178 GAALVFFTSRVAAASAAQSLHAQLVDTWTVSDAPESREL  216 (590)
Q Consensus       178 ~~AFVtF~s~~~a~~a~q~~~~~~~~~~~v~~AP~P~DI  216 (590)
                      ....|||+|..+|-.+-+.+.+.+   ..++..|-|++|
T Consensus         2 ~~~~i~F~st~~a~~~ek~lk~~g---i~~~liP~P~~i   37 (73)
T PF11823_consen    2 KYYLITFPSTHDAMKAEKLLKKNG---IPVRLIPTPREI   37 (73)
T ss_pred             ceEEEEECCHHHHHHHHHHHHHCC---CcEEEeCCChhc
Confidence            467899999999998887765544   345566778776


No 82 
>KOG0130 consensus RNA-binding protein RBM8/Tsunagi (RRM superfamily) [General function prediction only]
Probab=30.50  E-value=1.2e+02  Score=27.34  Aligned_cols=39  Identities=8%  Similarity=0.183  Sum_probs=31.1

Q ss_pred             CcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           51 PQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        51 ~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ..-+-|+|+||-++..    ++++.+-|..+  |.|.++++..|-
T Consensus        70 VEGwIi~VtgvHeEat----Eedi~d~F~dy--GeiKNihLNLDR  108 (170)
T KOG0130|consen   70 VEGWIIFVTGVHEEAT----EEDIHDKFADY--GEIKNIHLNLDR  108 (170)
T ss_pred             eeeEEEEEeccCcchh----HHHHHHHHhhc--ccccceeecccc
Confidence            3456789999988776    68999999988  678888877663


No 83 
>COG5570 Uncharacterized small protein [Function unknown]
Probab=30.35  E-value=2.3e+02  Score=20.98  Aligned_cols=21  Identities=5%  Similarity=0.143  Sum_probs=15.5

Q ss_pred             hhHHHHHHHHHHHHHHHHHHH
Q 007784           96 KEANKIYEELEGYKKKLARAE  116 (590)
Q Consensus        96 ~~l~~L~~~r~~~~~~Le~~~  116 (590)
                      ..|..|.+++..+.+++.++.
T Consensus         5 shl~eL~kkHg~le~ei~ea~   25 (57)
T COG5570           5 SHLAELEKKHGNLEREIQEAM   25 (57)
T ss_pred             HHHHHHHHhhchHHHHHHHHh
Confidence            356778888888888777764


No 84 
>PF11608 Limkain-b1:  Limkain b1;  InterPro: IPR024582 This entry represents a conserved domain found in limkain b1, which is a novel human autoantigen, localised to a subset of ABCD3 and PXF marked peroxisomes. Limkain b1 may be a relatively common target of human autoantibodies reactive to cytoplasmic vesicle-like structures [].; PDB: 2DIU_A.
Probab=30.26  E-value=94  Score=25.63  Aligned_cols=41  Identities=24%  Similarity=0.327  Sum_probs=24.0

Q ss_pred             ccceEEEEecCHHHHHHHHHhcccCC--CCceeeeeCCCCCCe
Q 007784          176 QLGAALVFFTSRVAAASAAQSLHAQL--VDTWTVSDAPESREL  216 (590)
Q Consensus       176 ~~~~AFVtF~s~~~a~~a~q~~~~~~--~~~~~v~~AP~P~DI  216 (590)
                      ..++|.+-|.+++.|..|..-.....  ..+..|...|.+.|.
T Consensus        38 ~~~tAilrF~~~~~A~RA~KRmegEdVfG~kI~v~~~~~~r~~   80 (90)
T PF11608_consen   38 SGGTAILRFPNQEFAERAQKRMEGEDVFGNKISVSFSPKNREF   80 (90)
T ss_dssp             -TT-EEEEESSHHHHHHHHHHHTT--SSSS--EEESS--S---
T ss_pred             eCCEEEEEeCCHHHHHHHHHhhcccccccceEEEEEcCCcccc
Confidence            46899999999999999887665443  345666667766554


No 85 
>KOG0107 consensus Alternative splicing factor SRp20/9G8 (RRM superfamily) [RNA processing and modification]
Probab=30.12  E-value=98  Score=29.11  Aligned_cols=41  Identities=17%  Similarity=0.178  Sum_probs=34.2

Q ss_pred             CcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchh
Q 007784           51 PQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKE   97 (590)
Q Consensus        51 ~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~   97 (590)
                      +.+.-|.|-|+|.+.+    +.+|+.-|..+  |.+.+||++++-..
T Consensus         8 ~~~~kVYVGnL~~~a~----k~eLE~~F~~y--G~lrsvWvArnPPG   48 (195)
T KOG0107|consen    8 NGNTKVYVGNLGSRAT----KRELERAFSKY--GPLRSVWVARNPPG   48 (195)
T ss_pred             CCCceEEeccCCCCcc----hHHHHHHHHhc--CcceeEEEeecCCC
Confidence            3467899999999887    68999999988  67899999997654


No 86 
>KOG0114 consensus Predicted RNA-binding protein (RRM superfamily) [General function prediction only]
Probab=29.73  E-value=49  Score=28.32  Aligned_cols=24  Identities=25%  Similarity=0.369  Sum_probs=21.0

Q ss_pred             cccceEEEEecCHHHHHHHHHhcc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLH  198 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~  198 (590)
                      ...|+|||..++..+|..|+..+.
T Consensus        55 ~TrGTAFVVYedi~dAk~A~dhls   78 (124)
T KOG0114|consen   55 ETRGTAFVVYEDIFDAKKACDHLS   78 (124)
T ss_pred             CcCceEEEEehHhhhHHHHHHHhc
Confidence            357999999999999999998764


No 87 
>KOG0144 consensus RNA-binding protein CUGBP1/BRUNO (RRM superfamily) [RNA processing and modification]
Probab=29.19  E-value=54  Score=35.01  Aligned_cols=27  Identities=30%  Similarity=0.409  Sum_probs=23.6

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccCC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQL  201 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~~  201 (590)
                      ...|++||+|.+.++|..|...+|..+
T Consensus        74 ~s~gcCFv~~~trk~a~~a~~Alhn~k  100 (510)
T KOG0144|consen   74 QSKGCCFVKYYTRKEADEAINALHNQK  100 (510)
T ss_pred             cccceEEEEeccHHHHHHHHHHhhccc
Confidence            568999999999999999998887653


No 88 
>KOG4205 consensus RNA-binding protein musashi/mRNA cleavage and polyadenylation factor I complex, subunit HRP1 [RNA processing and modification]
Probab=28.67  E-value=63  Score=33.43  Aligned_cols=38  Identities=16%  Similarity=0.342  Sum_probs=32.3

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchh
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKE   97 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~   97 (590)
                      ..|.|.+||.+..    ++++++||+++  +.|..+.+.+|...
T Consensus        98 kkiFvGG~~~~~~----e~~~r~yfe~~--g~v~~~~~~~d~~~  135 (311)
T KOG4205|consen   98 KKIFVGGLPPDTT----EEDFKDYFEQF--GKVADVVIMYDKTT  135 (311)
T ss_pred             eEEEecCcCCCCc----hHHHhhhhhcc--ceeEeeEEeecccc
Confidence            4799999999887    69999999997  57888888888754


No 89 
>KOG0105 consensus Alternative splicing factor ASF/SF2 (RRM superfamily) [RNA processing and modification]
Probab=28.45  E-value=62  Score=30.56  Aligned_cols=32  Identities=13%  Similarity=0.257  Sum_probs=25.9

Q ss_pred             cccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEE
Q 007784           52 QQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRS   89 (590)
Q Consensus        52 s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v   89 (590)
                      .+.+|.|-|+|.+++    +.++++.|.++  +.|..|
T Consensus         5 ~~~~iyvGNLP~diR----ekeieDlFyKy--g~i~~i   36 (241)
T KOG0105|consen    5 NSRRIYVGNLPGDIR----EKEIEDLFYKY--GRIREI   36 (241)
T ss_pred             ccceEEecCCCcchh----hccHHHHHhhh--cceEEE
Confidence            468999999999998    58899999987  445544


No 90 
>PF05620 DUF788:  Protein of unknown function (DUF788);  InterPro: IPR008506 This family consists of several eukaryotic proteins of unknown function.
Probab=26.98  E-value=3.6e+02  Score=25.16  Aligned_cols=62  Identities=18%  Similarity=0.146  Sum_probs=31.2

Q ss_pred             HHHHHHHhhheeeecCCCCCccccHHH---------HHHHHHHHHHHHHHHHHHHHhhcccchhhhhHHHH
Q 007784          456 LGWLILRNQALKVYVPAYESYGRMWPH---------MFLRLVAALLLYQITMLGYFGSKKFIYVGFLIPLP  517 (590)
Q Consensus       456 ~~y~v~Ky~llyvy~~~~es~G~~~~~---------~~~~~~~~l~l~q~~~~g~f~lk~~~~~~~~~~l~  517 (590)
                      +.+++--|.+-+.-+|.|+.+|.+-..         +..++.--+++.=++.++...-..++...+++|+-
T Consensus        56 ~~~~~~~~~l~~~~rp~~~~~g~Lv~~G~DL~~~G~l~ey~~Diiylt~~vq~l~~~s~~~w~l~LvIP~y  126 (170)
T PF05620_consen   56 LPAIFCYYFLEKMARPKYDETGELVDAGEDLNQPGGLTEYMFDIIYLTWFVQVLSIISNKFWWLYLVIPGY  126 (170)
T ss_pred             HHHHHHHHHHHHhCCCCcCCCCCeecCcccccCCcchHHHHhHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Confidence            333333445566778888855543222         45555555555555555443333334444445543


No 91 
>COG4605 CeuC ABC-type enterochelin transport system, permease component [Inorganic ion transport and metabolism]
Probab=26.93  E-value=7e+02  Score=25.56  Aligned_cols=80  Identities=20%  Similarity=0.201  Sum_probs=48.8

Q ss_pred             CCCCcccchhHHHH--HHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhhheeeecCCCCCccccHHHHHHHHHHHHHHHHH
Q 007784          419 DLGYGTRVPSDMLI--VTIVFCYSCIAPLIIPFGVVYFALGWLILRNQALKVYVPAYESYGRMWPHMFLRLVAALLLYQI  496 (590)
Q Consensus       419 ~f~~~~~y~~~l~~--~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~llyvy~~~~es~G~~~~~~~~~~~~~l~l~q~  496 (590)
                      ..+.|..|......  ..+++.=|+-.-++-|..++++.+.-+.|-  +..-|+.+|     ..|.+.---..+++-.|.
T Consensus       210 AinLGi~y~k~~~~lL~ivavLvsvSTALVGPitFlGlLvanLay~--~~~tykH~~-----ll~~~ili~~i~L~ggQ~  282 (316)
T COG4605         210 AINLGIDYEKVTKILLLIVAVLVSVSTALVGPITFLGLLVANLAYE--FSKTYKHSY-----LLPAAILIGVIALVGGQF  282 (316)
T ss_pred             HhhcCcchHHHHHHHHHHHHHHHHHHHHHhchHHHHHHHHHHHHHH--Hhcccceee-----hhHHHHHHHHHHHHhhHH
Confidence            35667777654443  345556677788999999999999877654  344444443     445555455555655565


Q ss_pred             HHHHHHhhc
Q 007784          497 TMLGYFGSK  505 (590)
Q Consensus       497 ~~~g~f~lk  505 (590)
                      .+==+|..+
T Consensus       283 vve~Vf~~~  291 (316)
T COG4605         283 VVERVFAFQ  291 (316)
T ss_pred             HHHHHHhcC
Confidence            554444433


No 92 
>PF03208 PRA1:  PRA1 family protein;  InterPro: IPR004895 This family includes yeast hypothetical proteins and the uncharacterised rat prenylated rab acceptor protein PRA1.
Probab=26.55  E-value=2.2e+02  Score=25.79  Aligned_cols=37  Identities=19%  Similarity=0.313  Sum_probs=19.5

Q ss_pred             hHHHHHHHHHHhhhh-hhHHHHHHHHHHHHHHHHHHhh
Q 007784          428 SDMLIVTIVFCYSCI-APLIIPFGVVYFALGWLILRNQ  464 (590)
Q Consensus       428 ~~l~~~~i~l~Ys~i-~Plil~~~~~yf~~~y~v~Ky~  464 (590)
                      +...++++.++++.+ .|..++..++.....+++++.+
T Consensus        43 NY~~i~~~~~~~~ll~~P~~l~~~~~~~~~~~~~~~~~   80 (153)
T PF03208_consen   43 NYLLIFLLLFLIFLLTNPFFLLVLLLVVALWAFIYKSR   80 (153)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHhhhc
Confidence            334444444444443 6876666666666655555443


No 93 
>PLN03121 nucleic acid binding protein; Provisional
Probab=25.99  E-value=1.1e+02  Score=30.47  Aligned_cols=21  Identities=24%  Similarity=0.161  Sum_probs=17.5

Q ss_pred             cccceEEEEecCHHHHHHHHH
Q 007784          175 KQLGAALVFFTSRVAAASAAQ  195 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q  195 (590)
                      ...+.|||+|+++.++..|..
T Consensus        42 et~gfAfVtF~d~~aaetAll   62 (243)
T PLN03121         42 EYACTAYVTFKDAYALETAVL   62 (243)
T ss_pred             CcceEEEEEECCHHHHHHHHh
Confidence            345799999999999988873


No 94 
>PRK11020 hypothetical protein; Provisional
Probab=25.84  E-value=2.7e+02  Score=24.11  Aligned_cols=48  Identities=15%  Similarity=0.315  Sum_probs=28.6

Q ss_pred             hhHHHHHHHHHHHHHHHHHHHHHHhhcccCCCCCCCCCcccccccCCCCccccHHHHHHHHHHHHHHHHHHHHh
Q 007784           96 KEANKIYEELEGYKKKLARAEAVYAESKSAGKPEGTRPTIKTGFLGLLGKRVDAIEYYNEKIKEIIPKLEAEQK  169 (590)
Q Consensus        96 ~~l~~L~~~r~~~~~~Le~~~~~~~~~k~~~~~~~~rP~~~~~~~~~~g~kvd~i~~~~~~l~~l~~~I~~~~~  169 (590)
                      .+|..|.++.+++.+++..+..+                         | ..+-+..+++|++.++.+|+..+.
T Consensus         5 ~Eiq~L~drLD~~~~Klaaa~~r-------------------------g-d~~~i~qf~~E~~~l~k~I~~lk~   52 (118)
T PRK11020          5 NEIKRLSDRLDAIRHKLAAASLR-------------------------G-DAEKYAQFEKEKATLEAEIARLKE   52 (118)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHhc-------------------------C-CHHHHHHHHHHHHHHHHHHHHHHH
Confidence            35666666777776666665431                         1 112345567777888887776543


No 95 
>KOG0125 consensus Ataxin 2-binding protein (RRM superfamily) [General function prediction only]
Probab=25.09  E-value=64  Score=33.24  Aligned_cols=50  Identities=20%  Similarity=0.174  Sum_probs=34.2

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccCCC--Cceee----------eeCCCCCCeeeCCcCcc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQLV--DTWTV----------SDAPESRELIWNNLNIK  224 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~~~--~~~~v----------~~AP~P~DI~W~NL~~~  224 (590)
                      ...|-+||||++..+|..|.+.+|....  .+..|          +.-|-|.-.-|.++...
T Consensus       134 GSKGFGFVTmen~~dadRARa~LHgt~VEGRkIEVn~ATarV~n~K~~v~p~~~g~~~~~a~  195 (376)
T KOG0125|consen  134 GSKGFGFVTMENPADADRARAELHGTVVEGRKIEVNNATARVHNKKKKVLPYPNGWKLLPAV  195 (376)
T ss_pred             CCCccceEEecChhhHHHHHHHhhcceeeceEEEEeccchhhccCCcccCCCccccccccch
Confidence            3578899999999999999999886421  11111          22345555668877654


No 96 
>PLN03213 repressor of silencing 3; Provisional
Probab=24.89  E-value=1.1e+02  Score=33.22  Aligned_cols=38  Identities=13%  Similarity=0.107  Sum_probs=32.9

Q ss_pred             CcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEecc
Q 007784           51 PQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTN   94 (590)
Q Consensus        51 ~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d   94 (590)
                      .+-.+|.|-||+.++.    ++.|++.|.++  |+|.+|.++++
T Consensus         8 ~~gMRIYVGNLSydVT----EDDLravFSeF--GsVkdVEIpRE   45 (759)
T PLN03213          8 GGGVRLHVGGLGESVG----RDDLLKIFSPM--GTVDAVEFVRT   45 (759)
T ss_pred             CcceEEEEeCCCCCCC----HHHHHHHHHhc--CCeeEEEEecc
Confidence            3457999999999887    69999999998  88999998864


No 97 
>PF15159 PIG-Y:  Phosphatidylinositol N-acetylglucosaminyltransferase subunit Y
Probab=24.81  E-value=66  Score=25.60  Aligned_cols=26  Identities=31%  Similarity=0.738  Sum_probs=23.6

Q ss_pred             HhhhhhhHHHHHHHHHHHHHHHHHHh
Q 007784          438 CYSCIAPLIIPFGVVYFALGWLILRN  463 (590)
Q Consensus       438 ~Ys~i~Plil~~~~~yf~~~y~v~Ky  463 (590)
                      -|+.+.|+.+|...++-...|+.+|+
T Consensus        43 yY~lLvPl~iPv~~~~vy~nWls~k~   68 (72)
T PF15159_consen   43 YYCLLVPLTIPVTIVFVYFNWLSWKF   68 (72)
T ss_pred             ceeeehhhhhhHHHHHHHHHHHhHHH
Confidence            57999999999999999999998886


No 98 
>PF04059 RRM_2:  RNA recognition motif 2;  InterPro: IPR007201 This RNA recognition motif 2 is found in Meiosis protein mei2. It is found C-terminal to the RNA-binding region RNP-1 (IPR000504 from INTERPRO).
Probab=24.59  E-value=78  Score=26.77  Aligned_cols=26  Identities=35%  Similarity=0.353  Sum_probs=22.0

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccC
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQ  200 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~  200 (590)
                      ...|.|||.|.+.++|....+..+..
T Consensus        43 ~N~GYAFVNf~~~~~~~~F~~~f~g~   68 (97)
T PF04059_consen   43 CNLGYAFVNFTSPQAAIRFYKAFNGK   68 (97)
T ss_pred             CceEEEEEEcCCHHHHHHHHHHHcCC
Confidence            35899999999999999988877643


No 99 
>KOG0105 consensus Alternative splicing factor ASF/SF2 (RRM superfamily) [RNA processing and modification]
Probab=24.32  E-value=1.3e+02  Score=28.52  Aligned_cols=29  Identities=17%  Similarity=0.326  Sum_probs=24.1

Q ss_pred             CCCcccEEEEcCCCCCCCCCChHHHHHHHHhhh
Q 007784           49 VRPQQFAVLVRDLPDLPKGQSRKEQVDSYFKAI   81 (590)
Q Consensus        49 ~~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~   81 (590)
                      .+-|+|-|+|+++|.+-.    =+.|++|+.+.
T Consensus       111 srrSe~RVvVsGLp~SgS----WQDLKDHmRea  139 (241)
T KOG0105|consen  111 SRRSEYRVVVSGLPPSGS----WQDLKDHMREA  139 (241)
T ss_pred             ccccceeEEEecCCCCCc----hHHHHHHHHhh
Confidence            456889999999998754    58899999986


No 100
>KOG0131 consensus Splicing factor 3b, subunit 4 [RNA processing and modification]
Probab=24.23  E-value=69  Score=30.28  Aligned_cols=40  Identities=15%  Similarity=0.174  Sum_probs=32.6

Q ss_pred             CCcccEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           50 RPQQFAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        50 ~~s~yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      +.+|-||.|.|||...+    ++.|.+.|-+.  |.|+++++.+|.
T Consensus         6 rnqd~tiyvgnld~kvs----~~~l~EL~iqa--gpVv~i~iPkDr   45 (203)
T KOG0131|consen    6 RNQDATLYVGNLDEKVS----EELLYELFIQA--GPVVNLHIPKDR   45 (203)
T ss_pred             cCCCceEEEecCCHHHH----HHHHHHHHHhc--Cceeeeecchhh
Confidence            56789999999998776    68899999887  558888887763


No 101
>KOG0071 consensus GTP-binding ADP-ribosylation factor Arf6 (dArf3) [Intracellular trafficking, secretion, and vesicular transport]
Probab=24.06  E-value=1.3e+02  Score=27.40  Aligned_cols=60  Identities=10%  Similarity=0.170  Sum_probs=42.7

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccchhHHHHHHHHHHHHHHHHH
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNNKEANKIYEELEGYKKKLAR  114 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~~~l~~L~~~r~~~~~~Le~  114 (590)
                      -||--+|+--++.+-...+.|+.+.+++|+|+ ..+.++.|..+-+.+.+.|+++-+-+.+
T Consensus        54 etVtykN~kfNvwdvGGqd~iRplWrhYy~gt-qglIFV~Dsa~~dr~eeAr~ELh~ii~~  113 (180)
T KOG0071|consen   54 ETVTYKNVKFNVWDVGGQDKIRPLWRHYYTGT-QGLIFVVDSADRDRIEEARNELHRIIND  113 (180)
T ss_pred             EEEEeeeeEEeeeeccCchhhhHHHHhhccCC-ceEEEEEeccchhhHHHHHHHHHHHhCC
Confidence            36666777655554444788999999999985 5677888887767777777766554443


No 102
>KOG0153 consensus Predicted RNA-binding protein (RRM superfamily) [General function prediction only]
Probab=23.96  E-value=79  Score=32.85  Aligned_cols=45  Identities=22%  Similarity=0.092  Sum_probs=31.5

Q ss_pred             cccceEEEEecCHHHHHHHHHhcccC---CCCceeeeeCCCCCCeeeCCcCcc
Q 007784          175 KQLGAALVFFTSRVAAASAAQSLHAQ---LVDTWTVSDAPESRELIWNNLNIK  224 (590)
Q Consensus       175 ~~~~~AFVtF~s~~~a~~a~q~~~~~---~~~~~~v~~AP~P~DI~W~NL~~~  224 (590)
                      ...++|||+|.+..+|..|+....+.   +..++.+..++.     |.....+
T Consensus       262 ~~~~CAFv~ftTR~aAE~Aae~~~n~lvI~G~Rl~i~Wg~~-----~~~a~~g  309 (377)
T KOG0153|consen  262 PRKGCAFVTFTTREAAEKAAEKSFNKLVINGFRLKIKWGRP-----KQAAQGG  309 (377)
T ss_pred             cccccceeeehhhHHHHHHHHhhcceeeecceEEEEEeCCC-----cccccCC
Confidence            45679999999999999998765442   345566666654     5544444


No 103
>KOG0108 consensus mRNA cleavage and polyadenylation factor I complex, subunit RNA15 [RNA processing and modification]
Probab=23.77  E-value=76  Score=34.47  Aligned_cols=36  Identities=22%  Similarity=0.284  Sum_probs=31.8

Q ss_pred             cEEEEcCCCCCCCCCChHHHHHHHHhhhCCCceeEEEEeccc
Q 007784           54 FAVLVRDLPDLPKGQSRKEQVDSYFKAIYPDTFYRSMVVTNN   95 (590)
Q Consensus        54 yTVlV~~IP~~~~~~~~~~~L~~~F~~~~p~~v~~v~~~~d~   95 (590)
                      ++|.|.|||.+..    +++|.+.|.+.  |.|.++.+++|-
T Consensus        19 ~~v~vgnip~~~s----e~~l~~~~~~~--g~v~s~~~v~D~   54 (435)
T KOG0108|consen   19 SSVFVGNIPYEGS----EEQLLSIFSGV--GPVLSFRLVYDR   54 (435)
T ss_pred             cceEecCCCCccc----HHHHHHHHhcc--Cccceeeecccc
Confidence            8999999999886    69999999987  678899988874


No 104
>KOG0718 consensus Molecular chaperone (DnaJ superfamily) [Posttranslational modification, protein turnover, chaperones]
Probab=23.57  E-value=4.9e+02  Score=28.52  Aligned_cols=33  Identities=21%  Similarity=0.439  Sum_probs=21.2

Q ss_pred             HHHHHHHhhhhhhHHHHHHHHHHHHHHHHHHhh
Q 007784          432 IVTIVFCYSCIAPLIIPFGVVYFALGWLILRNQ  464 (590)
Q Consensus       432 ~~~i~l~Ys~i~Plil~~~~~yf~~~y~v~Ky~  464 (590)
                      ..-.+++|+.+.|++..|++==|++.=+--|.+
T Consensus       372 ~~p~avfya~v~P~~s~F~l~k~v~rP~~~~~k  404 (546)
T KOG0718|consen  372 LLPSAVFYALVFPITSYFGLKKFVLRPYLLKRK  404 (546)
T ss_pred             hhhhhhhhhhhHHHHHHHHHHHHeecHHHHhhH
Confidence            445667888888888777666665554444433


No 105
>PF11945 WASH_WAHD:  WAHD domain of WASH complex;  InterPro: IPR021854 This entry represents a component of the WASH complex. The WASH complex is present at the surface of endosomes and recruits and activates the Arp2/3 complex to induce actin polymerisation. The WASH complex plays a key role in the fission of tubules that serve as transport intermediates during endosome sorting []. The WASH complex's subunit structure: F-actin-capping protein subunit alpha (CAPZA1, CAPZA2 or CAPZA3), F-actin-capping protein subunit beta (CAPZB), WASH (WASH1, WASH2P, WASH3P, WASH4P, WASH5P or WASH6P), FAM21 (FAM21A, FAM21B or FAM21C), KIAA1033, KIAA0196 (strumpellin) and CCDC53. This entry represents the WASH subunit of the WASH complex. WASH genes duplicated to multiple chromosomal ends during primate evolution, with highest copy number reached in humans, whose WASH repertoires probably vary extensively among individuals []. It is therefore difficult to determine which gene is functional or not. The telomeric region of chromosome 9p is paralogous to the pericentromeric regions of chromosome 9 as well as to 2q. Paralogous regions contain 7 transcriptional units. Duplicated WASH genes are also present in the Xq/Yq pseudoautosomal region, as well as on chromosome 1 and 15. The chromosome 16 copy seems to be a pseudogene.
Probab=22.25  E-value=2.9e+02  Score=28.50  Aligned_cols=39  Identities=21%  Similarity=0.280  Sum_probs=30.5

Q ss_pred             HHHHHHHHHHHHHHHHHHHHhhhhhccccceEEEEecCH
Q 007784          149 AIEYYNEKIKEIIPKLEAEQKITLKEKQLGAALVFFTSR  187 (590)
Q Consensus       149 ~i~~~~~~l~~l~~~I~~~~~~~~~~~~~~~AFVtF~s~  187 (590)
                      .++..+++++.++++|+..|+++.+-+.+..|.+.|.+.
T Consensus        44 Rv~~~~~~l~~i~~Ri~~~qaKi~~l~gs~kAi~vfs~a   82 (297)
T PF11945_consen   44 RVERNRERLQAIQQRIEVAQAKIEKLQGSKKAITVFSPA   82 (297)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHHHHHhCCCccEEEeCcc
Confidence            356677888888888888888776666778899999875


No 106
>PF08946 Osmo_CC:  Osmosensory transporter coiled coil;  InterPro: IPR015041 The osmosensory transporter coiled coil is a C-terminal domain found in various bacterial osmoprotective transporters, such as ProP, Proline/betaine transporter, Proline permease 2 and the citrate proton symporters. It adopts an antiparallel coiled-coil structure, and is essential for osmosensory and osmoprotectant transporter function []. ; PDB: 1R48_B.
Probab=21.53  E-value=1.2e+02  Score=21.78  Aligned_cols=19  Identities=16%  Similarity=0.212  Sum_probs=13.8

Q ss_pred             HHHHHHHHHHHHHHHHHhh
Q 007784          152 YYNEKIKEIIPKLEAEQKI  170 (590)
Q Consensus       152 ~~~~~l~~l~~~I~~~~~~  170 (590)
                      +.+++++.++++|.+++++
T Consensus        16 ~IEqkiedid~qIaeLe~K   34 (46)
T PF08946_consen   16 NIEQKIEDIDEQIAELEAK   34 (46)
T ss_dssp             HHHHHHHHHHHHHHHHHHH
T ss_pred             hHHHhHHHHHHHHHHHHHH
Confidence            3457888888888876654


No 107
>COG5438 Predicted multitransmembrane protein [Function unknown]
Probab=21.21  E-value=7.4e+02  Score=26.34  Aligned_cols=59  Identities=12%  Similarity=0.180  Sum_probs=40.2

Q ss_pred             HhHhHHHHHHHHHHHHHHHHHHHHhccCCCchhHHHHHHHHHHHHHHHHHHHHHHhhhh
Q 007784          283 EAYLPQIALIVFLALLPKLLLFLSKTEGIPAVSHAVRAASGKYFYFTVLNVFIGVTVGG  341 (590)
Q Consensus       283 ~~~lp~l~l~i~n~llp~ii~~ls~~e~~~s~S~~~~s~~~k~f~f~~vn~~lv~~l~~  341 (590)
                      ..+..+++..++..++-.+.-++++.+|.......+.....+.--.-+-+.++..++.|
T Consensus       206 ~A~~~Ti~~~~ls~il~~~~i~~~~l~G~~~E~~~~l~~~~~~v~i~~~~~~~~~viIg  264 (385)
T COG5438         206 AAFIGTILGTLLSIILAYISIYMTNLSGFGDEDLDELTYLSKNVGINFSGLFLAGVIIG  264 (385)
T ss_pred             HHHHHHHHHHHHHHHHHHHHHHhccCCCcchhhhHHHhcCCcccCcchhhhHHHHHHHH
Confidence            34445566666777788888999999999888887777766664444444555544443


No 108
>KOG4212 consensus RNA-binding protein hnRNP-M [RNA processing and modification]
Probab=20.63  E-value=1.8e+02  Score=31.18  Aligned_cols=40  Identities=20%  Similarity=0.182  Sum_probs=30.0

Q ss_pred             hccccceEEEEecCHHHHHHHHHhcccC--CCCceeeeeCCC
Q 007784          173 KEKQLGAALVFFTSRVAAASAAQSLHAQ--LVDTWTVSDAPE  212 (590)
Q Consensus       173 ~~~~~~~AFVtF~s~~~a~~a~q~~~~~--~~~~~~v~~AP~  212 (590)
                      +.|..++|.|.|++++.++.|+..+...  +...+.|++-|+
T Consensus        82 ~GK~rGcavVEFk~~E~~qKa~E~lnk~~~~GR~l~vKEd~d  123 (608)
T KOG4212|consen   82 SGKARGCAVVEFKDPENVQKALEKLNKYEVNGRELVVKEDHD  123 (608)
T ss_pred             CCCcCCceEEEeeCHHHHHHHHHHhhhccccCceEEEeccCc
Confidence            4578999999999999999999887543  334455655543


Done!