Query         003510
Match_columns 814
No_of_seqs    625 out of 2787
Neff          7.8 
Searched_HMMs 46136
Date          Fri Mar 29 00:48:32 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/003510.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/003510hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG1080 Histone H3 (Lys4) meth 100.0   3E-65 6.5E-70  602.2  26.2  506  255-790   480-1005(1005)
  2 KOG0956 PHD finger protein AF1 100.0 4.2E-40 9.1E-45  359.8   5.0  168  351-532     6-182 (900)
  3 KOG0954 PHD finger protein [Ge 100.0   4E-39 8.6E-44  355.5   6.5  208  301-534   232-440 (893)
  4 COG5141 PHD zinc finger-contai 100.0 2.2E-38 4.8E-43  334.8   6.1  192  335-537   177-369 (669)
  5 KOG4442 Clathrin coat binding  100.0 1.1E-36 2.4E-41  337.7  14.7  164  635-799   105-269 (729)
  6 KOG0955 PHD finger protein BR1 100.0 2.6E-36 5.5E-41  356.9   8.7  178  349-533   218-396 (1051)
  7 KOG0957 PHD finger protein [Ge 100.0 2.6E-31 5.7E-36  281.7   5.5  169  351-534   120-302 (707)
  8 KOG1079 Transcriptional repres  99.9 7.3E-28 1.6E-32  265.8   9.8  167  601-772   532-713 (739)
  9 PF13832 zf-HC5HC2H_2:  PHD-zin  99.9 2.7E-25 5.9E-30  204.3   6.5  109  408-530     2-110 (110)
 10 cd05834 HDGF_related The PWWP   99.9 2.4E-24 5.1E-29  185.4   8.0   81   35-124     2-82  (83)
 11 cd05836 N_Pac_NP60 The PWWP do  99.9 2.1E-24 4.6E-29  187.2   7.3   86   36-126     1-86  (86)
 12 cd05840 SPBC215_ISWI_like The   99.9 1.8E-23 3.9E-28  183.8   6.6   88   36-124     1-92  (93)
 13 cd05838 WHSC1_related The PWWP  99.9   3E-23 6.6E-28  183.7   7.8   91   36-127     1-93  (95)
 14 KOG1082 Histone H3 (Lys9) meth  99.9   3E-23 6.5E-28  229.6   8.1  160  635-794   161-358 (364)
 15 cd05835 Dnmt3b_related The PWW  99.9 8.1E-23 1.8E-27  178.2   6.4   84   36-125     1-86  (87)
 16 smart00317 SET SET (Su(var)3-9  99.9 9.7E-22 2.1E-26  181.7  13.7  115  652-767     2-116 (116)
 17 cd05841 BS69_related The PWWP   99.9 1.3E-22 2.7E-27  172.2   6.9   75   36-124     7-82  (83)
 18 cd05162 PWWP The PWWP domain,   99.9 1.9E-22 4.1E-27  177.1   8.1   86   36-124     1-86  (87)
 19 PF00855 PWWP:  PWWP domain;  I  99.8 8.4E-22 1.8E-26  172.9   3.9   84   36-125     1-86  (86)
 20 smart00293 PWWP domain with co  99.8 7.5E-21 1.6E-25  155.7   6.4   63   36-99      1-63  (63)
 21 KOG1085 Predicted methyltransf  99.8 9.5E-20   2E-24  182.8   9.9  121  649-770   255-379 (392)
 22 cd05837 MSH6_like The PWWP dom  99.8 1.4E-19   3E-24  165.0   8.1   67   35-101     2-70  (110)
 23 KOG1083 Putative transcription  99.8 2.4E-20 5.2E-25  213.8   3.5  133  639-773  1166-1299(1306)
 24 cd06080 MUM1_like Mutated mela  99.7 7.5E-18 1.6E-22  142.3   5.8   76   36-123     1-77  (80)
 25 cd05839 BR140_related The PWWP  99.7 1.7E-17 3.7E-22  148.7   7.6   88   36-123     1-105 (111)
 26 PF05964 FYRN:  F/Y-rich N-term  99.7 9.3E-18   2E-22  132.2   4.9   54  184-237     1-54  (54)
 27 PF13771 zf-HC5HC2H:  PHD-like   99.6 1.5E-16 3.2E-21  140.9   4.2   88  429-531     1-90  (90)
 28 PF05965 FYRC:  F/Y rich C-term  99.6 2.8E-16   6E-21  137.5   4.6   80  244-328     3-84  (86)
 29 smart00542 FYRC "FY-rich" doma  99.6 4.4E-16 9.5E-21  135.4   5.6   80  246-330     1-82  (86)
 30 COG2940 Proteins containing SE  99.6   2E-16 4.4E-21  182.0   1.3  140  649-790   331-480 (480)
 31 KOG1141 Predicted histone meth  99.5 1.2E-14 2.7E-19  163.1   6.4   76  714-789  1179-1261(1262)
 32 KOG1904 Transcription coactiva  99.5 1.7E-14 3.6E-19  160.3   6.8   89   33-128    10-100 (496)
 33 PF00856 SET:  SET domain;  Int  99.4 1.8E-13 3.9E-18  133.2   7.5  108  661-768     1-162 (162)
 34 smart00541 FYRN "FY-rich" doma  99.4 3.6E-13 7.8E-18  100.6   4.4   41  195-235     2-42  (44)
 35 PF13831 PHD_2:  PHD-finger; PD  99.2 4.7E-12   1E-16   90.5   0.5   36  364-399     1-36  (36)
 36 KOG2589 Histone tail methylase  98.9 1.2E-09 2.7E-14  114.3   5.7  115  659-781   136-251 (453)
 37 KOG1081 Transcription factor N  98.8   1E-09 2.2E-14  124.3   1.9  125  665-796   319-443 (463)
 38 PF00628 PHD:  PHD-finger;  Int  97.7 1.1E-05 2.4E-10   63.0   0.6   45  352-399     1-49  (51)
 39 smart00249 PHD PHD zinc finger  97.6   5E-05 1.1E-09   57.7   3.2   45  352-398     1-47  (47)
 40 KOG2461 Transcription factor B  97.6 6.1E-05 1.3E-09   83.8   4.7  110  648-771    26-146 (396)
 41 KOG4323 Polycomb-like PHD Zn-f  97.2 0.00033 7.2E-09   78.0   4.4  117  350-495    83-203 (464)
 42 KOG4323 Polycomb-like PHD Zn-f  97.0 0.00043 9.4E-09   77.1   3.2   52  351-402   169-225 (464)
 43 KOG1084 Transcription factor T  97.0 0.00037   8E-09   77.4   2.2  114  376-497   192-306 (375)
 44 PF15446 zf-PHD-like:  PHD/FYVE  96.8   0.001 2.2E-08   63.8   3.8   69  352-420     1-85  (175)
 45 KOG1081 Transcription factor N  96.8 0.00052 1.1E-08   78.4   2.2   56   33-98    133-188 (463)
 46 KOG1244 Predicted transcriptio  96.6 0.00088 1.9E-08   68.3   1.8   50  349-401   280-331 (336)
 47 KOG1512 PHD Zn-finger protein   96.5  0.0007 1.5E-08   69.4   0.1   58  336-396   300-357 (381)
 48 smart00508 PostSET Cysteine-ri  96.3  0.0019 4.1E-08   42.4   1.4   19  775-793     2-20  (26)
 49 KOG0825 PHD Zn-finger protein   94.7   0.015 3.3E-07   67.4   1.8   49  349-400   214-265 (1134)
 50 KOG4299 PHD Zn-finger protein   94.1   0.018 3.9E-07   66.0   0.8   48  351-401   254-305 (613)
 51 COG5034 TNG2 Chromatin remodel  93.0   0.064 1.4E-06   54.9   2.5   52  344-400   215-269 (271)
 52 PF14446 Prok-RING_1:  Prokaryo  92.9   0.067 1.5E-06   41.8   1.9   33  349-382     4-36  (54)
 53 KOG1973 Chromatin remodeling p  92.8   0.061 1.3E-06   57.6   2.2   37  365-402   230-269 (274)
 54 PF08169 RBB1NT:  RBB1NT (NUC16  92.3    0.23   5E-06   43.7   4.7   85   38-132     8-94  (96)
 55 PF11717 Tudor-knot:  RNA bindi  91.7    0.19 4.2E-06   39.8   3.3   52   36-96      1-54  (55)
 56 smart00249 PHD PHD zinc finger  90.7    0.14 2.9E-06   38.4   1.5   30  464-495     1-32  (47)
 57 smart00743 Agenet Tudor-like d  90.0    0.38 8.3E-06   38.8   3.7   53   35-99      2-57  (61)
 58 smart00333 TUDOR Tudor domain.  89.4     0.5 1.1E-05   37.4   3.9   54   35-100     2-55  (57)
 59 KOG1141 Predicted histone meth  88.5    0.45 9.7E-06   56.1   4.1   57  636-692   785-841 (1262)
 60 KOG0383 Predicted helicase [Ge  88.4     0.2 4.4E-06   59.5   1.3   49  346-400    43-93  (696)
 61 PF15057 DUF4537:  Domain of un  87.2    0.79 1.7E-05   42.9   4.3   72   19-100    41-114 (124)
 62 PF00628 PHD:  PHD-finger;  Int  85.4    0.41 8.9E-06   37.0   1.2   29  465-495     2-32  (51)
 63 KOG0957 PHD finger protein [Ge  84.8    0.71 1.5E-05   51.5   3.0   48  349-398   543-595 (707)
 64 KOG1473 Nucleosome remodeling   84.0    0.95 2.1E-05   55.4   3.8  110  351-493   345-458 (1414)
 65 PF07649 C1_3:  C1-like domain;  83.3     0.5 1.1E-05   32.4   0.7   28  352-381     2-29  (30)
 66 KOG1044 Actin-binding LIM Zn-f  83.1    0.46 9.9E-06   54.1   0.7   38  457-498   187-225 (670)
 67 KOG1512 PHD Zn-finger protein   82.7    0.75 1.6E-05   47.8   2.0   49  351-399   259-315 (381)
 68 KOG2084 Predicted histone tail  82.1     2.1 4.5E-05   49.5   5.7   40  727-770   208-248 (482)
 69 cd04508 TUDOR Tudor domains ar  80.9     1.8   4E-05   32.8   3.2   47   39-97      1-48  (48)
 70 PF00130 C1_1:  Phorbol esters/  80.2     1.7 3.7E-05   33.9   2.9   36  350-385    11-46  (53)
 71 KOG1973 Chromatin remodeling p  79.8    0.82 1.8E-05   49.0   1.2   29  464-492   221-250 (274)
 72 PF03107 C1_2:  C1 domain;  Int  77.8     1.6 3.4E-05   30.0   1.7   28  352-381     2-29  (30)
 73 cd00029 C1 Protein kinase C co  77.7     1.1 2.4E-05   34.2   1.1   34  351-384    12-45  (50)
 74 PF11793 FANCL_C:  FANCL C-term  76.7     1.7 3.7E-05   36.3   2.0   33  351-383     3-38  (70)
 75 KOG1245 Chromatin remodeling c  75.6    0.74 1.6E-05   59.5  -0.7   50  350-402  1108-1159(1404)
 76 KOG1244 Predicted transcriptio  71.5     2.3 4.9E-05   44.2   1.8   50  351-400   225-283 (336)
 77 KOG1337 N-methyltransferase [G  71.2     2.8   6E-05   48.8   2.7   40  727-769   239-278 (472)
 78 smart00109 C1 Protein kinase C  70.1     1.9 4.1E-05   32.6   0.7   33  350-383    11-43  (49)
 79 PF02318 FYVE_2:  FYVE-type zin  66.9     4.5 9.8E-05   37.5   2.6   49  350-400    54-102 (118)
 80 PF05502 Dynactin_p62:  Dynacti  65.0     4.6 9.9E-05   46.9   2.7   82  366-470     4-94  (483)
 81 PF14569 zf-UDP:  Zinc-binding   62.3     3.5 7.6E-05   34.7   0.8   49  350-400     9-59  (80)
 82 PHA02862 5L protein; Provision  61.1     3.1 6.8E-05   39.3   0.4   50  351-416     3-52  (156)
 83 PF11764 N-SET:  COMPASS (Compl  60.1     2.2 4.8E-05   42.2  -0.8   16  557-572    78-93  (167)
 84 PF13901 DUF4206:  Domain of un  59.8     6.1 0.00013   40.4   2.3   42  351-400   153-197 (202)
 85 COG5475 Uncharacterized small   56.2      26 0.00056   27.6   4.5   51   35-100     4-56  (60)
 86 KOG4443 Putative transcription  55.5     5.8 0.00013   46.4   1.4   46  351-399    69-116 (694)
 87 COG5034 TNG2 Chromatin remodel  55.3     9.1  0.0002   39.7   2.6   40  453-492   211-252 (271)
 88 PF08746 zf-RING-like:  RING-li  54.8     5.7 0.00012   29.8   0.8   30  465-494     1-30  (43)
 89 PF14446 Prok-RING_1:  Prokaryo  53.8      11 0.00023   29.8   2.2   35  463-499     6-43  (54)
 90 cd04718 BAH_plant_2 BAH, or Br  53.6     8.7 0.00019   36.9   2.0   26  376-402     1-28  (148)
 91 KOG4443 Putative transcription  53.1     5.2 0.00011   46.8   0.5   48  351-399    19-69  (694)
 92 PF12906 RINGv:  RING-variant d  51.7     4.9 0.00011   30.8  -0.0   30  353-383     1-33  (47)
 93 PF10447 EXOSC1:  Exosome compo  51.1      11 0.00024   32.5   2.1   13   34-46     67-79  (82)
 94 KOG2041 WD40 repeat protein [G  51.0      11 0.00024   44.4   2.7   75  335-414  1103-1182(1189)
 95 PLN00104 MYST -like histone ac  50.4      21 0.00046   40.6   4.7   60   32-96     50-112 (450)
 96 PF07649 C1_3:  C1-like domain;  49.7     7.9 0.00017   26.4   0.8   27  464-492     2-30  (30)
 97 PF09926 DUF2158:  Uncharacteri  49.6      33 0.00071   27.0   4.3   41   36-86      1-41  (53)
 98 KOG3799 Rab3 effector RIM1 and  49.5     8.2 0.00018   35.9   1.1   52  348-400    63-115 (169)
 99 PLN02400 cellulose synthase     49.0      14 0.00031   46.2   3.3   50  350-401    36-87  (1085)
100 cd04712 BAH_DCM_I BAH, or Brom  48.7      17 0.00037   34.3   3.2   49   33-86      3-60  (130)
101 KOG0955 PHD finger protein BR1  45.7      16 0.00035   45.9   3.1   64   36-99    943-1025(1051)
102 PLN02638 cellulose synthase A   42.8      17 0.00038   45.5   2.8   50  350-401    17-68  (1079)
103 PLN02436 cellulose synthase A   41.8      19 0.00041   45.1   2.9   50  350-401    36-87  (1094)
104 PF07227 DUF1423:  Protein of u  41.6      13 0.00027   42.0   1.3   13  424-436   152-164 (446)
105 PF10080 DUF2318:  Predicted me  40.4      13 0.00028   33.5   0.9   33  351-383    36-68  (102)
106 COG5194 APC11 Component of SCF  40.3     9.8 0.00021   32.2   0.1   32  463-494    21-65  (88)
107 PF13639 zf-RING_2:  Ring finge  39.3      14  0.0003   27.5   0.8   31  351-383     1-31  (44)
108 PF11781 RRN7:  RNA polymerase   39.1      21 0.00045   25.7   1.6   26  351-376     9-34  (36)
109 smart00744 RINGv The RING-vari  38.3      13 0.00029   28.6   0.6   31  352-383     1-34  (49)
110 smart00547 ZnF_RBZ Zinc finger  37.5      19  0.0004   23.5   1.1   23  392-414     2-24  (26)
111 KOG0825 PHD Zn-finger protein   36.9      15 0.00033   43.7   1.0   30  463-494   216-248 (1134)
112 PF08666 SAF:  SAF domain;  Int  36.5      22 0.00048   28.4   1.7   16  750-765     3-18  (63)
113 PLN02915 cellulose synthase A   36.1      21 0.00045   44.6   2.0   49  350-400    15-65  (1044)
114 PLN02195 cellulose synthase A   34.6      23 0.00049   44.0   2.0   48  351-400     7-56  (977)
115 PF05641 Agenet:  Agenet domain  34.3      41 0.00088   27.8   2.9   52   36-99      1-64  (68)
116 PLN02189 cellulose synthase     34.1      23 0.00051   44.2   2.0   50  350-401    34-85  (1040)
117 PF12773 DZR:  Double zinc ribb  33.1      36 0.00077   26.0   2.2   38  367-412    12-49  (50)
118 PF11793 FANCL_C:  FANCL C-term  32.2      20 0.00043   29.9   0.7   32  463-494     3-39  (70)
119 KOG0954 PHD finger protein [Ge  31.8      29 0.00063   41.3   2.2   34  464-499   325-359 (893)
120 cd04370 BAH BAH, or Bromo Adja  31.3      52  0.0011   29.9   3.5   43   34-84      2-48  (123)
121 PF00641 zf-RanBP:  Zn-finger i  31.0      14 0.00031   25.1  -0.3   24  391-414     3-26  (30)
122 PF07227 DUF1423:  Protein of u  31.0      35 0.00076   38.6   2.6   31  352-382   130-161 (446)
123 PF12861 zf-Apc11:  Anaphase-pr  29.8      27 0.00059   30.3   1.2   34  349-383    20-62  (85)
124 PF13771 zf-HC5HC2H:  PHD-like   29.8      42 0.00092   29.0   2.5   35  406-440    36-73  (90)
125 KOG0782 Predicted diacylglycer  29.8      15 0.00033   42.1  -0.5   20  367-386   199-218 (1004)
126 PF02452 PemK:  PemK-like prote  29.7      93   0.002   27.6   4.8   68   37-104     1-88  (110)
127 KOG0696 Serine/threonine prote  29.6      22 0.00047   39.8   0.6   85  349-442    55-162 (683)
128 KOG3409 Exosomal 3'-5' exoribo  29.6      32 0.00069   33.7   1.7   14   33-46    120-133 (193)
129 KOG0383 Predicted helicase [Ge  29.6      28 0.00062   41.9   1.7   31  463-496    48-78  (696)
130 KOG4299 PHD Zn-finger protein   29.2      19 0.00042   42.1   0.2   46  350-400    47-94  (613)
131 PF11302 DUF3104:  Protein of u  27.9 1.4E+02   0.003   25.3   4.9   57   36-97      6-69  (75)
132 PF13832 zf-HC5HC2H_2:  PHD-zin  27.8      34 0.00073   31.0   1.5   29  350-382    55-85  (110)
133 smart00109 C1 Protein kinase C  26.7      33 0.00071   25.6   1.0   32  463-496    12-46  (49)
134 KOG2807 RNA polymerase II tran  24.5      42 0.00092   36.2   1.7   88  387-494   271-362 (378)
135 PF10367 Vps39_2:  Vacuolar sor  24.4      54  0.0012   29.2   2.2   31  349-382    77-107 (109)
136 PF04810 zf-Sec23_Sec24:  Sec23  23.8      43 0.00093   24.6   1.1   31  367-400     2-32  (40)
137 cd05791 S1_CSL4 S1_CSL4: CSL4,  23.5      48   0.001   29.2   1.6   16   35-50     60-75  (92)
138 KOG4477 RING1 interactor RYBP   23.5      38 0.00082   33.4   1.0   32  390-421    22-53  (228)
139 PF10367 Vps39_2:  Vacuolar sor  23.4      33 0.00071   30.7   0.6   31  463-494    79-109 (109)
140 PF09465 LBR_tudor:  Lamin-B re  22.8 1.2E+02  0.0026   24.1   3.4   25   34-58      4-29  (55)
141 cd04721 BAH_plant_1 BAH, or Br  22.8      86  0.0019   29.6   3.3   52   33-92      5-58  (130)
142 cd00029 C1 Protein kinase C co  22.7      47   0.001   25.0   1.2   32  463-496    12-47  (50)
143 COG5175 MOT2 Transcriptional r  22.6      28 0.00061   37.5  -0.1   51  346-400    10-61  (480)
144 KOG2752 Uncharacterized conser  22.2   1E+02  0.0023   33.2   4.0  113  351-497    56-169 (345)
145 KOG1844 PHD Zn-finger proteins  21.9      53  0.0011   38.5   2.0   49  351-401    87-135 (508)
146 PF08274 PhnA_Zn_Ribbon:  PhnA   21.6      42  0.0009   23.2   0.6   24  351-374     3-26  (30)
147 KOG3268 Predicted E3 ubiquitin  21.4      25 0.00055   34.3  -0.6   36  348-383   163-200 (234)

No 1  
>KOG1080 consensus Histone H3 (Lys4) methyltransferase complex, subunit SET1 and related methyltransferases [Chromatin structure and dynamics; Transcription]
Probab=100.00  E-value=3e-65  Score=602.17  Aligned_cols=506  Identities=35%  Similarity=0.624  Sum_probs=379.7

Q ss_pred             CceecCChhHHHHHHHHHHHhhccCCCCccccccccccccccCccccCCCcHHHHHHHhhcCCCCCCCchhhhhccc-cc
Q 003510          255 EQFTGSTPSTCWSKICMKIREGQNNTSDDFSAEGAAEKISESGSDMFGFSNPEVMKLILGLTKSRPTSKSSLCKLTS-KY  333 (814)
Q Consensus       255 ~~~~~~s~~~~W~~i~k~i~~~~~~~~~~~~~~~~~~~~~~sG~~~FGls~p~v~~li~~Lp~a~~~~k~~~~k~~~-~~  333 (814)
                      ..+-..++..+|...+....+.....+.....   .....-++..+|++........+........-+....++-.. ..
T Consensus       480 ~~~~~~~~~~~~k~~~~e~~k~~~~~~~~~k~---~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~p~s~~~~~~~s~~~~  556 (1005)
T KOG1080|consen  480 RVFHMLRYSVKKKKFLSEWERHTGATAKIWKD---SSRVKDELLPLPKWVESRGRSIMNTYNSEKPKSIVLMGKTSVQRM  556 (1005)
T ss_pred             eeecccCcchhhhhcccchhhhhccccccccc---ccccccccccchhhhhhccccccccccccCCcchhhhccchhhhh
Confidence            34778889999999988887766665433222   112234666777777777655566555555544444443333 23


Q ss_pred             cCCCCCCCCccccccCCCccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecC
Q 003510          334 RDLPGGYRPVRVDWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCP  413 (814)
Q Consensus       334 ~~lp~~~~~~~~~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~  413 (814)
                      +..+..+.+....|.+.+.|.+|.+.+.+..|.++.|+.|+..||+.|||...++.+..|+|+.|...  .....|+||+
T Consensus       557 ~~~~~~~~~~~l~~~~t~~c~~~~~~~~~~~n~~~~~~~~~~~~~s~~~g~~~~~~~~~~~~~~~~~~--~~~r~~~l~~  634 (1005)
T KOG1080|consen  557 LLELIEKREPRLSKWTTERCAVCRDDEDWEKNVSIICDRCTRSVHSECYGNLKSYDGTSWVCDSCETL--DIKRSCCLCP  634 (1005)
T ss_pred             cCcccccchhhhcCCCcccccccccccccccceeeeeccccccCCCcccccCCCCCCCcchhhccccc--cCCchhhhcc
Confidence            44455566677777777899999999999999999999999999999999999999999999999964  4457899999


Q ss_pred             CCCCCceecCCCcchhhhhhccccceEEccCCCcccccccccchhcccCccceeeCCccceeEecCCCCcCcccchhhHh
Q 003510          414 VVGGAMKPTTDGRWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGVSYGACIQCSNTTCRVAYHPLCAR  493 (814)
Q Consensus       414 ~~~Galk~t~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~  493 (814)
                      .+||||++++.|+|+|+-||.|.|++.+.++..|+|..++..++...+...|.+    .|.|.||.  .|...||.+||.
T Consensus       635 ~~g~al~p~d~gr~~~~e~a~~~~e~~~~~~~~~~p~~~~~~~p~~~~~~~~~~----~~~~~~~~--~~~~~~~~~~a~  708 (1005)
T KOG1080|consen  635 VKGGALKPTDEGRWVHVECAWFRPEVCLASPERMEPAVGTFKIPALSFLKICFI----HGSCRQCC--KCETGSHAMCAS  708 (1005)
T ss_pred             ccCcccCCCCccchhhhhchhccccccCCCccCCCCcccccccCccchhhhccc----cccccccc--hhhhcceehhhc
Confidence            999999999999999999999999999999999999999999999998888888    68899998  999999999999


Q ss_pred             hcCceEEeeccccc----------------cccccCCCcccccccccccccccCCCCcchhhhhhhhhhhhccccCCCCC
Q 003510          494 AAGLCVELEDEDRL----------------NLLSLDEDDEDQCIRLLSFCKKHKQPLNDRLAVDERLVQVTRRCCDYIPP  557 (814)
Q Consensus       494 ~~g~~~~~~~~~~~----------------~~~~~~~~~~~~~~~~~~~C~~H~~~~~~~~~~~~~~~~~~~~~s~~~p~  557 (814)
                      .+|+.++...-...                .++.++........+..+++.+|+....... +..         .++.+ 
T Consensus       709 ~~~~~~~~~~l~~~~~~~~~~~~~~~~~~d~~l~~~~~~~~~~~~~~~~~k~~~~~g~~~~-~~~---------~~~~~-  777 (1005)
T KOG1080|consen  709 RAGYIMEAVSLEEVSQQTTSYVKEDGPGPDSVLKVNTPSGKFGAENLSQNKKSRTDGVRLV-LTY---------KEYAP-  777 (1005)
T ss_pred             CccChhhhhhhhhhhhhhhhhhhhccCCcccceeecCccccccccchhhhhhccccccccc-ccc---------ccccc-
Confidence            99987654321111                0111111111111222233333332111100 000         11112 


Q ss_pred             CCCCcccccCccccc--ccCCCCchhHHHHhhcccccccCCcccccccccCCCCCCCCCcccccccccccccccCCCCcc
Q 003510          558 SNPSGCARSEPYNYF--GRRGRKEPEALAAASLKRLFVENQPYLVGGYCQNGLSGNTLPSIRVIGSKFSFSLHRDAPNFL  635 (814)
Q Consensus       558 ~npsGcaRsEp~~~~--~rr~rk~p~~~~~a~~kr~~~~~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  635 (814)
                       -+.-|+|.+|++.+  ....+..+...+.+..+++..++.++..++..++.+....    +..+..++.+  -..+...
T Consensus       778 -~~~~~~~~~~~~~~~~~s~~~~~~~~r~~~~~~~~~~~s~~~~~s~~~s~~~s~~~----rl~q~rl~a~--~~~~~~~  850 (1005)
T KOG1080|consen  778 -LREIKSRAEPLNRIDFSSEARCRSESRSDNSKSPLAEESESDITSGGSSHDLSAEE----RLNQFRLSAS--FTASFIL  850 (1005)
T ss_pred             -cccchhcccCCcccCccccccccchhhcccccccccccccccccccccccchhHHh----hhHHHHhhhh--ccccccc
Confidence             22346777887653  2223333344455556677777888777666666543211    1111111111  1223456


Q ss_pred             chhhhhHHHhhcccee-EEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCce
Q 003510          636 SMADKYKHMKETFRKR-LAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDER  714 (814)
Q Consensus       636 ~~~~~~~~l~~~~~~~-~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~  714 (814)
                      .+++.++.++..++++ |.|++|.||||||||+++|.+||||+||+||+|++.+++.||.+ |......++|+|++|++.
T Consensus       851 ~~~~~~~~~~~~~rkk~~~F~~s~iH~wglfa~~~i~~~dmViEY~Ge~vR~~iad~RE~~-Y~~~gi~~sYlfrid~~~  929 (1005)
T KOG1080|consen  851 DEAEVLRYNQLKFRKKYVKFGRSGIHGWGLFAMENIAAGDMVIEYRGELVRSSIADLREAR-YERMGIGDSYLFRIDDEV  929 (1005)
T ss_pred             chHHHHHHHHHhhhhhhhccccccccccceeeccCccccceEEEeeceehhhhHHHHHHHH-HhccCcccceeeecccce
Confidence            7788888888888755 99999999999999999999999999999999999999999985 777655789999999999


Q ss_pred             EEeccccCCccccccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCCCCCCeeeeeCCCCCccccC
Q 003510          715 VIDATRAGSIAHLINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFFSIDEQLACYCGFPRCRGVVN  790 (814)
Q Consensus       715 ~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~~~~~~~C~Cg~~~Cr~~~~  790 (814)
                      |||||.+||+||||||||+|||+++++.|+|..+|+|||.|+|.+||||||||.|+.++++++|+||+++|||+||
T Consensus       930 ViDAtk~gniAr~InHsC~PNCyakvi~V~g~~~IvIyakr~I~~~EElTYDYkF~~e~~kipClCgap~Crg~~n 1005 (1005)
T KOG1080|consen  930 VVDATKKGNIARFINHSCNPNCYAKVITVEGDKRIVIYSKRDIAAGEELTYDYKFPTEDDKIPCLCGAPNCRGFLN 1005 (1005)
T ss_pred             EEeccccCchhheeecccCCCceeeEEEecCeeEEEEEEecccccCceeeeeccccccccccccccCCCccccccC
Confidence            9999999999999999999999999999999999999999999999999999999999999999999999999987


No 2  
>KOG0956 consensus PHD finger protein AF10 [General function prediction only]
Probab=100.00  E-value=4.2e-40  Score=359.80  Aligned_cols=168  Identities=37%  Similarity=0.831  Sum_probs=152.8

Q ss_pred             CccccccCCcccCCCceEEccc--cccccccccccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcch
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDK--CRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWA  428 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~--C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~Wv  428 (814)
                      .-|+||-+...|..|+||+||+  |.++|||.||||..+|.| +|||++|+.......+.|.|||.++||||+|++|.|+
T Consensus         6 GGCCVCSDErGWaeNPLVYCDG~nCsVAVHQaCYGIvqVPtG-pWfCrKCesqeraarvrCeLCP~kdGALKkTDn~GWA   84 (900)
T KOG0956|consen    6 GGCCVCSDERGWAENPLVYCDGHNCSVAVHQACYGIVQVPTG-PWFCRKCESQERAARVRCELCPHKDGALKKTDNGGWA   84 (900)
T ss_pred             cceeeecCcCCCccCceeeecCCCceeeeehhcceeEecCCC-chhhhhhhhhhhhccceeecccCcccceecccCCCce
Confidence            3699999988999999999995  999999999999999988 9999999987666678999999999999999999999


Q ss_pred             hhhhhccccceEEccCCCcccccccccchhcccCccceeeCC-------ccceeEecCCCCcCcccchhhHhhcCceEEe
Q 003510          429 HLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGV-------SYGACIQCSNTTCRVAYHPLCARAAGLCVEL  501 (814)
Q Consensus       429 H~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~-------~~Ga~iqC~~~~C~~~fH~~CA~~~g~~~~~  501 (814)
                      ||+|||+||||.|.++..||||. +..+|.+||+.+|+||+.       ..|||++|...+|+++|||+||+++|+..|.
T Consensus        85 HVVCALYIPEVrFgNV~TMEPIi-Lq~VP~dRfnKtCYIC~E~GrpnkA~~GACMtCNKs~CkqaFHVTCAQ~~GLLCEE  163 (900)
T KOG0956|consen   85 HVVCALYIPEVRFGNVHTMEPII-LQDVPHDRFNKTCYICNEEGRPNKAAKGACMTCNKSGCKQAFHVTCAQRAGLLCEE  163 (900)
T ss_pred             EEEEEeeccceeeccccccccee-eccCchhhhcceeeeecccCCccccccccceecccccchhhhhhhHhhhhccceec
Confidence            99999999999999999999998 999999999999999985       4799999999999999999999999999886


Q ss_pred             eccccccccccCCCcccccccccccccccCC
Q 003510          502 EDEDRLNLLSLDEDDEDQCIRLLSFCKKHKQ  532 (814)
Q Consensus       502 ~~~~~~~~~~~~~~~~~~~~~~~~~C~~H~~  532 (814)
                      +..            ...++++--||+.|..
T Consensus       164 ~gn------------~~dNVKYCGYCk~Hfs  182 (900)
T KOG0956|consen  164 EGN------------ISDNVKYCGYCKYHFS  182 (900)
T ss_pred             ccc------------ccccceechhHHHHHH
Confidence            532            1234566779999954


No 3  
>KOG0954 consensus PHD finger protein [General function prediction only]
Probab=100.00  E-value=4e-39  Score=355.47  Aligned_cols=208  Identities=38%  Similarity=0.831  Sum_probs=173.8

Q ss_pred             cCCCcHHHHHHHhhcCCCCCCCchhhhhccccccCCCCCCCCccccccCCCccccccCCcccCCCceEEccccccccccc
Q 003510          301 FGFSNPEVMKLILGLTKSRPTSKSSLCKLTSKYRDLPGGYRPVRVDWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHAR  380 (814)
Q Consensus       301 FGls~p~v~~li~~Lp~a~~~~k~~~~k~~~~~~~lp~~~~~~~~~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~  380 (814)
                      |-+...+..++|+.|..  .|-|   +.......++..+     +..+++..|+||..+++++.|+||+||.|++.|||.
T Consensus       232 ~~l~~~~~eRiieelE~--~c~k---qi~~~l~~eeglg-----ie~dedviCDvCrspD~e~~neMVfCd~Cn~cVHqa  301 (893)
T KOG0954|consen  232 LELDEGTFERIIEELER--RCKK---QINHALETEEGLG-----IEYDEDVICDVCRSPDSEEANEMVFCDKCNICVHQA  301 (893)
T ss_pred             cccchHHHHHHHHHHHH--HHHH---HHHhhhhhcccce-----eeccccceeceecCCCccccceeEEeccchhHHHHh
Confidence            34556666777777652  2211   2222232344443     445678999999999999999999999999999999


Q ss_pred             cccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCC-cchhhhhhccccceEEccCCCcccccccccchhc
Q 003510          381 CYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDG-RWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKD  459 (814)
Q Consensus       381 CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~-~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~  459 (814)
                      |||+...|++ +|+|+.|..+   ..+.|+|||.+||+||++..| +|+|+.||||+||++|.+++.|+||..++.|+..
T Consensus       302 CyGIle~p~g-pWlCr~Calg---~~ppCvLCPkkGGamK~~~sgT~wAHvsCALwIPEVsie~~ekmePItkfs~Ipes  377 (893)
T KOG0954|consen  302 CYGILEVPEG-PWLCRTCALG---IEPPCVLCPKKGGAMKPTKSGTKWAHVSCALWIPEVSIECPEKMEPITKFSHIPES  377 (893)
T ss_pred             hhceeecCCC-Ceeehhcccc---CCCCeeeccccCCcccccCCCCeeeEeeeeeccceeeccCHhhcCcccccCCCcHH
Confidence            9999998886 9999999987   468999999999999999866 6999999999999999999999999999999999


Q ss_pred             ccCccceeeCCccceeEecCCCCcCcccchhhHhhcCceEEeeccccccccccCCCcccccccccccccccCCCC
Q 003510          460 RWKLLCSICGVSYGACIQCSNTTCRVAYHPLCARAAGLCVELEDEDRLNLLSLDEDDEDQCIRLLSFCKKHKQPL  534 (814)
Q Consensus       460 ~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~C~~H~~~~  534 (814)
                      ||.+.|.+|+.+.||||||+...|.++||++||+.+|+.|++....            .+.+.+..||.+|..-.
T Consensus       378 RwslvC~LCk~k~GACIqCs~k~C~t~fHv~CA~~aG~~~~~~~~~------------~D~v~~~s~c~khs~~~  440 (893)
T KOG0954|consen  378 RWSLVCNLCKVKSGACIQCSNKTCRTAFHVTCAFEAGLEMKTILKE------------NDEVKFKSYCSKHSDHR  440 (893)
T ss_pred             HHHHHHHHhcccCcceEEecccchhhhccchhhhhcCCeeeeeecc------------CCchhheeecccccccc
Confidence            9999999999999999999999999999999999999998866432            12256888999987643


No 4  
>COG5141 PHD zinc finger-containing protein [General function prediction only]
Probab=100.00  E-value=2.2e-38  Score=334.82  Aligned_cols=192  Identities=36%  Similarity=0.705  Sum_probs=169.2

Q ss_pred             CCCCC-CCCccccccCCCccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecC
Q 003510          335 DLPGG-YRPVRVDWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCP  413 (814)
Q Consensus       335 ~lp~~-~~~~~~~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~  413 (814)
                      .+|.. |+|++++..-+..|.||.+.+.++.|.||+||+|.++|||+|||+...|+| .|+|++|..+.. ...-|.+||
T Consensus       177 ~lp~k~vepi~~~d~~d~~C~~c~~t~~eN~naiVfCdgC~i~VHq~CYGI~f~peG-~WlCrkCi~~~~-~i~~C~fCp  254 (669)
T COG5141         177 GLPDKHVEPIEPSDEFDDICTKCTSTHNENSNAIVFCDGCEICVHQSCYGIQFLPEG-FWLCRKCIYGEY-QIRCCSFCP  254 (669)
T ss_pred             cCccccccccCCchhhhhhhHhccccccCCcceEEEecCcchhhhhhcccceecCcc-hhhhhhhccccc-ceeEEEecc
Confidence            46744 888888776678999999999988999999999999999999999998888 999999998653 344599999


Q ss_pred             CCCCCceecCCCcchhhhhhccccceEEccCCCcccccccccchhcccCccceeeCCccceeEecCCCCcCcccchhhHh
Q 003510          414 VVGGAMKPTTDGRWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGVSYGACIQCSNTTCRVAYHPLCAR  493 (814)
Q Consensus       414 ~~~Galk~t~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~  493 (814)
                      ..+||+|.|.+|+|+|++||+|+||+.|.+...|+||+||..++..||++.|.||+...|+||||++.+|.++||++||+
T Consensus       255 s~dGaFkqT~dgrW~H~iCA~~~pelsF~~l~~~dpI~~i~sVs~srwkl~C~iCk~~~GtcIqCs~~nC~~aYHVtCAr  334 (669)
T COG5141         255 SSDGAFKQTSDGRWGHVICAMFNPELSFGHLLSKDPIDNIASVSSSRWKLGCLICKEFGGTCIQCSYFNCTRAYHVTCAR  334 (669)
T ss_pred             CCCCceeeccCCchHhHhHHHhcchhccccccccchhhhhcccchhhHhheeeEEcccCcceeeecccchhhhhhhhhhh
Confidence            99999999999999999999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             hcCceEEeeccccccccccCCCcccccccccccccccCCCCcch
Q 003510          494 AAGLCVELEDEDRLNLLSLDEDDEDQCIRLLSFCKKHKQPLNDR  537 (814)
Q Consensus       494 ~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~C~~H~~~~~~~  537 (814)
                      ++|+++.-.         ..-++..+++....||++|.++.-.+
T Consensus       335 rag~f~~~~---------~s~n~~s~~id~e~~c~kh~p~gy~~  369 (669)
T COG5141         335 RAGYFDLNI---------YSHNGISYCIDHEPLCRKHYPLGYGR  369 (669)
T ss_pred             hcchhhhhh---------hcccccceeecchhhhcCCCCcchhc
Confidence            999986411         11223355667778999999876444


No 5  
>KOG4442 consensus Clathrin coat binding protein/Huntingtin interacting protein HIP1, involved in regulation of endocytosis [Intracellular trafficking, secretion, and vesicular transport]
Probab=100.00  E-value=1.1e-36  Score=337.69  Aligned_cols=164  Identities=27%  Similarity=0.484  Sum_probs=152.4

Q ss_pred             cchhhhhHHHhhccceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCce
Q 003510          635 LSMADKYKHMKETFRKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDER  714 (814)
Q Consensus       635 ~~~~~~~~~l~~~~~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~  714 (814)
                      +-..|+|+..|+.--..++|+.+..+||||.|.++|++|+||+||.||||+..++..|... |+.....+.|+|.+..+.
T Consensus       105 cg~~C~NQRFQkkqyA~vevF~Te~KG~GLRA~~dI~~g~FI~EY~GEVI~~~Ef~kR~~~-Y~~d~~kh~Yfm~L~~~e  183 (729)
T KOG4442|consen  105 CGVYCKNQRFQKKQYAKVEVFLTEKKGCGLRAEEDIPKGQFILEYIGEVIEEKEFEKRVKR-YAKDGIKHYYFMALQGGE  183 (729)
T ss_pred             ccccccchhhhhhccCceeEEEecCcccceeeccccCCCcEEeeeccccccHHHHHHHHHH-HHhcCCceEEEEEecCCc
Confidence            3457889999888778999999999999999999999999999999999999999999985 888888899999999999


Q ss_pred             EEeccccCCccccccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCCCC-CCeeeeeCCCCCccccCCCh
Q 003510          715 VIDATRAGSIAHLINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFFSID-EQLACYCGFPRCRGVVNDTE  793 (814)
Q Consensus       715 ~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~~~-~~~~C~Cg~~~Cr~~~~~~~  793 (814)
                      +||||.+||+||||||||+|||+++.|+|.+..+|+|||.|.|.+||||||||+|+..+ +.++|+||+++|+|||++..
T Consensus       184 ~IDAT~KGnlaRFiNHSC~PNa~~~KWtV~~~lRvGiFakk~I~~GEEITFDYqf~rYGr~AQ~CyCgeanC~G~IGgk~  263 (729)
T KOG4442|consen  184 YIDATKKGNLARFINHSCDPNAEVQKWTVPDELRVGIFAKKVIKPGEEITFDYQFDRYGRDAQPCYCGEANCRGWIGGKP  263 (729)
T ss_pred             eecccccCcHHHhhcCCCCCCceeeeeeeCCeeEEEEeEecccCCCceeeEecccccccccccccccCCcccccccCCCC
Confidence            99999999999999999999999999999999999999999999999999999998766 68999999999999999996


Q ss_pred             hHHHHh
Q 003510          794 AEEQVA  799 (814)
Q Consensus       794 ~~~~~~  799 (814)
                      .++..+
T Consensus       264 q~da~~  269 (729)
T KOG4442|consen  264 QTDASS  269 (729)
T ss_pred             cccccc
Confidence            654433


No 6  
>KOG0955 consensus PHD finger protein BR140/LIN-49 [General function prediction only]
Probab=100.00  E-value=2.6e-36  Score=356.85  Aligned_cols=178  Identities=42%  Similarity=0.902  Sum_probs=158.7

Q ss_pred             CCCccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcch
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWA  428 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~Wv  428 (814)
                      .+.+|+||.+.+..+.|.||+||+|+++|||+|||++.+|+| .|+|++|..... ....|.|||.++||+|+|.+|+|+
T Consensus       218 ~D~~C~iC~~~~~~n~n~ivfCD~Cnl~VHq~Cygi~~ipeg-~WlCr~Cl~s~~-~~v~c~~cp~~~gAFkqt~dgrw~  295 (1051)
T KOG0955|consen  218 EDAVCCICLDGECQNSNVIVFCDGCNLAVHQECYGIPFIPEG-QWLCRRCLQSPQ-RPVRCLLCPSKGGAFKQTDDGRWA  295 (1051)
T ss_pred             CCccceeecccccCCCceEEEcCCCcchhhhhccCCCCCCCC-cEeehhhccCcC-cccceEeccCCCCcceeccCCcee
Confidence            457999999999999999999999999999999998888887 999999997543 347999999999999999999999


Q ss_pred             hhhhhccccceEEccCCCcccccccccchhcccCccceeeCCcc-ceeEecCCCCcCcccchhhHhhcCceEEeeccccc
Q 003510          429 HLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGVSY-GACIQCSNTTCRVAYHPLCARAAGLCVELEDEDRL  507 (814)
Q Consensus       429 H~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~~~-Ga~iqC~~~~C~~~fH~~CA~~~g~~~~~~~~~~~  507 (814)
                      |++||+|+||+.|.+...++||.+++.|+..||++.|.+|++.. |+||||+..+|.++||++||+++|++|.+....  
T Consensus       296 Hv~caiwipev~F~nt~~~E~I~~i~~i~~aRwkL~cy~cK~~~~gaciqcs~~~c~~a~hvtca~~agl~m~~~~~~--  373 (1051)
T KOG0955|consen  296 HVVCAIWIPEVSFANTVFLEPIDSIENIPPARWKLTCYICKQKGLGACIQCSKANCYTAFHVTCARRAGLYMKSNTVK--  373 (1051)
T ss_pred             eeehhhcccccccccchhhccccchhcCcHhhhhceeeeeccCCCCcceecchhhhhhhhhhhhHhhcCceEeecccc--
Confidence            99999999999999999999999999999999999999999988 999999999999999999999999999844221  


Q ss_pred             cccccCCCcccccccccccccccCCC
Q 003510          508 NLLSLDEDDEDQCIRLLSFCKKHKQP  533 (814)
Q Consensus       508 ~~~~~~~~~~~~~~~~~~~C~~H~~~  533 (814)
                         ....++-.+.+...+||++|.++
T Consensus       374 ---~~s~~~~s~~v~~~syC~~H~pp  396 (1051)
T KOG0955|consen  374 ---ELSKNGTSQSVNKISYCDKHTPP  396 (1051)
T ss_pred             ---cccccccccccceeeeccCCCCc
Confidence               11122223446788999999998


No 7  
>KOG0957 consensus PHD finger protein [General function prediction only]
Probab=99.97  E-value=2.6e-31  Score=281.73  Aligned_cols=169  Identities=34%  Similarity=0.717  Sum_probs=146.7

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccc---cCC------CCceeeccccCCCCCCCCCceecCCCCCCcee
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELE---PVN------GVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKP  421 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~---~~~------~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~  421 (814)
                      ..|+||++..+.+-|.||+||+|++.||..|||+..   ++.      ..+|||+.|.++..  .+.|.|||.++|++|.
T Consensus       120 ~iCcVClg~rs~da~ei~qCd~CGi~VHEgCYGv~dn~si~s~~s~~stepWfCeaC~~Gvs--~P~CElCPn~~GifKe  197 (707)
T KOG0957|consen  120 VICCVCLGQRSVDAGEILQCDKCGINVHEGCYGVLDNVSIPSGSSDCSTEPWFCEACLYGVS--LPHCELCPNRFGIFKE  197 (707)
T ss_pred             eEEEEeecCccccccceeeccccCceecccccccccccccCCCCccCCCCchhhhhHhcCCC--CCccccCCCcCCcccc
Confidence            599999999888889999999999999999999852   111      14799999999875  5899999999999999


Q ss_pred             cCCCcchhhhhhccccceEEccCCCcccccccccchhcccC-ccceeeCC----ccceeEecCCCCcCcccchhhHhhcC
Q 003510          422 TTDGRWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWK-LLCSICGV----SYGACIQCSNTTCRVAYHPLCARAAG  496 (814)
Q Consensus       422 t~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~-~~C~~C~~----~~Ga~iqC~~~~C~~~fH~~CA~~~g  496 (814)
                      |+-|+|||++|||++|+|.|.....+.+|. +..+....|. ..|+.|..    +.|.||.|..+.|..+|||+||+.+|
T Consensus       198 tDigrWvH~iCALYvpGVafg~~~~l~~Vt-l~em~ysk~Gak~Cs~Ced~~fARtGvci~CdaGMCk~YfHVTCAQk~G  276 (707)
T KOG0957|consen  198 TDIGRWVHAICALYVPGVAFGQTHTLCGVT-LEEMDYSKFGAKTCSACEDKIFARTGVCIRCDAGMCKEYFHVTCAQKLG  276 (707)
T ss_pred             cchhhHHHHHHHhhcCcccccccccccccc-HHHhhhhhhccchhccccchhhhhcceeeeccchhhhhhhhhhHHhhhc
Confidence            999999999999999999999999999998 6666555554 78999986    58999999999999999999999999


Q ss_pred             ceEEeeccccccccccCCCcccccccccccccccCCCC
Q 003510          497 LCVELEDEDRLNLLSLDEDDEDQCIRLLSFCKKHKQPL  534 (814)
Q Consensus       497 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~C~~H~~~~  534 (814)
                      +.++..+++.            ....+.+||++|....
T Consensus       277 lLvea~~e~D------------iAdpfya~CK~Ht~r~  302 (707)
T KOG0957|consen  277 LLVEATDEND------------IADPFYAFCKKHTNRD  302 (707)
T ss_pred             ceeecccccc------------chhhHHHHHHhhcchh
Confidence            9988665433            3356889999998754


No 8  
>KOG1079 consensus Transcriptional repressor EZH1 [Transcription]
Probab=99.94  E-value=7.3e-28  Score=265.84  Aligned_cols=167  Identities=32%  Similarity=0.568  Sum_probs=146.5

Q ss_pred             cccccCCCCCCC--CCcccccccccccccccCCC-Ccc------------chhhhhHHHhhccceeEEEEEecccCeeEE
Q 003510          601 GGYCQNGLSGNT--LPSIRVIGSKFSFSLHRDAP-NFL------------SMADKYKHMKETFRKRLAFGKSGIHGFGIF  665 (814)
Q Consensus       601 ~~~~~~~~~~~~--~~~~~~~~~~~~~~~~~~~~-~~~------------~~~~~~~~l~~~~~~~~~v~~s~~~G~Gvf  665 (814)
                      ...|+++|+||.  .+|+..++.+|+...  +|- .++            ..+|+|..|+++.++++.++.|.+.|||||
T Consensus       532 ~~dC~nrF~GC~Ck~QC~tkqCpC~~A~r--ECdPd~Cl~cg~~~~~d~~~~~C~N~~l~~~~qkr~llapSdVaGwGlF  609 (739)
T KOG1079|consen  532 SPDCRNRFPGCRCKAQCNTKQCPCYLAVR--ECDPDVCLMCGNVDHFDSSKISCKNTNLQRGEQKRVLLAPSDVAGWGLF  609 (739)
T ss_pred             CHHHHhcCCCCCcccccccCcCchhhhcc--ccCchHHhccCcccccccCccccccchhhhhhhcceeechhhcccccee
Confidence            346889999874  566777777776433  322 222            237899999999999999999999999999


Q ss_pred             eeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCceEEeccccCCccccccCCCCCCeeEEEEEECC
Q 003510          666 AKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDERVIDATRAGSIAHLINHSCEPNCYSRVISVNG  745 (814)
Q Consensus       666 A~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~  745 (814)
                      +++.+.+++||.||+||+|+..+||+|.+ +|+..  ..+|+|.+.++++|||+++||.+||+|||-+|||++.+++|.|
T Consensus       610 lKe~v~KnefisEY~GE~IS~dEADrRGk-iYDr~--~cSflFnln~dyviDs~rkGnk~rFANHS~nPNCYAkvm~V~G  686 (739)
T KOG1079|consen  610 LKESVSKNEFISEYTGEIISHDEADRRGK-IYDRY--MCSFLFNLNNDYVIDSTRKGNKIRFANHSFNPNCYAKVMMVAG  686 (739)
T ss_pred             eccccCCCceeeeecceeccchhhhhccc-ccccc--cceeeeeccccceEeeeeecchhhhccCCCCCCcEEEEEEecC
Confidence            99999999999999999999999999999 57653  4689999999999999999999999999999999999999999


Q ss_pred             eeEEEEEEcCCCCCCCeeeEeCCCCCC
Q 003510          746 DEHIIIFAKRDIKQWEELTYDYRFFSI  772 (814)
Q Consensus       746 ~~~i~i~A~rdI~~GEELt~dY~~~~~  772 (814)
                      ..+|.|||+|.|.+||||||||++.-+
T Consensus       687 dhRIGifAkRaIeagEELffDYrYs~~  713 (739)
T KOG1079|consen  687 DHRIGIFAKRAIEAGEELFFDYRYSPE  713 (739)
T ss_pred             CcceeeeehhhcccCceeeeeeccCcc
Confidence            999999999999999999999998644


No 9  
>PF13832 zf-HC5HC2H_2:  PHD-zinc-finger like domain
Probab=99.91  E-value=2.7e-25  Score=204.34  Aligned_cols=109  Identities=50%  Similarity=1.122  Sum_probs=101.7

Q ss_pred             CceecCCCCCCceecCCCcchhhhhhccccceEEccCCCcccccccccchhcccCccceeeCCccceeEecCCCCcCccc
Q 003510          408 PCCLCPVVGGAMKPTTDGRWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGVSYGACIQCSNTTCRVAY  487 (814)
Q Consensus       408 ~C~lC~~~~Galk~t~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~f  487 (814)
                      .|+|||..+||||+|.++.|||++||+|+|++.|.+...|++++ ++.++++++++.|.+|+++.|++|+|..++|.++|
T Consensus         2 ~C~lC~~~~Galk~t~~~~WvHv~Cal~~~~~~~~~~~~~~~v~-~~~i~~~~~~~~C~iC~~~~G~~i~C~~~~C~~~f   80 (110)
T PF13832_consen    2 SCVLCPKRGGALKRTSDGQWVHVLCALWIPEVIFNNGESMEPVD-ISNIPPSRFKLKCSICGKSGGACIKCSHPGCSTAF   80 (110)
T ss_pred             ccEeCCCCCCcccCccCCcEEEeEccceeCccEEeechhcCccc-ceeecchhcCCcCcCCCCCCceeEEcCCCCCCcCC
Confidence            69999999999999999999999999999999999999999999 99999999999999999999999999999999999


Q ss_pred             chhhHhhcCceEEeeccccccccccCCCccccccccccccccc
Q 003510          488 HPLCARAAGLCVELEDEDRLNLLSLDEDDEDQCIRLLSFCKKH  530 (814)
Q Consensus       488 H~~CA~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~C~~H  530 (814)
                      ||+||+.+|+.++++..+.             ..++.+||++|
T Consensus        81 H~~CA~~~g~~~~~~~~~~-------------~~~~~~~C~~H  110 (110)
T PF13832_consen   81 HPTCARKAGLYFEIENEED-------------NVQFIAYCPKH  110 (110)
T ss_pred             CHHHHHHCCCeEEeeecCC-------------CceEEEECCCC
Confidence            9999999999998775422             35689999999


No 10 
>cd05834 HDGF_related The PWWP domain is an essential part of the Hepatoma Derived Growth Factor (HDGF) family of proteins, and is necessary for DNA binding by HDGF. This family of endogenous nuclear-targeted mitogens includes HRP (HDGF-related proteins 1, 2, 3, 4, or HPR1, HPR2, HPR3, HPR4, respectively) and lens epithelium-derived growth factor, LEDGF. Members of the HDGF family have been linked to human diseases, and HDGF is a prognostic factor in several types of cancer. The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.90  E-value=2.4e-24  Score=185.44  Aligned_cols=81  Identities=27%  Similarity=0.515  Sum_probs=73.0

Q ss_pred             CCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccCChHH
Q 003510           35 ELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKCKKPR  114 (814)
Q Consensus        35 ~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~k~~~  114 (814)
                      +|++||||||||+|||||||+|+++...        +...+.|+|+|||++++|||++++|+||+++ ..++..+++++.
T Consensus         2 ~f~~GdlVwaK~kGyp~WPa~I~~~~~~--------~~~~~~~~V~FfGt~~~a~v~~~~l~pf~~~-~~~~~~~~k~k~   72 (83)
T cd05834           2 QFKAGDLVFAKVKGYPAWPARVDEPEDW--------KPPGKKYPVYFFGTHETAFLKPEDLFPYTEN-KKKFGKPKKRKG   72 (83)
T ss_pred             CCCCCCEEEEecCCCCCCCEEEeccccc--------CCCCCEEEEEEeCCCCEeEECHHHceecccc-hhhhccccchHH
Confidence            6999999999999999999999997543        3445779999999999999999999999997 777888889999


Q ss_pred             HHHHHHHHHH
Q 003510          115 FTQSLEEAKV  124 (814)
Q Consensus       115 ~~~A~~ea~~  124 (814)
                      |++||+|+++
T Consensus        73 F~~Av~eie~   82 (83)
T cd05834          73 FNEAVWEIEK   82 (83)
T ss_pred             HHHHHHHHhh
Confidence            9999999975


No 11 
>cd05836 N_Pac_NP60 The PWWP domain is an essential part of the cytokine-like nuclear factor n-pac protein, or NP60, which enhances the activity of MAP2K4 and MAP2K6 kinases to phosphorylate p38-alpha.  In a variety of cell lines, NP60 has been shown to localize to the nucleus. In addition to the PWWP domain, NP60 also contains an AT-hook and a C-terminal NAD-binding domain. The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding proteins, that function as transcription factors regulating a variety of developmental processes.
Probab=99.90  E-value=2.1e-24  Score=187.20  Aligned_cols=86  Identities=24%  Similarity=0.474  Sum_probs=73.8

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccCChHHH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKCKKPRF  115 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~k~~~~  115 (814)
                      |++||||||||+|||||||+|+++..    ...+.+.+.+.++|+|||+++||||..++|+||+++ .+.+...+|.+.|
T Consensus         1 f~~GDlVwaK~~g~P~WPa~V~~~~~----~~~~~~~~~~~~~V~FFG~~~~~wv~~~~l~pF~~~-~~~~~~~~k~~~F   75 (86)
T cd05836           1 LKLGDLVWAKMKGFPPWPGRIVKPPK----DLKKPRGKAKCFFVFFFGSENHAWIKEENIKPYHEH-KEEMIKLNKGARF   75 (86)
T ss_pred             CCCCCEEEEeCCCCCCCCEEEechhh----hcccccCCCCeEEEEEeCCCCEEEECHHhCeechhh-HHHHhcccchHHH
Confidence            78999999999999999999998643    222333345889999999999999999999999996 7777778889999


Q ss_pred             HHHHHHHHHHH
Q 003510          116 TQSLEEAKVYL  126 (814)
Q Consensus       116 ~~A~~ea~~~~  126 (814)
                      ++||+|+++++
T Consensus        76 ~~Av~~ie~~~   86 (86)
T cd05836          76 QQAVDAIEEYI   86 (86)
T ss_pred             HHHHHHHHHhC
Confidence            99999999873


No 12 
>cd05840 SPBC215_ISWI_like The PWWP domain is a component of the S. pombe hypothetical protein SPBC215, as well as ISWI complex protein 4.  The ISWI (imitation switch) proteins are ATPases responsible for chromatin remodeling in eukaryotes, and SPBC215 is proposed to also bind chromatin.   The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding,  proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.88  E-value=1.8e-23  Score=183.79  Aligned_cols=88  Identities=32%  Similarity=0.528  Sum_probs=76.6

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccc--cccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccC--C
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGL--NKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKC--K  111 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~--~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~--k  111 (814)
                      |++||||||||+|||||||+|++++.++. ..+  +.+.+.+.|+|+|||+++||||.+++|+||+++.++.+..+.  |
T Consensus         1 f~~GDlVwaK~~GyPwWPA~V~~~~~~p~-~~l~~~~~~~~~~~~V~FFg~~~~~Wv~~~~l~pl~~~~~~~~l~~~~~k   79 (93)
T cd05840           1 FQPGDRVLAKVKGFPAWPAIVVPEEMLPD-SVLKGKKKKNKRTYPVMFFPDGDYYWVPNKDLKPLTEEKIAKFLKKPKRK   79 (93)
T ss_pred             CCCCCEEEEeCCCCCCCCEEECChHHCCH-HHHhcccCCCCCeEEEEEeCCCcEEEEChhhcccCCHHHHHHHhhcCCCC
Confidence            78999999999999999999999988877 455  455677999999999999999999999999987788877654  5


Q ss_pred             hHHHHHHHHHHHH
Q 003510          112 KPRFTQSLEEAKV  124 (814)
Q Consensus       112 ~~~~~~A~~ea~~  124 (814)
                      .+.+.+|++.|.+
T Consensus        80 ~k~l~~ay~~A~~   92 (93)
T cd05840          80 DKELIKAYKAAKD   92 (93)
T ss_pred             CHHHHHHHHHhcC
Confidence            5889999998853


No 13 
>cd05838 WHSC1_related The PWWP domain was first identified in the WHSC1 (Wolf-Hirschhorn syndrome candidate 1) protein, a protein implicated in Wolf-Hirschhorn syndrome (WHS).  When translocated, WHSC1 plays a role in lymphoid multiple myeloma (MM) disease, also known as plasmacytoma. WHCS1 proteins typically contain two copies of the PWWP domain.  The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.88  E-value=3e-23  Score=183.67  Aligned_cols=91  Identities=30%  Similarity=0.412  Sum_probs=74.8

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhcccc--ccCChH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFH--LKCKKP  113 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~--~~~k~~  113 (814)
                      +..||||||||+|||||||+|+++..+++ .....+++.+.++|+|||+++|+||.+++|+||.++......  ++++.+
T Consensus         1 ~~~GdlVWaK~~g~pwWPa~V~~~~~~p~-~~~~~~~~~~~~~V~Ffgs~~y~Wv~~~~l~pf~e~~~~~~~~~~~~~~~   79 (95)
T cd05838           1 PLYGDIVWAKLGNFRWWPAIICDPREVPP-NIQVLRHCIGEFCVMFFGTHDYYWVHRGRVFPYQEGDKGFKEQTKSYLAK   79 (95)
T ss_pred             CCcCCEEEEECCCCCCCCeEEcChhhcCh-hHhhccCCCCeEEEEEeCCCCEEEeccccccchhhhhhhhhhhhhhhhHH
Confidence            35799999999999999999999887776 333444556889999999999999999999999987433222  235679


Q ss_pred             HHHHHHHHHHHHHH
Q 003510          114 RFTQSLEEAKVYLS  127 (814)
Q Consensus       114 ~~~~A~~ea~~~~~  127 (814)
                      .|++||+||.+++.
T Consensus        80 ~f~~AleEA~~~~~   93 (95)
T cd05838          80 RFRKALEEASLAFK   93 (95)
T ss_pred             HHHHHHHHHHHHhh
Confidence            99999999999875


No 14 
>KOG1082 consensus Histone H3 (Lys9) methyltransferase SUV39H1/Clr4, required for transcriptional silencing [Chromatin structure and dynamics; Transcription]
Probab=99.88  E-value=3e-23  Score=229.57  Aligned_cols=160  Identities=29%  Similarity=0.427  Sum_probs=129.6

Q ss_pred             cchhhhhHHHhhccceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHH-HhhcccCCceeE------
Q 003510          635 LSMADKYKHMKETFRKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHF-IYNSLVGAGTYM------  707 (814)
Q Consensus       635 ~~~~~~~~~l~~~~~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~-~~~~~~~~~~y~------  707 (814)
                      +...|.+|.+|.+++.+|+|.+++.+||||++.+.|++|++|+||+||+++..+++.+... .|........+.      
T Consensus       161 C~~~C~nRv~q~g~~~~leIfrt~~kGwgvRs~~~I~~G~fvcEyaGe~~t~~e~~~~~~~~~~~~~~~~~~~~~~~~~~  240 (364)
T KOG1082|consen  161 CHPDCANRVVQKGLQFHLEVFRTPEKGWGVRTLDPIPAGEFVCEYAGEVLTSEEAQRRTHLREYLDDDCDAYSIADREWV  240 (364)
T ss_pred             CCCcCcchhhccccccceEEEecCCceeeecccccccCCCeeEEEeeEecChHHhhhccccccccccccccchhhhcccc
Confidence            4567899999999999999999999999999999999999999999999999999877321 111111111111      


Q ss_pred             ---------------EEcCCceEEeccccCCccccccCCCCCCeeEEEEEECCe----eEEEEEEcCCCCCCCeeeEeCC
Q 003510          708 ---------------FRIDDERVIDATRAGSIAHLINHSCEPNCYSRVISVNGD----EHIIIFAKRDIKQWEELTYDYR  768 (814)
Q Consensus       708 ---------------~~~~~~~~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~~----~~i~i~A~rdI~~GEELt~dY~  768 (814)
                                     -.....+.|||...||++|||||||.||+.+..+..++.    .+|+|||+++|.+|||||+||+
T Consensus       241 ~~~~~~~~~~~~~~~~~~~~~~~ida~~~GNv~RfinHSC~PN~~~~~v~~~~~~~~~~~i~ffa~~~I~p~~ELT~dYg  320 (364)
T KOG1082|consen  241 DESPVGNTFVAPSLPGGPGRELLIDAKPHGNVARFINHSCSPNLLYQAVFQDEFVLLYLRIGFFALRDISPGEELTLDYG  320 (364)
T ss_pred             ccccccccccccccccCCCcceEEchhhcccccccccCCCCccceeeeeeecCCccchheeeeeeccccCCCcccchhhc
Confidence                           112467799999999999999999999999988877643    5899999999999999999999


Q ss_pred             CCCC------------CCCeeeeeCCCCCccccCCChh
Q 003510          769 FFSI------------DEQLACYCGFPRCRGVVNDTEA  794 (814)
Q Consensus       769 ~~~~------------~~~~~C~Cg~~~Cr~~~~~~~~  794 (814)
                      ....            ..+..|.||+.+||+.+.....
T Consensus       321 ~~~~~~~~~~~~~~~~~~~~~c~c~~~~cr~~~~~~~~  358 (364)
T KOG1082|consen  321 KAYKLLVQDGANIYTPVMKKNCNCGLEKCRGLLGSAPC  358 (364)
T ss_pred             ccccccccccccccccccchhhcCCCHHhCcccCCCcc
Confidence            6532            2467899999999998876543


No 15 
>cd05835 Dnmt3b_related The PWWP domain is an essential component of DNA methyltransferase 3 B (Dnmt3b) which is responsible for establishing DNA methylation patterns during embryogenesis and gametogenesis.  In tumorigenesis, DNA methylation by Dnmt3b is known to play a role in the inactivation of tumor suppressor genes.  In addition, a point mutation in the PWWP domain of Dnmt3b has been identified in patients with ICF syndrome (immunodeficiency, centromeric instability, and facial anomalies), a rare autosomal recessive disorder characterized by hypomethylation of classical satellite DNA. The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.87  E-value=8.1e-23  Score=178.23  Aligned_cols=84  Identities=24%  Similarity=0.451  Sum_probs=71.1

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccc--cccCChH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSF--HLKCKKP  113 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~--~~~~k~~  113 (814)
                      |.+||||||||+|||||||+|++++....     .+...+.++|+|||+++++||.+++|+||.++ .+.|  ..++|+.
T Consensus         1 f~vGDlVWaK~kg~pwWP~~V~~~~~~~~-----~~~~~~~~~V~fFGs~~~a~v~~~~l~pf~e~-~~~f~~~~~~k~~   74 (87)
T cd05835           1 FNVGDLVWGKIKGFPWWPGRVVSITVTSK-----RPPVVGMRWVTWFGSGTFSEVSVDKLSPFSEF-FKAFSRYNRKKKG   74 (87)
T ss_pred             CCCCCEEEEecCCCCCCCeEEechhhccc-----ccCCCCeEEEEEeCCCCEeEECHHHCcChhHh-HHHHhhhhhhhhH
Confidence            78999999999999999999999765432     14556889999999999999999999999996 5553  3456779


Q ss_pred             HHHHHHHHHHHH
Q 003510          114 RFTQSLEEAKVY  125 (814)
Q Consensus       114 ~~~~A~~ea~~~  125 (814)
                      .|++||+||.+.
T Consensus        75 ~f~~Ai~eA~e~   86 (87)
T cd05835          75 LYKKAIYEALEV   86 (87)
T ss_pred             HHHHHHHHHHHc
Confidence            999999999874


No 16 
>smart00317 SET SET (Su(var)3-9, Enhancer-of-zeste, Trithorax) domain. Putative methyl transferase, based on outlier plant homologues
Probab=99.87  E-value=9.7e-22  Score=181.72  Aligned_cols=115  Identities=45%  Similarity=0.712  Sum_probs=100.4

Q ss_pred             EEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCceEEeccccCCccccccCC
Q 003510          652 LAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDERVIDATRAGSIAHLINHS  731 (814)
Q Consensus       652 ~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~~iDa~~~gn~aRfiNHS  731 (814)
                      +++.+++++|+||||+++|++|++|++|.|.++....+..+... +........|+|......+||+...||++||||||
T Consensus         2 ~~~~~~~~~G~gl~a~~~i~~g~~i~~~~g~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~id~~~~~~~~~~iNHs   80 (116)
T smart00317        2 LEVFKSPGKGWGVRATEDIPKGEFIGEYVGEIITSEEAEERSKA-YDTDGADSFYLFEIDSDLCIDARRKGNIARFINHS   80 (116)
T ss_pred             cEEEecCCCcEEEEECCccCCCCEEEEEEeEEECHHHHHHHHHH-HHhcCCCCEEEEECCCCEEEeCCccCcHHHeeCCC
Confidence            56777889999999999999999999999999998887776542 33322225789998888999999999999999999


Q ss_pred             CCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeC
Q 003510          732 CEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDY  767 (814)
Q Consensus       732 C~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY  767 (814)
                      |.|||.+..+..++..++.++|+|||++|||||+||
T Consensus        81 c~pN~~~~~~~~~~~~~~~~~a~r~I~~GeEi~i~Y  116 (116)
T smart00317       81 CEPNCELLFVEVNGDSRIVIFALRDIKPGEELTIDY  116 (116)
T ss_pred             CCCCEEEEEEEECCCcEEEEEECCCcCCCCEEeecC
Confidence            999999998888777789999999999999999999


No 17 
>cd05841 BS69_related The PWWP domain is part of BS69 protein, a nuclear protein that specifically binds adenoviral E1A and Epstein-Barr viral EBNA2 proteins, suppressing their transactivation functions.  BS69 is a multi-domain protein, containing bromo, PHD, PWWP, and MYND domains.  The specific role of the PWWP domain within BS69 is not clearly identified, but BS69 functions in chromatin remodeling, consistent with other PWWP-containing proteins. The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.87  E-value=1.3e-22  Score=172.16  Aligned_cols=75  Identities=28%  Similarity=0.582  Sum_probs=67.3

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeC-CCCEEEEeCCCccccccchhccccccCChHH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFG-THDFARINVKQVISFLKGLLSSFHLKCKKPR  114 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg-~~~~awv~~~~l~~f~~~~~~~~~~~~k~~~  114 (814)
                      ++|||||||||+|||||||+|++++             .+.|+|+||| ++++|||+.++|+||+++ +.++.+++|++.
T Consensus         7 ~~p~dLVwAK~kGyp~WPAkV~~~~-------------~~~~~V~FFG~t~~~a~v~~~~i~~~~~~-~~~~~~~~k~~~   72 (83)
T cd05841           7 RPPHELVWAKLKGFPYWPAKVMRVE-------------DNQVDVRFFGGQHDRAWIPSNNIQPISTE-IPQQLVKKRSRG   72 (83)
T ss_pred             CCCCCEEEEeCCCCCCCCEEEeecC-------------CCeEEEEEcCCCCCeEEEehHHeeehhhh-hhhhccccccHH
Confidence            6899999999999999999998753             1459999999 999999999999999987 656777888899


Q ss_pred             HHHHHHHHHH
Q 003510          115 FTQSLEEAKV  124 (814)
Q Consensus       115 ~~~A~~ea~~  124 (814)
                      |++||+||+.
T Consensus        73 f~~A~~Eie~   82 (83)
T cd05841          73 FNKAMDELEL   82 (83)
T ss_pred             HHHHHHHHHh
Confidence            9999999975


No 18 
>cd05162 PWWP The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids.  The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation.  Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.  The function of the PWWP domain is still not known precisely; however, based on the fact that other regions of PWWP-domain proteins are responsible for nuclear localization and DNA-binding, is likely that the PWWP domain acts as a site for protein-protein binding interactions, influencing chromatin remodeling and thereby regulating transcriptional processes.  Some PWWP-domain proteins have been linked to cancer or other diseases; some are known to function as growth factors.
Probab=99.87  E-value=1.9e-22  Score=177.13  Aligned_cols=86  Identities=30%  Similarity=0.543  Sum_probs=74.7

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccCChHHH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKCKKPRF  115 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~k~~~~  115 (814)
                      |++||||||||+|||||||+|+++...+.. . ..+...+.++|+|||+++|+||+.++|.||.++... ...++|++.|
T Consensus         1 f~~GdlVwaK~~g~pwWPa~V~~~~~~~~~-~-~~~~~~~~~~V~Ffg~~~~~wv~~~~l~pf~~~~~~-~~~~~k~~~f   77 (87)
T cd05162           1 FRPGDLVWAKMKGYPWWPALVVDPPKDSKK-A-KKKAKEGKVLVLFFGDKTFAWVGAERLKPFTEHKES-EAKQSKRKGF   77 (87)
T ss_pred             CCCCCEEEEeCCCCCCCCEEEccccccchh-h-hccCCCCEEEEEEeCCCcEEEeCccceeeccchHHh-hccCCccHHH
Confidence            789999999999999999999998877652 2 334566889999999999999999999999998544 6667788999


Q ss_pred             HHHHHHHHH
Q 003510          116 TQSLEEAKV  124 (814)
Q Consensus       116 ~~A~~ea~~  124 (814)
                      ++||+||.+
T Consensus        78 ~~A~~eA~~   86 (87)
T cd05162          78 KKAYDEALE   86 (87)
T ss_pred             HHHHHHHHh
Confidence            999999976


No 19 
>PF00855 PWWP:  PWWP domain;  InterPro: IPR000313 Upon characterisation of WHSC1, a gene mapping to the Wolf-Hirschhornsyndrome critical region and at its C terminus similar to the Drosophila melanogaster ASH1/trithorax group proteins, a novel protein domain designated PWWP domain was identified []. The PWWP domain is named after a conserved Pro-Trp-Trp-Pro motif. It is present in proteins of nuclear origin and plays a role in cell growth and differentiation. Due to its position, the composition of amino acids close to the PWWP motif and the pattern of other domains present it has been suggested that the domain is involved in protein-protein interactions [].; PDB: 3LYI_B 2L89_A 2NLU_A 1RI0_A 1KHC_A 3QKJ_C 2DAQ_A 1N27_A 3PFS_B 3QJ6_A ....
Probab=99.84  E-value=8.4e-22  Score=172.92  Aligned_cols=84  Identities=32%  Similarity=0.579  Sum_probs=71.6

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhcccccc--CChH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLK--CKKP  113 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~--~k~~  113 (814)
                      |++||||||||+|||||||+|++++....     .+...+.++|+|||+++++||+.++|.||.+. .+.+..+  ++++
T Consensus         1 f~~GdlVWaK~~g~pwWPa~V~~~~~~~~-----~~~~~~~~~V~Ffg~~~~~wv~~~~i~~f~~~-~~~~~~~~~~k~~   74 (86)
T PF00855_consen    1 FRPGDLVWAKLKGYPWWPARVCDPDEKSK-----KKRKDGHVLVRFFGDNDYAWVKPSNIKPFSEF-KEKLKKKKKKKRK   74 (86)
T ss_dssp             -STTEEEEEEETTSEEEEEEEEECCHCTS-----CSSSSTEEEEEETTTTEEEEEEGGGEEECCHH-HHHHHHHHHHHSH
T ss_pred             CCCCCEEEEEeCCCCCCceEEeecccccc-----cCCCCCEEEEEecCCCCEEEECHHHhhChhhh-HHHHHHhhccchH
Confidence            78999999999999999999999864433     35667889999999999999999999999954 6666654  5669


Q ss_pred             HHHHHHHHHHHH
Q 003510          114 RFTQSLEEAKVY  125 (814)
Q Consensus       114 ~~~~A~~ea~~~  125 (814)
                      .|++||+||+++
T Consensus        75 ~~~~Ai~eA~~~   86 (86)
T PF00855_consen   75 SFRKAIEEAEEA   86 (86)
T ss_dssp             HHHHHHHHHHHH
T ss_pred             HHHHHHHHHHhC
Confidence            999999999875


No 20 
>smart00293 PWWP domain with conserved PWWP motif. conservation of Pro-Trp-Trp-Pro residues
Probab=99.83  E-value=7.5e-21  Score=155.69  Aligned_cols=63  Identities=33%  Similarity=0.636  Sum_probs=56.3

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccc
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFL   99 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~   99 (814)
                      |++||||||||+|||||||+|++++..+. ...+.++..+.|+|+|||+++||||++++|+||+
T Consensus         1 f~~GdlVwaK~~G~p~WPa~V~~~~~~~~-~~~~~~~~~~~~~V~Ffg~~~~awv~~~~l~p~~   63 (63)
T smart00293        1 FKPGDLVWAKMKGFPWWPALVVSPKETPD-NIRKRKRFENLYPVLFFGDKDTAWISSSKLFPLT   63 (63)
T ss_pred             CCCCCEEEEECCCCCCCCeEEcCcccCCh-hHhhccCCCCEEEEEEeCCCCEEEECccceeeCC
Confidence            78999999999999999999999987766 3445566778999999999999999999999985


No 21 
>KOG1085 consensus Predicted methyltransferase (contains a SET domain) [General function prediction only]
Probab=99.80  E-value=9.5e-20  Score=182.76  Aligned_cols=121  Identities=37%  Similarity=0.529  Sum_probs=108.9

Q ss_pred             ceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcC---CceEEeccc-cCCc
Q 003510          649 RKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRID---DERVIDATR-AGSI  724 (814)
Q Consensus       649 ~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~---~~~~iDa~~-~gn~  724 (814)
                      ...+.+..-.++|+||+|++.+++|+||.||.|.+|.-.++..|+.+ |......++|||.+.   ..++||||. .+-+
T Consensus       255 ~egl~~~~~dgKGRGv~a~~~F~rgdFVVEY~Gdliei~eAk~rE~~-Ya~De~~GcYMYyF~h~sk~yCiDAT~et~~l  333 (392)
T KOG1085|consen  255 NEGLLEVYKDGKGRGVRAKVNFERGDFVVEYRGDLIEISEAKVREEQ-YANDEEIGCYMYYFEHNSKKYCIDATKETPWL  333 (392)
T ss_pred             ccceeEEeeccccceeEeecccccCceEEEEecceeeechHHHHHHH-hccCcccceEEEeeeccCeeeeeecccccccc
Confidence            34566666677999999999999999999999999999999999995 777788889888764   578999998 5568


Q ss_pred             cccccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCC
Q 003510          725 AHLINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFF  770 (814)
Q Consensus       725 aRfiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~  770 (814)
                      +|+||||-.+||..+++.+++.+|++++|.|||++||||+||||.-
T Consensus       334 GRLINHS~~gNl~TKvv~Idg~pHLiLvA~rdIa~GEELlYDYGDR  379 (392)
T KOG1085|consen  334 GRLINHSVRGNLKTKVVEIDGSPHLILVARRDIAQGEELLYDYGDR  379 (392)
T ss_pred             hhhhcccccCcceeeEEEecCCceEEEEeccccccchhhhhhcccc
Confidence            9999999999999999999999999999999999999999999864


No 22 
>cd05837 MSH6_like The PWWP domain is present in MSH6, a mismatch repair protein homologous to bacterial MutS.   The PWWP domain of histone-lysine N-methyltransferase, also known as Nuclear SET domain-containing protein 3, is also included. Mutations in MSH6 have been linked to increased cancer susceptibility, particularly in hereditary nonpolyposis colorectal cancer in humans.  The role of the PWWP domain in MSH6 is not clear; MSH6 orthologs found in S. cerevisiae, Caenorhabditis elegans and Arabidopsis thaliana lack the PWWP domain.   Histone methyltransferases (HMTases) induce the posttranslational methylation of lysine residues in histones and play a role in apoptosis.  In the HMTase Whistle, the PWWP domain is necessary for HMTase activity. The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain pro
Probab=99.79  E-value=1.4e-19  Score=165.03  Aligned_cols=67  Identities=33%  Similarity=0.662  Sum_probs=56.1

Q ss_pred             CCCCCCEEEEeeCCCCCCCceeeCCCCcCccc-cccccCCCCcEEEEEeCCC-CEEEEeCCCccccccc
Q 003510           35 ELEPGDIIWAKLTGHAMWPAIVVDESLIGDYK-GLNKISGGRSIPVQFFGTH-DFARINVKQVISFLKG  101 (814)
Q Consensus        35 ~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~-~~~~~~~~~~~~V~FFg~~-~~awv~~~~l~~f~~~  101 (814)
                      .|.+||||||||+|||||||+|++++..+... ....++..+.|+|+|||++ +||||+.++|.||++.
T Consensus         2 ~~~~GdlVWaK~~g~PwWPa~V~~~~~~~~~~~~~~~~~~~~~~~V~FFG~~~~~aWv~~~~l~pf~~~   70 (110)
T cd05837           2 KYQVGDLVWAKVSGYPWWPCMVCSDPLLGTYTKTKRNKRKPRQYHVQFFGDNPERAWISEKSLKPFKGS   70 (110)
T ss_pred             CCCCCCEEEEeCCCCCCCCEEEecccccchhhhhhhccCCCCeEEEEEcCCCCCEEEecHHHccccCCc
Confidence            59999999999999999999999876665422 1233456688999999985 8999999999999975


No 23 
>KOG1083 consensus Putative transcription factor ASH1/LIN-59 [Transcription]
Probab=99.79  E-value=2.4e-20  Score=213.84  Aligned_cols=133  Identities=35%  Similarity=0.568  Sum_probs=116.7

Q ss_pred             hhhHHHhh-ccceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCceEEe
Q 003510          639 DKYKHMKE-TFRKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDERVID  717 (814)
Q Consensus       639 ~~~~~l~~-~~~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~~iD  717 (814)
                      |.++.|++ +.-..|.+.+.+..||||.|.++|++|+||+||+|+||...+.+.+-.-+|-  ...+.|...++.+.+||
T Consensus      1166 c~nqrm~r~e~cp~L~v~~gp~~G~~v~tk~PikagtfI~EYvGeVit~ke~e~~mmtl~~--~d~~~~cL~I~p~l~id 1243 (1306)
T KOG1083|consen 1166 CSNQRMQRHEECPPLEVFRGPKKGWGVRTKEPIKAGTFIMEYVGEVITEKEFEPRMMTLYH--NDDDHYCLVIDPGLFID 1243 (1306)
T ss_pred             hhhHHhhhhccCCCcceeccCCCCccccccccccccchHHHHHHHHHHHHhhcccccccCC--CCCcccccccCccccCC
Confidence            56666654 5668999999999999999999999999999999999998877666221222  23468999999999999


Q ss_pred             ccccCCccccccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCCCC
Q 003510          718 ATRAGSIAHLINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFFSID  773 (814)
Q Consensus       718 a~~~gn~aRfiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~~~  773 (814)
                      +.++||.+|||||||.|||.++.|.++|..||++||+|||.+||||||||+|....
T Consensus      1244 ~~R~~n~~RfinhscKPNc~~qkwSVNG~~Rv~L~A~rDi~kGEELtYDYN~ks~~ 1299 (1306)
T KOG1083|consen 1244 IPRMGNGARFINHSCKPNCEMQKWSVNGEYRVGLFALRDLPKGEELTYDYNFKSFN 1299 (1306)
T ss_pred             hhhccccccccccccCCCCccccccccceeeeeeeecCCCCCCceEEEeccccccC
Confidence            99999999999999999999999999999999999999999999999999886554


No 24 
>cd06080 MUM1_like Mutated melanoma-associated antigen 1 (MUM-1) is a melanoma-associated antigen (MAA).  MUM-1 belongs to the mutated or aberrantly expressed type of MAAs, along with antigens such as CDK4, beta-catenin, gp100-in4, p15, and N-acetylglucosaminyltransferase V.  It is highly expressed in several types of human cancers.  The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding, proteins that function as transcription factors regulating a variety of developmental processes.
Probab=99.71  E-value=7.5e-18  Score=142.30  Aligned_cols=76  Identities=25%  Similarity=0.461  Sum_probs=59.6

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCC-CEEEEeCCCccccccchhccccccCChHH
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTH-DFARINVKQVISFLKGLLSSFHLKCKKPR  114 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~-~~awv~~~~l~~f~~~~~~~~~~~~k~~~  114 (814)
                      |.+|||||||++|||||||+|.+...           ..+.++|+|||++ +++|+..++|+||.++ .+...+..+.+.
T Consensus         1 f~~gdlVWaK~~g~P~WPa~I~~~~~-----------~~~k~~V~FfG~~~~~a~~~~~~l~p~~~~-~~~~ek~~~~~k   68 (80)
T cd06080           1 FEKNDLVWAKIQGYPWWPAVIKSISR-----------KKQKARVNFIGDNMQSEKKGIRVVKRWLKH-FDCTEKQKLTNK   68 (80)
T ss_pred             CCCCCEEEEeCCCCCCCCEEEeeecC-----------CCCEEEEEEeCCCCceeccchhhccccccc-HHHHHHHHHHHH
Confidence            78999999999999999999987531           1467999999999 8999999999999997 333333334455


Q ss_pred             HHHHHHHHH
Q 003510          115 FTQSLEEAK  123 (814)
Q Consensus       115 ~~~A~~ea~  123 (814)
                      .++++++|.
T Consensus        69 ~ke~~~~ai   77 (80)
T cd06080          69 AKESYEQAI   77 (80)
T ss_pred             HHHHHHHHh
Confidence            666666654


No 25 
>cd05839 BR140_related The PWWP domain is found in the BR140 family, which includes peregrin and BR140-like proteins 1 and 2.   BR140 is the only family to contain the PWWP domain at the C terminus, with PHD and bromo domains in the N-terminal region.  In myeloid leukemias, BR140 is disrupted by chromosomal translocations, similar to translocations of WHSC1 in lymphoid multiple myeloma.  The PWWP domain, named for a conserved Pro-Trp-Trp-Pro motif, is a small domain consisting of 100-150 amino acids. The PWWP domain is found in numerous proteins that are involved in cell division, growth and differentiation. Most PWWP-domain proteins seem to be nuclear, often DNA-binding proteins, that function as transcription factors regulating a variety of developmental processes.
Probab=99.71  E-value=1.7e-17  Score=148.69  Aligned_cols=88  Identities=20%  Similarity=0.318  Sum_probs=61.2

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCcc--------------ccccccCCCCcEEEEEeCC-CCEEEEeCCCcccccc
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDY--------------KGLNKISGGRSIPVQFFGT-HDFARINVKQVISFLK  100 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~--------------~~~~~~~~~~~~~V~FFg~-~~~awv~~~~l~~f~~  100 (814)
                      +.||||||||++|||||||+|+++......              ...+.......++|+||++ .+++||+.++|.||..
T Consensus         1 ~~pg~lVwaK~~g~P~wPa~iidp~~~~~~~~~~~~p~~~l~~~~~~~~~~~~~~~lV~FFd~~~s~~Wv~~~~l~pl~~   80 (111)
T cd05839           1 LEPLTLVWAKCRGYPSYPALIIDPKMPRDGVFHNGVPPDVLTLGEARAQNADERLYLVLFFDNKRTWQWLPGDKLEPLGV   80 (111)
T ss_pred             CCCcCEeeeeecCCCCCCeEeeCCCCCCcccccCCCCchhhhHHHHHhccCCCcEEEEEEecCCCcceecCHHHCccccc
Confidence            479999999999999999999998643321              1112344567799999998 6799999999999997


Q ss_pred             chhc--cccccCChHHHHHHHHHHH
Q 003510          101 GLLS--SFHLKCKKPRFTQSLEEAK  123 (814)
Q Consensus       101 ~~~~--~~~~~~k~~~~~~A~~ea~  123 (814)
                      +...  ......+++..++|++.|.
T Consensus        81 ~~~~D~~kl~~~rk~~~rk~~~~Ay  105 (111)
T cd05839          81 DETLDKLKLKEGRKPSIRKAVQKAY  105 (111)
T ss_pred             chhhhhhhhhhccCHHHHHHHHHHH
Confidence            5331  1122334444444444443


No 26 
>PF05964 FYRN:  F/Y-rich N-terminus;  InterPro: IPR003888 The "FY-rich" domain N-terminal region is sometimes closely juxtaposed with the C-terminal region (IPR003889 from INTERPRO), but sometimes is far distant. It is of unknown function, but occurs frequently in chromatin-associated proteins like trithorax and its homologues.; GO: 0005634 nucleus; PDB: 2WZO_A.
Probab=99.70  E-value=9.3e-18  Score=132.15  Aligned_cols=54  Identities=43%  Similarity=0.746  Sum_probs=42.3

Q ss_pred             ecceeEEeeeeeecCCCCCCCCCcccCCCeEEEEEecCCCCCCCcceEEEEEEe
Q 003510          184 FGDLQILSLGKIVKDSEYFQDDRFIWPEGYTAVRKFTSLADPRVCNSYKMEVLR  237 (814)
Q Consensus       184 ~~~l~~~~lG~iv~~~~~fhs~~~i~P~Gy~s~R~~~s~~dp~~~~~y~~~I~~  237 (814)
                      +|+|+|+|||+|++++++||+++||||+||+++|.|+|+.||.++++|+|+|+|
T Consensus         1 igsl~v~sLG~i~~~~~~fh~~~~IyP~Gy~s~R~y~S~~~p~~~~~Y~~~Ild   54 (54)
T PF05964_consen    1 IGSLTVHSLGKIVPDRPAFHSERYIYPVGYKSSRLYWSTVDPRRRCRYTCEILD   54 (54)
T ss_dssp             -TTEEEEEEEE---SSGGGB-SS-B--EEEEEEEEEE-SS-TTSEEEEEEEEE-
T ss_pred             CCceEEEECeEEeCCCCCccCCCEEeeCCEEEEEEEccccCCCCEEEEEEEEeC
Confidence            589999999999999999999999999999999999999999999999999986


No 27 
>PF13771 zf-HC5HC2H:  PHD-like zinc-binding domain
Probab=99.63  E-value=1.5e-16  Score=140.87  Aligned_cols=88  Identities=38%  Similarity=0.759  Sum_probs=78.7

Q ss_pred             hhhhhccccceEEccCCC--cccccccccchhcccCccceeeCCccceeEecCCCCcCcccchhhHhhcCceEEeecccc
Q 003510          429 HLACAIWIPETCLTDVKR--MEPIDGLNRVSKDRWKLLCSICGVSYGACIQCSNTTCRVAYHPLCARAAGLCVELEDEDR  506 (814)
Q Consensus       429 H~~Ca~~~pe~~~~~~~~--~~~v~~~~~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~~g~~~~~~~~~~  506 (814)
                      |+.||+|+||+.+.+...  +.++.+++.++..++++.|.+|+++.||+|+|..++|.+.||++||+.+|+.+++...  
T Consensus         1 H~~Calwsp~v~~~~~~~~~~~~i~~v~~~~~~~~~~~C~~C~~~~Ga~i~C~~~~C~~~fH~~CA~~~~~~~~~~~~--   78 (90)
T PF13771_consen    1 HENCALWSPEVYFDESEDIGGFSIEDVEKEIKRRRKLKCSICKKKGGACIGCSHPGCSRSFHVPCARKAGCFIEFDED--   78 (90)
T ss_pred             ChHHheecCceEEeCCCccccccHHhHHHHHHHHhCCCCcCCCCCCCeEEEEeCCCCCcEEChHHHccCCeEEEEccC--
Confidence            899999999999998764  6788899999999999999999998899999999999999999999999999876521  


Q ss_pred             ccccccCCCcccccccccccccccC
Q 003510          507 LNLLSLDEDDEDQCIRLLSFCKKHK  531 (814)
Q Consensus       507 ~~~~~~~~~~~~~~~~~~~~C~~H~  531 (814)
                                   ...+.+||++|+
T Consensus        79 -------------~~~~~~~C~~H~   90 (90)
T PF13771_consen   79 -------------NGKFRIFCPKHS   90 (90)
T ss_pred             -------------CCceEEEChhcC
Confidence                         125889999996


No 28 
>PF05965 FYRC:  F/Y rich C-terminus;  InterPro: IPR003889 The "FY-rich" domain C-terminal region is sometimes closely juxtaposed with the N-terminal region (IPR003888 from INTERPRO), but sometimes is far distant. It is of unknown function, but occurs frequently in chromatin-associated proteins like trithorax and its homologues.; GO: 0005634 nucleus; PDB: 2WZO_A.
Probab=99.62  E-value=2.8e-16  Score=137.49  Aligned_cols=80  Identities=36%  Similarity=0.583  Sum_probs=58.2

Q ss_pred             cceEEEEcCC--CCceecCChhHHHHHHHHHHHhhccCCCCccccccccccccccCccccCCCcHHHHHHHhhcCCCCCC
Q 003510          244 RPLFRVTLDN--GEQFTGSTPSTCWSKICMKIREGQNNTSDDFSAEGAAEKISESGSDMFGFSNPEVMKLILGLTKSRPT  321 (814)
Q Consensus       244 ~P~F~Vt~~d--~~~~~~~s~~~~W~~i~k~i~~~~~~~~~~~~~~~~~~~~~~sG~~~FGls~p~v~~li~~Lp~a~~~  321 (814)
                      +|+|+|+++|  +..|.|.||+.||+.|+++|++.++...     .......+++|++||||++|.|++|||+||+++.|
T Consensus         3 ~P~F~Vt~~d~p~~~~~g~s~~~~W~~i~~~v~~~r~~~~-----~~~~~~~~isG~~~FGls~p~V~~lie~Lp~a~~c   77 (86)
T PF05965_consen    3 GPLFEVTSEDDPGEVFEGSSPTEAWSEILERVNEARKQSG-----LLKLPPNSISGPEMFGLSNPAVQRLIESLPGADKC   77 (86)
T ss_dssp             SEEEEEEETT-GGG-EEESSHHHHHHHHHHHHHHHHT------------TT----HHHHHSTTSHHHHHHHTTSTTGGG-
T ss_pred             CCEEEEEECCCCCCEEEeCCHHHHHHHHHHHHHHHHhhcc-----ccccCCCCCCHhHhcCCCCHHHHHHHHhCCCcchh
Confidence            4999999999  4569999999999999999999877753     12234568999999999999999999999999999


Q ss_pred             Cchhhhh
Q 003510          322 SKSSLCK  328 (814)
Q Consensus       322 ~k~~~~k  328 (814)
                      ++|.++.
T Consensus        78 ~~Y~f~~   84 (86)
T PF05965_consen   78 SNYKFRY   84 (86)
T ss_dssp             TT-----
T ss_pred             hcCCccc
Confidence            9997654


No 29 
>smart00542 FYRC "FY-rich" domain, C-terminal region. is sometimes closely juxtaposed with the N-terminal region (FYRN), but sometimes is far distant. Unknown function, but occurs frequently in chromatin-associated proteins.
Probab=99.62  E-value=4.4e-16  Score=135.40  Aligned_cols=80  Identities=30%  Similarity=0.489  Sum_probs=68.2

Q ss_pred             eEEEEcCC--CCceecCChhHHHHHHHHHHHhhccCCCCccccccccccccccCccccCCCcHHHHHHHhhcCCCCCCCc
Q 003510          246 LFRVTLDN--GEQFTGSTPSTCWSKICMKIREGQNNTSDDFSAEGAAEKISESGSDMFGFSNPEVMKLILGLTKSRPTSK  323 (814)
Q Consensus       246 ~F~Vt~~d--~~~~~~~s~~~~W~~i~k~i~~~~~~~~~~~~~~~~~~~~~~sG~~~FGls~p~v~~li~~Lp~a~~~~k  323 (814)
                      +|+|+++|  +..|.|.||++||+.|+++|++.++....     .......+||++||||++|+|++|||+||+++.|.+
T Consensus         1 lF~v~~~~~~~~~~~~~S~~~~W~~vl~~v~~~r~~~~~-----~~~~~~~isG~~mFGls~p~V~~lie~Lpga~~C~~   75 (86)
T smart00542        1 LFRVEIESDPDEVFKGESPEKCWEMVLERVQEARIVARL-----LQLLPEGVSGEDMFGLSSPAVVKLIEQLPGVHQCTN   75 (86)
T ss_pred             CeEEEEecCCCCeEEeCCHHHHHHHHHHHHHHHHHHccc-----CCCCCCCCCcHHHhCCCcHHHHHHHHhCCCchhhhh
Confidence            58999888  45799999999999999999998877532     112334789999999999999999999999999999


Q ss_pred             hhhhhcc
Q 003510          324 SSLCKLT  330 (814)
Q Consensus       324 ~~~~k~~  330 (814)
                      |++++..
T Consensus        76 Y~~~~~~   82 (86)
T smart00542       76 YWFRYHR   82 (86)
T ss_pred             hhhccCC
Confidence            9988654


No 30 
>COG2940 Proteins containing SET domain [General function prediction only]
Probab=99.59  E-value=2e-16  Score=181.96  Aligned_cols=140  Identities=40%  Similarity=0.672  Sum_probs=116.6

Q ss_pred             ceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCC-ceEEeccccCCcccc
Q 003510          649 RKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDD-ERVIDATRAGSIAHL  727 (814)
Q Consensus       649 ~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~-~~~iDa~~~gn~aRf  727 (814)
                      .....+..+.++|+|+||.+.|++|++|++|.|++++..++..++... .. .+....++.+.. ..++|+...|+.+||
T Consensus       331 ~~~~~~~~~~~~~~g~fa~~~i~~~e~i~~~~~~~~~~~~~~~~~~~~-~~-~~~~~~~~~~~~~~~~~d~~~~g~~~r~  408 (480)
T COG2940         331 REPNVVQESEIKGYGVFALESIKKGEFIIEYHGEIIRRKEAREREENY-DL-LGNEFSFGLLEDKDKVRDSQKAGDVARF  408 (480)
T ss_pred             cchhhhhhhcccccceeehhhccchHHHHHhcCcccchHHHHhhhccc-cc-cccccchhhccccchhhhhhhcccccce
Confidence            456677888899999999999999999999999999999888887753 22 222223333333 789999999999999


Q ss_pred             ccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCCCC---------CCeeeeeCCCCCccccC
Q 003510          728 INHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFFSID---------EQLACYCGFPRCRGVVN  790 (814)
Q Consensus       728 iNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~~~---------~~~~C~Cg~~~Cr~~~~  790 (814)
                      |||||.|||......+.|..++.++|+|||.+||||++||+...++         ..+.|.||++.|+++|+
T Consensus       409 ~nHS~~pN~~~~~~~~~g~~~~~~~~~rDI~~geEl~~dy~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  480 (480)
T COG2940         409 INHSCTPNCEASPIEVNGIFKISIYAIRDIKAGEELTYDYGPSLEDNRELKKLLEKRWGCACGEDRCSHTMS  480 (480)
T ss_pred             eecCCCCCcceecccccccceeeecccccchhhhhhccccccccccchhhhhhhhhhhccccCCCccCCCCC
Confidence            9999999999988777666799999999999999999999886554         35789999999999874


No 31 
>KOG1141 consensus Predicted histone methyl transferase [Chromatin structure and dynamics]
Probab=99.51  E-value=1.2e-14  Score=163.12  Aligned_cols=76  Identities=34%  Similarity=0.715  Sum_probs=67.7

Q ss_pred             eEEeccccCCccccccCCCCCCeeEEEEEECCe----eEEEEEEcCCCCCCCeeeEeCCCCCCC---CCeeeeeCCCCCc
Q 003510          714 RVIDATRAGSIAHLINHSCEPNCYSRVISVNGD----EHIIIFAKRDIKQWEELTYDYRFFSID---EQLACYCGFPRCR  786 (814)
Q Consensus       714 ~~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~~----~~i~i~A~rdI~~GEELt~dY~~~~~~---~~~~C~Cg~~~Cr  786 (814)
                      ++|||+..||++||+||||.||..++.|+++..    +-++|||.+-|++|.|||+||++....   ....|+||+.+||
T Consensus      1179 yvIDAk~eGNlGRfLNHSC~PNl~VQnVfvdTHdlrfPwVAFFt~kyVkAgtELTWDY~Ye~g~v~~keL~C~CGa~~Cr 1258 (1262)
T KOG1141|consen 1179 YVIDAKQEGNLGRFLNHSCDPNLHVQNVFVDTHDLRFPWVAFFTRKYVKAGTELTWDYQYEQGQVATKELTCHCGAENCR 1258 (1262)
T ss_pred             EEEecccccchhhhhccCCCccceeeeeeeeccccCCchhhhhhhhhhccCceeeeeccccccccccceEEEecChhhhh
Confidence            479999999999999999999999999998854    458899999999999999999986432   4689999999999


Q ss_pred             ccc
Q 003510          787 GVV  789 (814)
Q Consensus       787 ~~~  789 (814)
                      |.|
T Consensus      1259 grL 1261 (1262)
T KOG1141|consen 1259 GRL 1261 (1262)
T ss_pred             ccc
Confidence            976


No 32 
>KOG1904 consensus Transcription coactivator [Transcription]
Probab=99.50  E-value=1.7e-14  Score=160.26  Aligned_cols=89  Identities=22%  Similarity=0.375  Sum_probs=76.9

Q ss_pred             CCCCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccCCh
Q 003510           33 CQELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKCKK  112 (814)
Q Consensus        33 ~~~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~k~  112 (814)
                      ...|++||||||||+|||.|||+|.+....      ..++..+.|.|+|||++++|||.+++|+||..+ .+.+....++
T Consensus        10 ~~~~~~GDLV~AKlkgyp~WParI~~~~~~------~~kp~pkky~V~FfGT~e~Afl~p~dlqpy~~~-k~~~g~~~k~   82 (496)
T KOG1904|consen   10 AGNFKCGDLVFAKLKGYPPWPARIRNGPDG------AVKPPPKKYTVFFFGTKETAFLKPKDLQPYMLN-KEKLGKPNKR   82 (496)
T ss_pred             cCCCCCCceeeecccCCCCCcccccCcccc------cccCCCceeEEEEeccCcccccchhhccchhhh-hhhcccchhh
Confidence            446999999999999999999999875432      123456779999999999999999999999997 8888888888


Q ss_pred             --HHHHHHHHHHHHHHHh
Q 003510          113 --PRFTQSLEEAKVYLSE  128 (814)
Q Consensus       113 --~~~~~A~~ea~~~~~~  128 (814)
                        +.|++|++++.+++..
T Consensus        83 ~~k~F~~av~eI~~a~~n  100 (496)
T KOG1904|consen   83 VWKGFIEAVEEIREAFNN  100 (496)
T ss_pred             hhHHHHHHHHHHHHHhcC
Confidence              9999999999998843


No 33 
>PF00856 SET:  SET domain;  InterPro: IPR001214 The SET domain appears generally as one part of a larger multidomain protein, and recently there were described three structures of very different proteins with distinct domain compositions: Neurospora crassa DIM-5, a member of the Su(var) family of HKMTs which methylate histone H3 on lysine 9,human SET7 (also called SET9), which methylates H3 on lysine 4 and garden pea Rubisco LSMT, an enzyme that does not modify histones, but instead methylates lysine 14 in the flexible tail of the large subunit of the enzyme Rubisco. The SET domain itself turned out to be an uncommon structure. Although in all three studies, electron density maps revealed the location of the AdoMet or AdoHcy cofactor, the SET domain bears no similarity at all to the canonical/AdoMet-dependent methyltransferase fold. Strictly conserved in the C-terminal motif of the SET domain tyrosine could be involved in abstracting a proton from the protonated amino group of the substrate lysine, promoting its nucleophilic attack on the sulphonium methyl group of the AdoMet cofactor. In contrast to the AdoMet-dependent protein methyltranferases of the classical type, which tend to bind their polypeptide substrates on top of the cofactor, it is noted from the Rubisco LSMT structure that the AdoMet seems to bind in a separate cleft, suggesting how a polypeptide substrate could be subjected to multiple rounds of methylation without having to be released from the enzyme. In contrast, SET7/9 is able to add only a single methyl group to its substrate. It has been demonstrated that association of SET domain and myotubularin-related proteins modulates growth control []. The SET domain-containing Drosophila melanogaster (Fruit fly) protein, enhancer of zeste, has a function in segment determination and the mammalian homologue may be involved in the regulation of gene transcription and chromatin structure. Histone lysine methylation is part of the histone code that regulated chromatin function and epigenetic control of gene function. Histone lysine methyltransferases (HMTase) differ both in their substrate specificity for the various acceptor lysines as well as in their product specificity for the number of methyl groups (one, two, or three) they transfer. With just one exception [], the HMTases belong to SET family that can be classified according to the sequences surrounding the SET domain [, ]. Structural studies on the human SET7/9, a mono-methylase, have revealed the molecular basis for the specificity of the enzyme for the histone-target and the roles of the invariant residues in the SET domain in determining the methylation specificities [].  The pre-SET domain, as found in the SUV39 SET family, contains nine invariant cysteine residues that are grouped into two segments separated by a region of variable length. These 9 cysteines coordinate 3 zinc ions to form to form a triangular cluster, where each of the zinc ions is coordinated by 4 four cysteines to give a tetrahedral configuration. The function of this domain is structural, holding together 2 long segments of random coils. The C-terminal region including the post-SET domain is disordered when not interacting with a histone tail and in the absence of zinc. The three conserved cysteines in the post-SET domain form a zinc-binding site when coupled to a fourth conserved cysteine in the knot-like structure close to the SET domain active site []. The structured post-SET region brings in the C-terminal residues that participate in S-adenosylmethine-binding and histone tail interactions. The three conserved cysteine residues are essential for HMTase activity, as replacement with serine abolishes HMTase activity [], []. ; GO: 0005515 protein binding; PDB: 3TG5_A 3S7F_A 3RIB_B 3TG4_A 3S7J_A 3S7D_A 3S7B_A 3H6L_A 3SMT_A 3K5K_A ....
Probab=99.43  E-value=1.8e-13  Score=133.17  Aligned_cols=108  Identities=25%  Similarity=0.371  Sum_probs=75.0

Q ss_pred             CeeEEeeecCCCCCeEEeecCcccCHhHHhhh---HHH------------------------------------H-----
Q 003510          661 GFGIFAKHPHRAGDMVIEYTGELVRPSIADRR---EHF------------------------------------I-----  696 (814)
Q Consensus       661 G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r---~~~------------------------------------~-----  696 (814)
                      |+||||+++|++|++|+...+.+++.......   ...                                    .     
T Consensus         1 GrGl~At~dI~~Ge~I~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~   80 (162)
T PF00856_consen    1 GRGLFATRDIKAGEVILIPRPAILTPDEVSPQPELLRLQLSKALEEQSRSDFSIQKKQKAEKSERSPQLESLHSISLRSE   80 (162)
T ss_dssp             SEEEEESS-B-TTEEEEEESEEEEEHHHHHCHHHHSHHTTCSSSCSHHTTHHHHHHHHHHHHHHHHHHHHHHHHHCHTTT
T ss_pred             CEEEEECccCCCCCEEEEECcceEEehhhhhcccchhhhhhhhhcccccccccccccccccccccccccccccccccccc
Confidence            89999999999999999888888876655331   000                                    0     


Q ss_pred             ----------hhcccCCceeEEEcCCceEEeccccCCccccccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEe
Q 003510          697 ----------YNSLVGAGTYMFRIDDERVIDATRAGSIAHLINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYD  766 (814)
Q Consensus       697 ----------~~~~~~~~~y~~~~~~~~~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~d  766 (814)
                                ....................++.....++.|+||||.|||.+..........+.|+|.|+|++|||||++
T Consensus        81 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~p~~d~~NHsc~pn~~~~~~~~~~~~~~~~~a~r~I~~GeEi~is  160 (162)
T PF00856_consen   81 LQFSQAFQWSWFISWTRSDFSSRSFSEDDRDGIALYPFADMLNHSCDPNCEVSFDFDGDGGCLVVRATRDIKKGEEIFIS  160 (162)
T ss_dssp             CCTCCHHHHHHHHHHHHHEEEEEEETTEEEEEEEEETGGGGSEEESSTSEEEEEEEETTTTEEEEEESS-B-TTSBEEEE
T ss_pred             ccccccccchhhccccceeeeccccccccccccccCcHhHheccccccccceeeEeecccceEEEEECCccCCCCEEEEE
Confidence                      0000000011222223445667778889999999999999999877677899999999999999999999


Q ss_pred             CC
Q 003510          767 YR  768 (814)
Q Consensus       767 Y~  768 (814)
                      ||
T Consensus       161 YG  162 (162)
T PF00856_consen  161 YG  162 (162)
T ss_dssp             ST
T ss_pred             EC
Confidence            97


No 34 
>smart00541 FYRN "FY-rich" domain, N-terminal region. is sometimes closely juxtaposed with the C-terminal region (FYRC), but sometimes is far distant. Unknown function, but occurs frequently in chromatin-associated proteins.
Probab=99.38  E-value=3.6e-13  Score=100.65  Aligned_cols=41  Identities=27%  Similarity=0.553  Sum_probs=38.2

Q ss_pred             eecCCCCCCCCCcccCCCeEEEEEecCCCCCCCcceEEEEE
Q 003510          195 IVKDSEYFQDDRFIWPEGYTAVRKFTSLADPRVCNSYKMEV  235 (814)
Q Consensus       195 iv~~~~~fhs~~~i~P~Gy~s~R~~~s~~dp~~~~~y~~~I  235 (814)
                      ++.++++||++++|||+||+++|+|+|++||+++|.|+|.|
T Consensus         2 ~~~~~~~fh~~~~IyP~Gy~s~R~y~S~~dp~~~c~Y~c~i   42 (44)
T smart00541        2 LPIQGKLFHSEDAIFPVGYKSTRKYWSVKDPNRRCNYSCVI   42 (44)
T ss_pred             ccccCCCcccCCEEecCCEEEEEEEecccCCCCEEEEEEEE
Confidence            56789999999999999999999999999999999996666


No 35 
>PF13831 PHD_2:  PHD-finger; PDB: 2L43_A 2KU3_A.
Probab=99.17  E-value=4.7e-12  Score=90.49  Aligned_cols=36  Identities=44%  Similarity=1.013  Sum_probs=22.0

Q ss_pred             CCceEEccccccccccccccccccCCCCceeecccc
Q 003510          364 NNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCR  399 (814)
Q Consensus       364 ~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~  399 (814)
                      +|+||+|++|++.||+.|||+...+++..|+|++|+
T Consensus         1 ~n~ll~C~~C~v~VH~~CYGv~~~~~~~~W~C~~C~   36 (36)
T PF13831_consen    1 TNPLLFCDNCNVAVHQSCYGVSEVPDGDDWLCDRCE   36 (36)
T ss_dssp             -CEEEE-SSS--EEEHHHHT-SS--SS-----HHH-
T ss_pred             CCceEEeCCCCCcCChhhCCcccCCCCCcEECCcCC
Confidence            478999999999999999999998888789999995


No 36 
>KOG2589 consensus Histone tail methylase [Chromatin structure and dynamics]
Probab=98.91  E-value=1.2e-09  Score=114.31  Aligned_cols=115  Identities=24%  Similarity=0.277  Sum_probs=83.9

Q ss_pred             ccCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCceEEeccccCCccccccCCCCCCeeE
Q 003510          659 IHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDERVIDATRAGSIAHLINHSCEPNCYS  738 (814)
Q Consensus       659 ~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~~iDa~~~gn~aRfiNHSC~PN~~~  738 (814)
                      ..|--|.+++.+.+||=|-..+|-|+.-.+++++....    .+.+.|..-... ..--|...=+.|+||||.|.|||.+
T Consensus       136 ~~gAkivst~~w~~ndkIe~LvGcIaeLse~eE~~ll~----~g~nDFSvmySt-Rk~caqLwLGPaafINHDCrpnCkF  210 (453)
T KOG2589|consen  136 QNGAKIVSTKSWSRNDKIELLVGCIAELSEAEERSLLR----GGGNDFSVMYST-RKRCAQLWLGPAAFINHDCRPNCKF  210 (453)
T ss_pred             CCCceEEeeccccCCccHHHhhhhhhhcChhhhHHHHh----ccCCceeeeeec-ccchhhheeccHHhhcCCCCCCcee
Confidence            45889999999999999999999998888887774421    111222211110 0011222336899999999999987


Q ss_pred             EEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCCCC-CCeeeeeC
Q 003510          739 RVISVNGDEHIIIFAKRDIKQWEELTYDYRFFSID-EQLACYCG  781 (814)
Q Consensus       739 ~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~~~-~~~~C~Cg  781 (814)
                      ..   .|..++.+.++|||++|||||.-||..+++ +...|.|-
T Consensus       211 vs---~g~~tacvkvlRDIePGeEITcFYgs~fFG~~N~~CeC~  251 (453)
T KOG2589|consen  211 VS---TGRDTACVKVLRDIEPGEEITCFYGSGFFGENNEECECV  251 (453)
T ss_pred             ec---CCCceeeeehhhcCCCCceeEEeecccccCCCCceeEEe
Confidence            63   356899999999999999999999987776 46778883


No 37 
>KOG1081 consensus Transcription factor NSD1 and related SET domain proteins [Transcription]
Probab=98.83  E-value=1e-09  Score=124.29  Aligned_cols=125  Identities=30%  Similarity=0.484  Sum_probs=105.0

Q ss_pred             EeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEcCCceEEeccccCCccccccCCCCCCeeEEEEEEC
Q 003510          665 FAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRIDDERVIDATRAGSIAHLINHSCEPNCYSRVISVN  744 (814)
Q Consensus       665 fA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~~~~~~iDa~~~gn~aRfiNHSC~PN~~~~~~~~~  744 (814)
                      +|.++|.+|      +|++|...+...+..+. ........|+..+..+..||+...||+.||+||||+|||....+.+.
T Consensus       319 ~~~~~~~k~------vg~~i~~~e~~~~~~~~-~~~~~~~~~~~~~e~~~~id~~~~~n~sr~~nh~~~~~v~~~k~~~~  391 (463)
T KOG1081|consen  319 TAKADIRKG------VGEVIDDKECKARLQRV-KESDLVDFYMVFIQKDRIIDAGPKGNYSRFLNHSCQPNVETEKWQVI  391 (463)
T ss_pred             hhHHhhhcc------cCcccchhhheeehhhh-hccchhhhhhhhhhcccccccccccchhhhhcccCCCceeechhhee
Confidence            888888888      89999888777665532 22233445666666666999999999999999999999999999999


Q ss_pred             CeeEEEEEEcCCCCCCCeeeEeCCCCCCCCCeeeeeCCCCCccccCCChhHH
Q 003510          745 GDEHIIIFAKRDIKQWEELTYDYRFFSIDEQLACYCGFPRCRGVVNDTEAEE  796 (814)
Q Consensus       745 ~~~~i~i~A~rdI~~GEELt~dY~~~~~~~~~~C~Cg~~~Cr~~~~~~~~~~  796 (814)
                      +..++.++|.+.|.+|||||++|..........|.|++.+|.++++......
T Consensus       392 ~~t~~~~~a~~~i~~g~e~t~~~n~~~~~~~~~~~~~~e~~~~~~~k~~~~~  443 (463)
T KOG1081|consen  392 GDTRVGLFAPRQIEAGEELTFNYNGNCEGNEKRCCCGSENCTETKGKKKKKK  443 (463)
T ss_pred             cccccccccccccccchhhhheeeccccCCcceEeecccccccCCcccccch
Confidence            9999999999999999999999998877778899999999999998877633


No 38 
>PF00628 PHD:  PHD-finger;  InterPro: IPR019787 Zinc finger (Znf) domains are relatively small protein motifs which contain multiple finger-like protrusions that make tandem contacts with their target molecule. Some of these domains bind zinc, but many do not; instead binding other metals such as iron, or no metal at all. For example, some family members form salt bridges to stabilise the finger-like folds. They were first identified as a DNA-binding motif in transcription factor TFIIIA from Xenopus laevis (African clawed frog), however they are now recognised to bind DNA, RNA, protein and/or lipid substrates [, , , , ]. Their binding properties depend on the amino acid sequence of the finger domains and of the linker between fingers, as well as on the higher-order structures and the number of fingers. Znf domains are often found in clusters, where fingers can have different binding specificities. There are many superfamilies of Znf motifs, varying in both sequence and structure. They display considerable versatility in binding modes, even between members of the same class (e.g. some bind DNA, others protein), suggesting that Znf motifs are stable scaffolds that have evolved specialised functions. For example, Znf-containing proteins function in gene transcription, translation, mRNA trafficking, cytoskeleton organisation, epithelial development, cell adhesion, protein folding, chromatin remodelling and zinc sensing, to name but a few []. Zinc-binding motifs are stable structures, and they rarely undergo conformational changes upon binding their target.  This entry represents the PHD (homeodomain) zinc finger domain [,], which is a C4HC3 zinc-finger-like motif found in nuclear proteins thought to be involved in chromatin-mediated transcriptional regulation. The PHD finger motif is reminiscent of, but distinct from the C3HC4 type RING finger. The function of this domain is not yet known but in analogy with the LIM domain it could be involved in protein-protein interaction and be important for the assembly or activity of multicomponent complexes involved in transcriptional activation or repression. Alternatively, the interactions could be intra-molecular and be important in maintaining the structural integrity of the protein. In similarity to the RING finger and the LIM domain, the PHD finger is thought to bind two zinc ions. More information about these proteins can be found at Protein of the Month: Zinc Fingers [].; GO: 0005515 protein binding; PDB: 3ZVY_A 2LGG_A 3SOW_A 3SOU_B 3ASL_A 3ASK_A 3ZVZ_B 3T6R_A 2LGK_A 3SOX_B ....
Probab=97.68  E-value=1.1e-05  Score=63.03  Aligned_cols=45  Identities=36%  Similarity=0.842  Sum_probs=36.8

Q ss_pred             ccccccCCcccCCCceEEcccccccccccccccccc----CCCCceeecccc
Q 003510          352 KCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEP----VNGVLWLCNLCR  399 (814)
Q Consensus       352 ~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~----~~~~~W~C~~C~  399 (814)
                      +|.||..  ..+.+.+|+|+.|+..+|..|+|+...    +.+ .|+|..|+
T Consensus         1 ~C~vC~~--~~~~~~~i~C~~C~~~~H~~C~~~~~~~~~~~~~-~w~C~~C~   49 (51)
T PF00628_consen    1 YCPVCGQ--SDDDGDMIQCDSCNRWYHQECVGPPEKAEEIPSG-DWYCPNCR   49 (51)
T ss_dssp             EBTTTTS--SCTTSSEEEBSTTSCEEETTTSTSSHSHHSHHSS-SBSSHHHH
T ss_pred             eCcCCCC--cCCCCCeEEcCCCChhhCcccCCCChhhccCCCC-cEECcCCc
Confidence            5889988  445678999999999999999998643    233 89999996


No 39 
>smart00249 PHD PHD zinc finger. The plant homeodomain (PHD) finger is a C4HC3 zinc-finger-like motif found in nuclear proteins thought to be involved in epigenetics and chromatin-mediated transcriptional regulation. The PHD finger binds two zinc ions using the so-called 'cross-brace' motif and is thus structurally related to the KOG2461 consensus Transcription factor BLIMP-1/PRDI-BF1, contains C2H2-type Zn-finger and SET domains [Transcription]
Probab=97.58  E-value=6.1e-05  Score=83.77  Aligned_cols=110  Identities=23%  Similarity=0.303  Sum_probs=80.5

Q ss_pred             cceeEEEEEecc--cCeeEEeeecCCCCCeEEeecCcccCHhHHhhhHHHHhhcccCCceeEEEc---C-CceEEeccc-
Q 003510          648 FRKRLAFGKSGI--HGFGIFAKHPHRAGDMVIEYTGELVRPSIADRREHFIYNSLVGAGTYMFRI---D-DERVIDATR-  720 (814)
Q Consensus       648 ~~~~~~v~~s~~--~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r~~~~~~~~~~~~~y~~~~---~-~~~~iDa~~-  720 (814)
                      +...|.|..|.+  .|+||++...|.+|+--+=|.|+++...    ...      .....|+..+   + .-.+||++. 
T Consensus        26 LP~~l~i~~Ssv~~~~lgV~s~~~i~~G~~FGP~~G~~~~~~----~~~------~~n~~y~W~I~~~d~~~~~iDg~d~   95 (396)
T KOG2461|consen   26 LPPELRIKPSSVPVTGLGVWSNASILPGTSFGPFEGEIIASI----DSK------SANNRYMWEIFSSDNGYEYIDGTDE   95 (396)
T ss_pred             CCCceEeeccccCCccccccccccccCcccccCccCcccccc----ccc------cccCcceEEEEeCCCceEEeccCCh
Confidence            456677777754  5789999999999999999999982111    111      1123454444   3 336899986 


Q ss_pred             -cCCccccccCCCCC---CeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCCCC
Q 003510          721 -AGSIAHLINHSCEP---NCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRFFS  771 (814)
Q Consensus       721 -~gn~aRfiNHSC~P---N~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~~~  771 (814)
                       ..|+.||||=.++.   |..+.    .....|.++|+|+|++||||.+.|+.++
T Consensus        96 ~~sNWmRYV~~Ar~~eeQNL~A~----Q~~~~Ifyrt~r~I~p~eELlVWY~~e~  146 (396)
T KOG2461|consen   96 EHSNWMRYVNSARSEEEQNLLAF----QIGENIFYRTIRDIRPNEELLVWYGSEY  146 (396)
T ss_pred             hhcceeeeecccCChhhhhHHHH----hccCceEEEecccCCCCCeEEEEeccch
Confidence             88999999988765   64432    2346899999999999999999997654


No 41 
>KOG4323 consensus Polycomb-like PHD Zn-finger protein [General function prediction only]
Probab=97.18  E-value=0.00033  Score=78.03  Aligned_cols=117  Identities=22%  Similarity=0.306  Sum_probs=78.9

Q ss_pred             CCccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcchh
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWAH  429 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~WvH  429 (814)
                      ...|.||........|.+++|++|+...||.|--... +..+.|.+..|.....         ...||++|...   -+|
T Consensus        83 e~~~nv~~s~~~~p~~e~~~~~r~~~~~~q~~~i~~~-~~~~~~~~~~c~~~~~---------~~~g~a~K~g~---~a~  149 (464)
T KOG4323|consen   83 ELNPNVLTSETVLPENEKVICGRCKSGYHQGCNIPRF-PSLDIGESTECVFPIF---------SQEGGALKKGR---LAR  149 (464)
T ss_pred             ccCCcccccccccCchhhhhhhhhccCcccccCccCc-CcCCcccccccccccc---------ccccccccccc---ccc
Confidence            4689999988777788999999999999999975433 4444788888876543         24677777654   344


Q ss_pred             hhhhccccceEEccCCCcccccccccchhcccCccceeeCC----ccceeEecCCCCcCcccchhhHhhc
Q 003510          430 LACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGV----SYGACIQCSNTTCRVAYHPLCARAA  495 (814)
Q Consensus       430 ~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~----~~Ga~iqC~~~~C~~~fH~~CA~~~  495 (814)
                             |-+.+..       .+++.-......+.|+||..    ..--+|||.  +|.++||-.|-+..
T Consensus       150 -------~~l~y~~-------~~l~wD~~~~~n~qc~vC~~g~~~~~NrmlqC~--~C~~~fHq~Chqp~  203 (464)
T KOG4323|consen  150 -------PSLPYPE-------ASLDWDSGHKVNLQCSVCYCGGPGAGNRMLQCD--KCRQWYHQACHQPL  203 (464)
T ss_pred             -------ccccCcc-------cccccCccccccceeeeeecCCcCccceeeeec--ccccHHHHHhccCC
Confidence                   2222211       11111111122356999985    223899999  99999999998653


No 42 
>KOG4323 consensus Polycomb-like PHD Zn-finger protein [General function prediction only]
Probab=97.00  E-value=0.00043  Score=77.12  Aligned_cols=52  Identities=37%  Similarity=0.703  Sum_probs=41.8

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccc-----cCCCCceeeccccCCC
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELE-----PVNGVLWLCNLCRPGA  402 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~-----~~~~~~W~C~~C~~~~  402 (814)
                      ..|+||........|.||+|++|+--+||.|.-...     ......|+|..|..+.
T Consensus       169 ~qc~vC~~g~~~~~NrmlqC~~C~~~fHq~Chqp~i~~~l~~D~~~~w~C~~C~~~~  225 (464)
T KOG4323|consen  169 LQCSVCYCGGPGAGNRMLQCDKCRQWYHQACHQPLIKDELAGDPFYEWFCDVCNRGP  225 (464)
T ss_pred             ceeeeeecCCcCccceeeeecccccHHHHHhccCCCCHhhccCccceEeehhhccch
Confidence            569999988888888999999999999999985321     1123479999998764


No 43 
>KOG1084 consensus Transcription factor TCF20 [Transcription]
Probab=96.96  E-value=0.00037  Score=77.35  Aligned_cols=114  Identities=22%  Similarity=0.358  Sum_probs=76.2

Q ss_pred             ccccccccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceec-CCCcchhhhhhccccceEEccCCCcccccccc
Q 003510          376 MVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPT-TDGRWAHLACAIWIPETCLTDVKRMEPIDGLN  454 (814)
Q Consensus       376 ~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t-~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~  454 (814)
                      .+|+.|+-...... ..=+|+.|..-.......|++++...   .+. ....|+|+.|++|.|.+.+.....+..+.   
T Consensus       192 ~~~~~c~~~~a~ts-~~~~~~~~~~c~~~~e~~~~l~~~~~---~~d~~~~~~~h~~c~~~~~~~~~~q~~~l~~~~---  264 (375)
T KOG1084|consen  192 LNCKLCHEPGAPTS-QFDPCDIDDDCNRSREFFCALSPKAT---IPDIGFELWYHRYCALWAPNVHESQGGQLTNVD---  264 (375)
T ss_pred             cccccccCCCCccc-ccCCcchhhhhhhhhhhhhhhcCCCc---CCccchhHHHHHHHHhcCCcceeccCccccCch---
Confidence            35666664333211 11134433322222335788887554   233 45689999999999999998876665554   


Q ss_pred             cchhcccCccceeeCCccceeEecCCCCcCcccchhhHhhcCc
Q 003510          455 RVSKDRWKLLCSICGVSYGACIQCSNTTCRVAYHPLCARAAGL  497 (814)
Q Consensus       455 ~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~~g~  497 (814)
                      ........+.|..|.+ .|+.+.|...+|...+|.+|+..+-.
T Consensus       265 ~~v~r~~~~~c~~c~k-~ga~~~c~~~~~~~~~h~~c~~~~~~  306 (375)
T KOG1084|consen  265 NAVIRFPSLQCILCQK-PGATLKCVQASLLSNAHFPCARAKNG  306 (375)
T ss_pred             hhhhcccchhcccccC-CCCchhhhhhhhhcccCcccccCccc
Confidence            2222223379999999 69999999999999999999977654


No 44 
>PF15446 zf-PHD-like:  PHD/FYVE-zinc-finger like domain
Probab=96.84  E-value=0.001  Score=63.76  Aligned_cols=69  Identities=22%  Similarity=0.444  Sum_probs=47.6

Q ss_pred             ccccccC-CcccCCCceEEccccccccccccccccc-------cCCCCc--eeeccccCCC--C----CCCCCceecCCC
Q 003510          352 KCSVCHM-DEEYQNNLFLQCDKCRMMVHARCYGELE-------PVNGVL--WLCNLCRPGA--P----EPPPPCCLCPVV  415 (814)
Q Consensus       352 ~C~VC~~-~~~~~~n~iv~C~~C~~~vH~~CYg~~~-------~~~~~~--W~C~~C~~~~--~----~~~~~C~lC~~~  415 (814)
                      .|.+|.. +++.+..+||+|.+|..++|+.|.|...       .+....  --|++|.-..  .    ...-.|..|...
T Consensus         1 ~C~~C~~~g~~~~kG~Lv~CQGCs~sYHk~CLG~Rs~ReHlVTKVg~d~FVLQCr~Cig~~~kKD~~aP~~~~C~~C~~~   80 (175)
T PF15446_consen    1 TCDTCGYEGDDRNKGPLVYCQGCSSSYHKACLGPRSQREHLVTKVGDDDFVLQCRRCIGIAHKKDPRAPHHGMCQQCKKP   80 (175)
T ss_pred             CcccccCCCCCccCCCeEEcCccChHHHhhhcCCccccceeeEEEcCCceEEechhhcChhhcccCCCCCCCcccccCCC
Confidence            5999976 4566678999999999999999999532       111223  5599996422  1    123579999877


Q ss_pred             CCCce
Q 003510          416 GGAMK  420 (814)
Q Consensus       416 ~Galk  420 (814)
                      |-+-+
T Consensus        81 G~~c~   85 (175)
T PF15446_consen   81 GPSCK   85 (175)
T ss_pred             CCCCc
Confidence            75543


No 45 
>KOG1081 consensus Transcription factor NSD1 and related SET domain proteins [Transcription]
Probab=96.84  E-value=0.00052  Score=78.37  Aligned_cols=56  Identities=29%  Similarity=0.672  Sum_probs=46.6

Q ss_pred             CCCCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCcccc
Q 003510           33 CQELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISF   98 (814)
Q Consensus        33 ~~~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f   98 (814)
                      ...+..||+||-++..|+|||++|+.+..++.    ..   ... +|+||+.  ++|+....+.++
T Consensus       133 ~~~~~~~~~vw~~vg~~~~~~c~vc~~~~~~~----~~---~~~-~~~f~~~--~~~~~~~~~~~~  188 (463)
T KOG1081|consen  133 FKKREVGDLVWSKVGEYPWWPCMVCHDPLLPK----GM---KHD-HVNFFGC--YAWTHEKRVFPY  188 (463)
T ss_pred             eccccceeEEeEEcCcccccccceecCcccch----hh---ccc-cceeccc--hhhHHHhhhhhc
Confidence            44789999999999999999999998876651    11   111 8999999  999999999999


No 46 
>KOG1244 consensus Predicted transcription factor Requiem/NEURO-D4 [Transcription]
Probab=96.62  E-value=0.00088  Score=68.31  Aligned_cols=50  Identities=34%  Similarity=0.818  Sum_probs=40.2

Q ss_pred             CCCccccccCCcccCCCceEEcccccccccccccccc--ccCCCCceeeccccCC
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL--EPVNGVLWLCNLCRPG  401 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~--~~~~~~~W~C~~C~~~  401 (814)
                      +--.|+||+..+  ++++|+|||.|...+|.+|...+  .+|+| .|-|..|...
T Consensus       280 eck~csicgtse--nddqllfcddcdrgyhmyclsppm~eppeg-swsc~KOG~~  331 (336)
T KOG1244|consen  280 ECKYCSICGTSE--NDDQLLFCDDCDRGYHMYCLSPPMVEPPEG-SWSCHLCLEE  331 (336)
T ss_pred             ecceeccccCcC--CCceeEeecccCCceeeEecCCCcCCCCCC-chhHHHHHHH
Confidence            345899998754  45889999999999999999854  45655 9999999643


No 47 
>KOG1512 consensus PHD Zn-finger protein [General function prediction only]
Probab=96.49  E-value=0.0007  Score=69.35  Aligned_cols=58  Identities=26%  Similarity=0.528  Sum_probs=45.1

Q ss_pred             CCCCCCCccccccCCCccccccCCcccCCCceEEccccccccccccccccccCCCCceeec
Q 003510          336 LPGGYRPVRVDWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCN  396 (814)
Q Consensus       336 lp~~~~~~~~~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~  396 (814)
                      |...|++..+.--+-..|.||+...-+  +++++||.|.-.+|..|.|....|.| .|.|+
T Consensus       300 lv~~~KTY~W~C~~C~lC~IC~~P~~E--~E~~FCD~CDRG~HT~CVGL~~lP~G-~WICD  357 (381)
T KOG1512|consen  300 LVGQYKTYFWKCSSCELCRICLGPVIE--SEHLFCDVCDRGPHTLCVGLQDLPRG-EWICD  357 (381)
T ss_pred             HHhHHhhcchhhcccHhhhccCCcccc--hheeccccccCCCCccccccccccCc-cchhh
Confidence            334455433333366789999987654  46999999999999999999998887 99999


No 48 
>smart00508 PostSET Cysteine-rich motif following a subset of SET domains.
Probab=96.35  E-value=0.0019  Score=42.37  Aligned_cols=19  Identities=37%  Similarity=1.015  Sum_probs=16.4

Q ss_pred             CeeeeeCCCCCccccCCCh
Q 003510          775 QLACYCGFPRCRGVVNDTE  793 (814)
Q Consensus       775 ~~~C~Cg~~~Cr~~~~~~~  793 (814)
                      .++|+||+++|||+|+...
T Consensus         2 ~~~C~CGs~~CRG~l~~~~   20 (26)
T smart00508        2 KQPCLCGAPNCRGFLGXXX   20 (26)
T ss_pred             CeeeeCCCccccceecccc
Confidence            5799999999999997654


No 49 
>KOG0825 consensus PHD Zn-finger protein [General function prediction only]
Probab=94.65  E-value=0.015  Score=67.37  Aligned_cols=49  Identities=24%  Similarity=0.670  Sum_probs=38.8

Q ss_pred             CCCccccccCCcccCCCceEEccccccc-cccccccccc--cCCCCceeeccccC
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMM-VHARCYGELE--PVNGVLWLCNLCRP  400 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~-vH~~CYg~~~--~~~~~~W~C~~C~~  400 (814)
                      +...|.||...+.+  +.||.||.|+.+ +|.+|+-...  ++-+ .|+|+-|..
T Consensus       214 E~~~C~IC~~~DpE--dVLLLCDsCN~~~YH~YCLDPdl~eiP~~-eWYC~NC~d  265 (1134)
T KOG0825|consen  214 EEVKCDICTVHDPE--DVLLLCDSCNKVYYHVYCLDPDLSESPVN-EWYCTNCSL  265 (1134)
T ss_pred             ccccceeeccCChH--HhheeecccccceeeccccCccccccccc-ceecCcchh
Confidence            34589999987654  579999999999 9999997532  4444 899999964


No 50 
>KOG4299 consensus PHD Zn-finger protein [General function prediction only]
Probab=94.08  E-value=0.018  Score=66.00  Aligned_cols=48  Identities=29%  Similarity=0.684  Sum_probs=40.2

Q ss_pred             CccccccCCcccCCCceEEcccccccccccccccc----ccCCCCceeeccccCC
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL----EPVNGVLWLCNLCRPG  401 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~----~~~~~~~W~C~~C~~~  401 (814)
                      ++|.-|...+..  |.||.||+|...+||.|.-.+    ..|+| .|+|.-|...
T Consensus       254 ~fCsaCn~~~~F--~~~i~CD~Cp~sFH~~CLePPl~~eniP~g-~W~C~ec~~k  305 (613)
T KOG4299|consen  254 DFCSACNGSGLF--NDIICCDGCPRSFHQTCLEPPLEPENIPPG-SWFCPECKIK  305 (613)
T ss_pred             HHHHHhCCcccc--ccceeecCCchHHHHhhcCCCCCcccCCCC-ccccCCCeee
Confidence            599999998766  778999999999999999754    34555 8999999853


No 51 
>COG5034 TNG2 Chromatin remodeling protein, contains PhD zinc finger [Chromatin structure and dynamics]
Probab=92.96  E-value=0.064  Score=54.93  Aligned_cols=52  Identities=27%  Similarity=0.639  Sum_probs=39.8

Q ss_pred             cccccCCCccccccCCcccCCCceEEccc--ccc-ccccccccccccCCCCceeeccccC
Q 003510          344 RVDWKDLDKCSVCHMDEEYQNNLFLQCDK--CRM-MVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       344 ~~~~~~~~~C~VC~~~~~~~~n~iv~C~~--C~~-~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ....++..+|- |...-.   .+||-||+  |.. =+|..|-|+..+|.| .|+|+-|+.
T Consensus       215 d~se~e~lYCf-CqqvSy---GqMVaCDn~nCkrEWFH~~CVGLk~pPKG-~WYC~eCk~  269 (271)
T COG5034         215 DNSEGEELYCF-CQQVSY---GQMVACDNANCKREWFHLECVGLKEPPKG-KWYCPECKK  269 (271)
T ss_pred             ccccCceeEEE-eccccc---ccceecCCCCCchhheeccccccCCCCCC-cEeCHHhHh
Confidence            34445556765 776543   46999996  765 489999999999888 999999974


No 52 
>PF14446 Prok-RING_1:  Prokaryotic RING finger family 1
Probab=92.87  E-value=0.067  Score=41.78  Aligned_cols=33  Identities=24%  Similarity=0.568  Sum_probs=26.8

Q ss_pred             CCCccccccCCcccCCCceEEccccccccccccc
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCY  382 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CY  382 (814)
                      ....|.+|...-.. .+.+|+|..|+..+|..||
T Consensus         4 ~~~~C~~Cg~~~~~-~dDiVvCp~CgapyHR~C~   36 (54)
T PF14446_consen    4 EGCKCPVCGKKFKD-GDDIVVCPECGAPYHRDCW   36 (54)
T ss_pred             cCccChhhCCcccC-CCCEEECCCCCCcccHHHH
Confidence            34689999886532 3348999999999999999


No 53 
>KOG1973 consensus Chromatin remodeling protein, contains PHD Zn-finger [Chromatin structure and dynamics]
Probab=92.80  E-value=0.061  Score=57.61  Aligned_cols=37  Identities=27%  Similarity=0.728  Sum_probs=32.6

Q ss_pred             CceEEccc--cc-cccccccccccccCCCCceeeccccCCC
Q 003510          365 NLFLQCDK--CR-MMVHARCYGELEPVNGVLWLCNLCRPGA  402 (814)
Q Consensus       365 n~iv~C~~--C~-~~vH~~CYg~~~~~~~~~W~C~~C~~~~  402 (814)
                      ..||-||+  |. -=||..|-|+..+|.| .|||..|+...
T Consensus       230 g~Mi~CDn~~C~~eWFH~~CVGL~~~Pkg-kWyC~~C~~~~  269 (274)
T KOG1973|consen  230 GKMIGCDNPGCPIEWFHFTCVGLKTKPKG-KWYCPRCKAEN  269 (274)
T ss_pred             ccccccCCCCCCcceEEEeccccccCCCC-cccchhhhhhh
Confidence            45999998  99 7899999999998888 69999998643


No 54 
>PF08169 RBB1NT:  RBB1NT (NUC162) domain;  InterPro: IPR012603 This domain is found N-terminal to the ARID/BRIGHT domain in DNA-binding proteins of the Retinoblastoma-binding protein 1 family [].; PDB: 2YRV_A.
Probab=92.32  E-value=0.23  Score=43.73  Aligned_cols=85  Identities=22%  Similarity=0.318  Sum_probs=48.6

Q ss_pred             CCCEEEEeeC--CCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccccccchhccccccCChHHH
Q 003510           38 PGDIIWAKLT--GHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLKGLLSSFHLKCKKPRF  115 (814)
Q Consensus        38 ~GdlVwaK~~--GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~~~~~~~~~~~k~~~~  115 (814)
                      .|-+|-....  --.|-||.|+.++-...   .  .-++.++.|+=|-|..|+-|+.+++..|...     .........
T Consensus         8 lGkVV~V~~~~~k~~W~PALVVsPsc~dd---v--~VkKD~~lVRSFkD~KfysV~rkd~~e~~~~-----~~~k~e~s~   77 (96)
T PF08169_consen    8 LGKVVCVESTKKKTSWFPALVVSPSCNDD---V--TVKKDQCLVRSFKDGKFYSVARKDVREFDID-----SLPKSESSL   77 (96)
T ss_dssp             TTSEEEEE-SS-SS-EEEEEEE--SS-SS---------TT-EEEEESSS--EEEE-TTTEE---ST-----TS-HHHHHH
T ss_pred             cCcEEEEEcCCCCCceeeEEEEcCCccce---e--eeccceEEEEEeccCceEEEEhhhhhhcccc-----cCCcccchh
Confidence            6777777554  34699999999754333   1  2446789999999999999999999988764     111122467


Q ss_pred             HHHHHHHHHHHHhCCCc
Q 003510          116 TQSLEEAKVYLSEQKLP  132 (814)
Q Consensus       116 ~~A~~ea~~~~~~~~~~  132 (814)
                      +.|++.|..++....+|
T Consensus        78 k~al~~A~~Fl~~~~vP   94 (96)
T PF08169_consen   78 KPALDKASTFLKTGVVP   94 (96)
T ss_dssp             -HHHHHHHHHHHS----
T ss_pred             hHHHHHHHHHHhcCCCC
Confidence            89999999999877665


No 55 
>PF11717 Tudor-knot:  RNA binding activity-knot of a chromodomain ; PDB: 2EKO_A 2RO0_A 2RNZ_A 1WGS_A 3E9G_A 3E9F_A 2K3X_A 2K3Y_A 2EFI_A 2F5K_F ....
Probab=91.66  E-value=0.19  Score=39.83  Aligned_cols=52  Identities=15%  Similarity=0.234  Sum_probs=41.2

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCE--EEEeCCCcc
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDF--ARINVKQVI   96 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~--awv~~~~l~   96 (814)
                      |++|+.|+++.+.--|-+|.|++..         ...+...|.|.|.|-+.+  -||+.++|.
T Consensus         1 ~~vG~~v~~~~~~~~~y~A~I~~~r---------~~~~~~~YyVHY~g~nkR~DeWV~~~~i~   54 (55)
T PF11717_consen    1 FEVGEKVLCKYKDGQWYEAKILDIR---------EKNGEPEYYVHYQGWNKRLDEWVPESRIR   54 (55)
T ss_dssp             --TTEEEEEEETTTEEEEEEEEEEE---------ECTTCEEEEEEETTSTGCC-EEEETTTEE
T ss_pred             CCcCCEEEEEECCCcEEEEEEEEEE---------ecCCCEEEEEEcCCCCCCceeeecHHHcc
Confidence            6799999999988889999998742         233446799999999885  999999874


No 56 
>smart00249 PHD PHD zinc finger. The plant homeodomain (PHD) finger is a C4HC3 zinc-finger-like motif found in nuclear proteins thought to be involved in epigenetics and chromatin-mediated transcriptional regulation. The PHD finger binds two zinc ions using the so-called 'cross-brace' motif and is thus structurally related to the smart00743 Agenet Tudor-like domain present in plant sequences. Domain in plant sequences with possible chromatin-associated functions.
Probab=90.01  E-value=0.38  Score=38.82  Aligned_cols=53  Identities=11%  Similarity=0.139  Sum_probs=38.8

Q ss_pred             CCCCCCEEEEeeC-CCCCCCceeeCCCCcCccccccccCCCCcEEEEEeC--CCCEEEEeCCCccccc
Q 003510           35 ELEPGDIIWAKLT-GHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFG--THDFARINVKQVISFL   99 (814)
Q Consensus        35 ~f~~GdlVwaK~~-GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg--~~~~awv~~~~l~~f~   99 (814)
                      .|+.||+|-|+.+ .-.||+|+|.....            .+.|.|+|.+  ....-=++.++|+|-.
T Consensus         2 ~~~~G~~Ve~~~~~~~~W~~a~V~~~~~------------~~~~~V~~~~~~~~~~e~v~~~~LRp~~   57 (61)
T smart00743        2 DFKKGDRVEVFSKEEDSWWEAVVTKVLG------------DGKYLVRYLTESEPLKETVDWSDLRPHP   57 (61)
T ss_pred             CcCCCCEEEEEECCCCEEEEEEEEEECC------------CCEEEEEECCCCcccEEEEeHHHcccCC
Confidence            5899999999983 56799999976311            3458999998  6555666666666643


No 58 
>smart00333 TUDOR Tudor domain. Domain of unknown function present in several RNA-binding proteins. 10 copies in the Drosophila Tudor protein. Initial proposal that the survival motor neuron gene product contain a Tudor domain are corroborated by more recent database search techniques such as PSI-BLAST (unpublished).
Probab=89.42  E-value=0.5  Score=37.40  Aligned_cols=54  Identities=11%  Similarity=0.110  Sum_probs=44.6

Q ss_pred             CCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCcccccc
Q 003510           35 ELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVISFLK  100 (814)
Q Consensus        35 ~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~f~~  100 (814)
                      .+++|++|-|+...=-|.+|+|.....            .+.+.|+|.+.....||+..+|.+...
T Consensus         2 ~~~~G~~~~a~~~d~~wyra~I~~~~~------------~~~~~V~f~D~G~~~~v~~~~l~~l~~   55 (57)
T smart00333        2 TFKVGDKVAARWEDGEWYRARIIKVDG------------EQLYEVFFIDYGNEEVVPPSDLRPLPE   55 (57)
T ss_pred             CCCCCCEEEEEeCCCCEEEEEEEEECC------------CCEEEEEEECCCccEEEeHHHeecCCC
Confidence            478999999999666799999976421            145899999999999999999987754


No 59 
>KOG1141 consensus Predicted histone methyl transferase [Chromatin structure and dynamics]
Probab=88.50  E-value=0.45  Score=56.06  Aligned_cols=57  Identities=19%  Similarity=0.232  Sum_probs=50.9

Q ss_pred             chhhhhHHHhhccceeEEEEEecccCeeEEeeecCCCCCeEEeecCcccCHhHHhhh
Q 003510          636 SMADKYKHMKETFRKRLAFGKSGIHGFGIFAKHPHRAGDMVIEYTGELVRPSIADRR  692 (814)
Q Consensus       636 ~~~~~~~~l~~~~~~~~~v~~s~~~G~GvfA~~~i~~G~~I~ey~Gevi~~~~~~~r  692 (814)
                      ..-|.||..|-+.+.+|.+.++..+|||++...+|..|.||+-|.|.++...-++..
T Consensus       785 ~~~C~nrmvqhg~qvRlq~fkt~~kGWg~rclddi~~g~fVciy~g~~l~~~~sdks  841 (1262)
T KOG1141|consen  785 GPDCLNRMVQHGYQVRLQRFKTIHKGWGRRCLDDITGGNFVCIYPGGALLHQISDKS  841 (1262)
T ss_pred             cHHHHHHHhhcCceeEeeeccccccccceEeeeecCCceEEEEecchhhhhhhchhh
Confidence            345678889999999999999999999999999999999999999999887766655


No 60 
>KOG0383 consensus Predicted helicase [General function prediction only]
Probab=88.36  E-value=0.2  Score=59.52  Aligned_cols=49  Identities=33%  Similarity=0.716  Sum_probs=39.3

Q ss_pred             cccCCCccccccCCcccCCCceEEcccccccccccccccc--ccCCCCceeeccccC
Q 003510          346 DWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL--EPVNGVLWLCNLCRP  400 (814)
Q Consensus       346 ~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~--~~~~~~~W~C~~C~~  400 (814)
                      .|.+.+.|.||...+.     ++-|+.|-..+|..|.+..  ..+.++ |.|.+|..
T Consensus        43 ~~~~~e~c~ic~~~g~-----~l~c~tC~~s~h~~cl~~pl~~~p~~~-~~c~Rc~~   93 (696)
T KOG0383|consen   43 DDAEQEACRICADGGE-----LLWCDTCPASFHASCLGPPLTPQPNGE-FICPRCFC   93 (696)
T ss_pred             chhhhhhhhhhcCCCc-----EEEeccccHHHHHHccCCCCCcCCccc-eeeeeecc
Confidence            4556689999987653     7789999999999999865  345665 99999954


No 61 
>PF15057 DUF4537:  Domain of unknown function (DUF4537)
Probab=87.24  E-value=0.79  Score=42.95  Aligned_cols=72  Identities=18%  Similarity=0.304  Sum_probs=49.1

Q ss_pred             CchhhhhhcccccCCCCCCCCCEEEEeeC--CCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCcc
Q 003510           19 DYDEMVVLAASLDDCQELEPGDIIWAKLT--GHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVI   96 (814)
Q Consensus        19 ~~~~~~~~~~~~~~~~~f~~GdlVwaK~~--GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~   96 (814)
                      ...++..+..++  ...+++||-|+|+-.  ++.|=||+|..-.+       +.......|.|.||... .++++...+.
T Consensus        41 ~~~~iI~~~~~~--~~~L~~GD~VLA~~~~~~~~Y~Pg~V~~~~~-------~~~~~~~~~~V~f~ng~-~~~vp~~~~~  110 (124)
T PF15057_consen   41 PISDIIALSDAM--RHSLQVGDKVLAPWEPDDCRYGPGTVIAGPE-------RRASEDKEYTVRFYNGK-TAKVPRGEVI  110 (124)
T ss_pred             ChHHeEEccCcc--cCcCCCCCEEEEecCcCCCEEeCEEEEECcc-------ccccCCceEEEEEECCC-CCccchhhEE
Confidence            344444444443  778999999999976  77789999985321       12344567999999877 5667666666


Q ss_pred             cccc
Q 003510           97 SFLK  100 (814)
Q Consensus        97 ~f~~  100 (814)
                      ....
T Consensus       111 ~I~~  114 (124)
T PF15057_consen  111 WISP  114 (124)
T ss_pred             ECCH
Confidence            5544


No 62 
>PF00628 PHD:  PHD-finger;  InterPro: IPR019787 Zinc finger (Znf) domains are relatively small protein motifs which contain multiple finger-like protrusions that make tandem contacts with their target molecule. Some of these domains bind zinc, but many do not; instead binding other metals such as iron, or no metal at all. For example, some family members form salt bridges to stabilise the finger-like folds. They were first identified as a DNA-binding motif in transcription factor TFIIIA from Xenopus laevis (African clawed frog), however they are now recognised to bind DNA, RNA, protein and/or lipid substrates [, , , , ]. Their binding properties depend on the amino acid sequence of the finger domains and of the linker between fingers, as well as on the higher-order structures and the number of fingers. Znf domains are often found in clusters, where fingers can have different binding specificities. There are many superfamilies of Znf motifs, varying in both sequence and structure. They display considerable versatility in binding modes, even between members of the same class (e.g. some bind DNA, others protein), suggesting that Znf motifs are stable scaffolds that have evolved specialised functions. For example, Znf-containing proteins function in gene transcription, translation, mRNA trafficking, cytoskeleton organisation, epithelial development, cell adhesion, protein folding, chromatin remodelling and zinc sensing, to name but a few []. Zinc-binding motifs are stable structures, and they rarely undergo conformational changes upon binding their target.  This entry represents the PHD (homeodomain) zinc finger domain [,], which is a C4HC3 zinc-finger-like motif found in nuclear proteins thought to be involved in chromatin-mediated transcriptional regulation. The PHD finger motif is reminiscent of, but distinct from the C3HC4 type RING finger. The function of this domain is not yet known but in analogy with the LIM domain it could be involved in protein-protein interaction and be important for the assembly or activity of multicomponent complexes involved in transcriptional activation or repression. Alternatively, the interactions could be intra-molecular and be important in maintaining the structural integrity of the protein. In similarity to the RING finger and the LIM domain, the PHD finger is thought to bind two zinc ions. More information about these proteins can be found at Protein of the Month: Zinc Fingers [].; GO: 0005515 protein binding; PDB: 3ZVY_A 2LGG_A 3SOW_A 3SOU_B 3ASL_A 3ASK_A 3ZVZ_B 3T6R_A 2LGK_A 3SOX_B ....
Probab=85.39  E-value=0.41  Score=37.04  Aligned_cols=29  Identities=38%  Similarity=0.954  Sum_probs=24.4

Q ss_pred             ceeeCC--ccceeEecCCCCcCcccchhhHhhc
Q 003510          465 CSICGV--SYGACIQCSNTTCRVAYHPLCARAA  495 (814)
Q Consensus       465 C~~C~~--~~Ga~iqC~~~~C~~~fH~~CA~~~  495 (814)
                      |.+|++  ..+.+|+|.  .|..+||..|....
T Consensus         2 C~vC~~~~~~~~~i~C~--~C~~~~H~~C~~~~   32 (51)
T PF00628_consen    2 CPVCGQSDDDGDMIQCD--SCNRWYHQECVGPP   32 (51)
T ss_dssp             BTTTTSSCTTSSEEEBS--TTSCEEETTTSTSS
T ss_pred             CcCCCCcCCCCCeEEcC--CCChhhCcccCCCC
Confidence            777876  478999999  89999999998544


No 63 
>KOG0957 consensus PHD finger protein [General function prediction only]
Probab=84.80  E-value=0.71  Score=51.54  Aligned_cols=48  Identities=25%  Similarity=0.646  Sum_probs=37.3

Q ss_pred             CCCccccccCCcccCCCceEEccccccccccccccccc--cCC---CCceeeccc
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELE--PVN---GVLWLCNLC  398 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~--~~~---~~~W~C~~C  398 (814)
                      ....|.||....  +.-.++.||.|++.+|..|+..+.  .|.   ...|.|.-|
T Consensus       543 ~~ysCgiCkks~--dQHll~~CDtC~lhYHlGCL~PPLTR~Pkk~kn~gWqCsEC  595 (707)
T KOG0957|consen  543 MNYSCGICKKST--DQHLLTQCDTCHLHYHLGCLSPPLTRLPKKNKNFGWQCSEC  595 (707)
T ss_pred             cceeeeeeccch--hhHHHhhcchhhceeeccccCCccccCcccccCcceeeccc
Confidence            346899999854  456799999999999999997542  222   346999999


No 64 
>KOG1473 consensus Nucleosome remodeling factor, subunit NURF301/BPTF [Chromatin structure and dynamics; Transcription]
Probab=84.03  E-value=0.95  Score=55.39  Aligned_cols=110  Identities=25%  Similarity=0.494  Sum_probs=73.7

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccc-cCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcchh
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELE-PVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWAH  429 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~-~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~WvH  429 (814)
                      +.|.+|...++     ++.|..|...||..|.--+. ......|-|..|...+.+....|+|=+.+.+...+.+.+    
T Consensus       345 dhcrf~~d~~~-----~lc~Et~prvvhlEcv~hP~~~~~s~~~e~evc~~hkvngvvd~vl~~~K~~~~iR~~~i----  415 (1414)
T KOG1473|consen  345 DHCRFCHDLGD-----LLCCETCPRVVHLECVFHPRFAVPSAFWECEVCNIHKVNGVVDCVLPPSKNVDSIRHTPI----  415 (1414)
T ss_pred             ccccccCcccc-----eeecccCCceEEeeecCCccccCCCccchhhhhhhhccCcccccccChhhcccceeccCC----
Confidence            58999987554     88999999999999975332 233448999999876655566788888777776443321    


Q ss_pred             hhhhccccceEEccCCCcccccccccchhccc--CccceeeCCccceeEecCCCCcCcccch-hhHh
Q 003510          430 LACAIWIPETCLTDVKRMEPIDGLNRVSKDRW--KLLCSICGVSYGACIQCSNTTCRVAYHP-LCAR  493 (814)
Q Consensus       430 ~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~--~~~C~~C~~~~Ga~iqC~~~~C~~~fH~-~CA~  493 (814)
                                            |.+......|  ...|.||+. .|..+ |.+..|...||. .|--
T Consensus       416 ----------------------G~dr~gr~ywfi~rrl~Ie~~-det~l-~yysT~pqly~ll~cLd  458 (1414)
T KOG1473|consen  416 ----------------------GRDRYGRKYWFISRRLRIEGM-DETLL-WYYSTCPQLYHLLRCLD  458 (1414)
T ss_pred             ----------------------CcCccccchhceeeeeEEecC-CCcEE-EEecCcHHHHHHHHHhc
Confidence                                  1111111111  247999997 45444 445679999999 7753


No 65 
>PF07649 C1_3:  C1-like domain;  InterPro: IPR011424 This short domain is rich in cysteines and histidines. The pattern of conservation is similar to that found in IPR002219 from INTERPRO. C1 domains are protein kinase C-like zinc finger structures. Diacylglycerol (DAG) kinases (DGKs) have a two or three commonly conserved cysteine-rich C1 domains []. DGKs modulate the balance between the two signaling lipids, DAG and phosphatidic acid (PA), by phosphorylating DAG to yield PA []. The PKD (protein kinase D) family are novel DAG receptors. They have twin C1 domains, designated C1a and C1b, which bind DAG or phorbol esters. Individual C1 domains differ in ligand-binding activity and selectivity []. ; GO: 0047134 protein-disulfide reductase activity, 0055114 oxidation-reduction process; PDB: 1V5N_A.
Probab=83.27  E-value=0.5  Score=32.40  Aligned_cols=28  Identities=25%  Similarity=0.829  Sum_probs=12.4

Q ss_pred             ccccccCCcccCCCceEEcccccccccccc
Q 003510          352 KCSVCHMDEEYQNNLFLQCDKCRMMVHARC  381 (814)
Q Consensus       352 ~C~VC~~~~~~~~n~iv~C~~C~~~vH~~C  381 (814)
                      .|++|....+.  +....|..|+..+|..|
T Consensus         2 ~C~~C~~~~~~--~~~Y~C~~Cdf~lH~~C   29 (30)
T PF07649_consen    2 RCDACGKPIDG--GWFYRCSECDFDLHEEC   29 (30)
T ss_dssp             --TTTS----S----EEE-TTT-----HHH
T ss_pred             cCCcCCCcCCC--CceEECccCCCccChhc
Confidence            58999876543  46889999999999988


No 66 
>KOG1044 consensus Actin-binding LIM Zn-finger protein Limatin involved in axon guidance [Signal transduction mechanisms; Cytoskeleton]
Probab=83.07  E-value=0.46  Score=54.15  Aligned_cols=38  Identities=24%  Similarity=0.542  Sum_probs=26.4

Q ss_pred             hhcccCccceeeCC-ccceeEecCCCCcCcccchhhHhhcCce
Q 003510          457 SKDRWKLLCSICGV-SYGACIQCSNTTCRVAYHPLCARAAGLC  498 (814)
Q Consensus       457 ~~~~~~~~C~~C~~-~~Ga~iqC~~~~C~~~fH~~CA~~~g~~  498 (814)
                      ....+..+|..|.+ ..|..+|=.  +  ..|||+||+-.-+.
T Consensus       187 y~~~fgvkc~~c~~fisgkvLqag--~--kh~HPtCARCsRCg  225 (670)
T KOG1044|consen  187 YQAKFGVKCEECEKFISGKVLQAG--D--KHFHPTCARCSRCG  225 (670)
T ss_pred             hhhhcCeehHHhhhhhhhhhhhcc--C--cccCcchhhhhhhc
Confidence            44455667888876 456666654  3  78999999877664


No 67 
>KOG1512 consensus PHD Zn-finger protein [General function prediction only]
Probab=82.73  E-value=0.75  Score=47.82  Aligned_cols=49  Identities=16%  Similarity=0.457  Sum_probs=36.7

Q ss_pred             CccccccCCccc----CCCceEEccccccccccccccccc----cCCCCceeecccc
Q 003510          351 DKCSVCHMDEEY----QNNLFLQCDKCRMMVHARCYGELE----PVNGVLWLCNLCR  399 (814)
Q Consensus       351 ~~C~VC~~~~~~----~~n~iv~C~~C~~~vH~~CYg~~~----~~~~~~W~C~~C~  399 (814)
                      ..|.+|+.....    .-|-+|.|.-|..+.|-+|.....    ......|-|-.|+
T Consensus       259 ~~~~~~~~~~~~~~~~r~~S~I~C~~C~~~~HP~Ci~M~~elv~~~KTY~W~C~~C~  315 (381)
T KOG1512|consen  259 NERKHFWDIQTNIIQSRRNSWIVCKPCATRPHPYCVAMIPELVGQYKTYFWKCSSCE  315 (381)
T ss_pred             hhhhhhhcchhhhhhhhhccceeecccccCCCCcchhcCHHHHhHHhhcchhhcccH
Confidence            589999876532    346689999999999999987542    2334579988886


No 68 
>KOG2084 consensus Predicted histone tail methylase containing SET domain [Chromatin structure and dynamics]
Probab=82.15  E-value=2.1  Score=49.47  Aligned_cols=40  Identities=33%  Similarity=0.422  Sum_probs=29.0

Q ss_pred             cccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCC-eeeEeCCCC
Q 003510          727 LINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWE-ELTYDYRFF  770 (814)
Q Consensus       727 fiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GE-ELt~dY~~~  770 (814)
                      ++||||.||+..   ..+ .....+++...+.+++ ||++.|...
T Consensus       208 ~~~hsC~pn~~~---~~~-~~~~~~~~~~~~~~~~~~l~~~y~~~  248 (482)
T KOG2084|consen  208 LFNHSCFPNISV---IFD-GRGLALLVPAGIDAGEEELTISYTDP  248 (482)
T ss_pred             hcccCCCCCeEE---EEC-CceeEEEeecccCCCCCEEEEeeccc
Confidence            679999999872   222 3455566777777776 999999554


No 69 
>cd04508 TUDOR Tudor domains are found in many eukaryotic organisms and have been implicated in protein-protein interactions in which methylated protein substrates bind to these domains. For example, the Tudor domain of Survival of Motor Neuron (SMN) binds to symmetrically dimethylated arginines of arginine-glycine (RG) rich sequences found in the C-terminal tails of Sm proteins. The SMN protein is linked to spinal muscular atrophy. Another example is the tandem tudor domains of 53BP1, which bind to histone H4 specifically dimethylated at Lys20 (H4-K20me2). 53BP1 is a key transducer of the DNA damage checkpoint signal.
Probab=80.92  E-value=1.8  Score=32.79  Aligned_cols=47  Identities=15%  Similarity=0.188  Sum_probs=37.9

Q ss_pred             CCEEEEeeCC-CCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccc
Q 003510           39 GDIIWAKLTG-HAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVIS   97 (814)
Q Consensus        39 GdlVwaK~~G-yPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~   97 (814)
                      |++|.|+... --|.+|+|.....            .+.+.|+|.+-.....|+.++|.+
T Consensus         1 G~~c~a~~~~d~~wyra~V~~~~~------------~~~~~V~f~DyG~~~~v~~~~l~~   48 (48)
T cd04508           1 GDLCLAKYSDDGKWYRAKITSILS------------DGKVEVFFVDYGNTEVVPLSDLRP   48 (48)
T ss_pred             CCEEEEEECCCCeEEEEEEEEECC------------CCcEEEEEEcCCCcEEEeHHHcCC
Confidence            7899999987 7899999976321            455899999999988898877754


No 70 
>PF00130 C1_1:  Phorbol esters/diacylglycerol binding domain (C1 domain);  InterPro: IPR002219 Diacylglycerol (DAG) is an important second messenger. Phorbol esters (PE) are analogues of DAG and potent tumour promoters that cause a variety of physiological changes when administered to both cells and tissues. DAG activates a family of serine/threonine protein kinases, collectively known as protein kinase C (PKC) []. Phorbol esters can directly stimulate PKC. The N-terminal region of PKC, known as C1, has been shown [] to bind PE and DAG in a phospholipid and zinc-dependent fashion. The C1 region contains one or two copies (depending on the isozyme of PKC) of a cysteine-rich domain, which is about 50 amino-acid residues long, and which is essential for DAG/PE-binding. The DAG/PE-binding domain binds two zinc ions; the ligands of these metal ions are probably the six cysteines and two histidines that are conserved in this domain.; GO: 0035556 intracellular signal transduction; PDB: 1RFH_A 2FNF_X 3PFQ_A 1PTQ_A 1PTR_A 2VRW_B 1XA6_A 2ENN_A 1TBN_A 1TBO_A ....
Probab=80.22  E-value=1.7  Score=33.87  Aligned_cols=36  Identities=19%  Similarity=0.419  Sum_probs=26.3

Q ss_pred             CCccccccCCcccCCCceEEcccccccccccccccc
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL  385 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~  385 (814)
                      ...|++|...--.....-+.|..|++.||..|....
T Consensus        11 ~~~C~~C~~~i~g~~~~g~~C~~C~~~~H~~C~~~~   46 (53)
T PF00130_consen   11 PTYCDVCGKFIWGLGKQGYRCSWCGLVCHKKCLSKV   46 (53)
T ss_dssp             TEB-TTSSSBECSSSSCEEEETTTT-EEETTGGCTS
T ss_pred             CCCCcccCcccCCCCCCeEEECCCCChHhhhhhhhc
Confidence            368999987653345567899999999999998643


No 71 
>KOG1973 consensus Chromatin remodeling protein, contains PHD Zn-finger [Chromatin structure and dynamics]
Probab=79.82  E-value=0.82  Score=49.03  Aligned_cols=29  Identities=38%  Similarity=0.747  Sum_probs=24.1

Q ss_pred             cceeeCCccceeEecCCCCcC-cccchhhH
Q 003510          464 LCSICGVSYGACIQCSNTTCR-VAYHPLCA  492 (814)
Q Consensus       464 ~C~~C~~~~Ga~iqC~~~~C~-~~fH~~CA  492 (814)
                      .|.-....+|.+|.|...+|. .+||..|-
T Consensus       221 yC~Cnqvsyg~Mi~CDn~~C~~eWFH~~CV  250 (274)
T KOG1973|consen  221 YCICNQVSYGKMIGCDNPGCPIEWFHFTCV  250 (274)
T ss_pred             EEEecccccccccccCCCCCCcceEEEecc
Confidence            444444479999999999999 99999996


No 72 
>PF03107 C1_2:  C1 domain;  InterPro: IPR004146 This short domain is rich in cysteines and histidines. The pattern of conservation is similar to that found in DAG_PE-bind (IPR002219 from INTERPRO), therefore we have termed this domain DC1 for divergent C1 domain. This domain probably also binds to two zinc ions. The function of proteins with this domain is uncertain, however this domain may bind to molecules such as diacylglycerol. This family are found in plant proteins.
Probab=77.83  E-value=1.6  Score=29.97  Aligned_cols=28  Identities=32%  Similarity=0.840  Sum_probs=22.1

Q ss_pred             ccccccCCcccCCCceEEcccccccccccc
Q 003510          352 KCSVCHMDEEYQNNLFLQCDKCRMMVHARC  381 (814)
Q Consensus       352 ~C~VC~~~~~~~~n~iv~C~~C~~~vH~~C  381 (814)
                      .|+||+..-+...  ...|+.|...+|..|
T Consensus         2 ~C~~C~~~~~~~~--~Y~C~~c~f~lh~~C   29 (30)
T PF03107_consen    2 WCDVCRRKIDGFY--FYHCSECCFTLHVRC   29 (30)
T ss_pred             CCCCCCCCcCCCE--eEEeCCCCCeEcCcc
Confidence            5999976544322  889999999999988


No 73 
>cd00029 C1 Protein kinase C conserved region 1 (C1) . Cysteine-rich zinc binding domain. Some members of this domain family bind phorbol esters and diacylglycerol, some are reported to bind RasGTP. May occur in tandem arrangement. Diacylglycerol (DAG) is a second messenger, released by activation of Phospholipase D. Phorbol Esters (PE) can act as analogues of DAG and mimic its downstream effects in, for example, tumor promotion. Protein Kinases C are activated by DAG/PE, this activation is mediated by their N-terminal conserved region (C1). DAG/PE binding may be phospholipid dependent. C1 domains may also mediate DAG/PE signals in chimaerins (a family of Rac GTPase activating proteins), RasGRPs (exchange factors for Ras/Rap1), and Munc13 isoforms (scaffolding proteins involved in exocytosis).
Probab=77.72  E-value=1.1  Score=34.19  Aligned_cols=34  Identities=24%  Similarity=0.480  Sum_probs=26.0

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGE  384 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~  384 (814)
                      ..|++|...-......-+.|+.|++.||..|...
T Consensus        12 ~~C~~C~~~i~~~~~~~~~C~~C~~~~H~~C~~~   45 (50)
T cd00029          12 TFCDVCRKSIWGLFKQGLRCSWCKVKCHKKCADK   45 (50)
T ss_pred             CChhhcchhhhccccceeEcCCCCCchhhhhhcc
Confidence            5899998753322345778999999999999853


No 74 
>PF11793 FANCL_C:  FANCL C-terminal domain; PDB: 3K1L_A.
Probab=76.67  E-value=1.7  Score=36.30  Aligned_cols=33  Identities=18%  Similarity=0.364  Sum_probs=13.2

Q ss_pred             CccccccCCcc-cCCCceEEcc--cccccccccccc
Q 003510          351 DKCSVCHMDEE-YQNNLFLQCD--KCRMMVHARCYG  383 (814)
Q Consensus       351 ~~C~VC~~~~~-~~~n~iv~C~--~C~~~vH~~CYg  383 (814)
                      ..|.||..... .+.-+.+.|+  .|+..+|..|.-
T Consensus         3 ~~C~IC~~~~~~~~~~p~~~C~n~~C~~~fH~~CL~   38 (70)
T PF11793_consen    3 LECGICYSYRLDDGEIPDVVCPNPSCGKKFHLLCLS   38 (70)
T ss_dssp             -S-SSS--SS-TT-----B--S-TT----B-SGGGH
T ss_pred             CCCCcCCcEecCCCCcCceEcCCcccCCHHHHHHHH
Confidence            57999998654 3344578998  799999999985


No 75 
>KOG1245 consensus Chromatin remodeling complex WSTF-ISWI, large subunit (contains heterochromatin localization, PHD and BROMO domains) [Chromatin structure and dynamics]
Probab=75.65  E-value=0.74  Score=59.50  Aligned_cols=50  Identities=28%  Similarity=0.618  Sum_probs=40.0

Q ss_pred             CCccccccCCcccCCCceEEccccccccccccccc--cccCCCCceeeccccCCC
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGE--LEPVNGVLWLCNLCRPGA  402 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~--~~~~~~~~W~C~~C~~~~  402 (814)
                      ...|.||+.....  +.|+.|+.|...+|..|.-.  ...+.+ +|+|..|....
T Consensus      1108 ~~~c~~cr~k~~~--~~m~lc~~c~~~~h~~C~rp~~~~~~~~-dW~C~~c~~e~ 1159 (1404)
T KOG1245|consen 1108 NALCKVCRRKKQD--EKMLLCDECLSGFHLFCLRPALSSVPPG-DWMCPSCRKEH 1159 (1404)
T ss_pred             hhhhhhhhhcccc--hhhhhhHhhhhhHHHHhhhhhhccCCcC-CccCCccchhh
Confidence            3689999986644  46899999999999999975  345555 89999998643


No 76 
>KOG1244 consensus Predicted transcription factor Requiem/NEURO-D4 [Transcription]
Probab=71.50  E-value=2.3  Score=44.19  Aligned_cols=50  Identities=22%  Similarity=0.507  Sum_probs=38.0

Q ss_pred             CccccccCCccc-----CCCceEEcccccccccccccccc----ccCCCCceeeccccC
Q 003510          351 DKCSVCHMDEEY-----QNNLFLQCDKCRMMVHARCYGEL----EPVNGVLWLCNLCRP  400 (814)
Q Consensus       351 ~~C~VC~~~~~~-----~~n~iv~C~~C~~~vH~~CYg~~----~~~~~~~W~C~~C~~  400 (814)
                      .+|+-|+++.-.     -...||.|..|+..-|-+|.-..    ..+....|-|..|++
T Consensus       225 ~YCDFclgdsr~nkkt~~peelvscsdcgrsghpsclqft~nm~~avk~yrwqcieck~  283 (336)
T KOG1244|consen  225 PYCDFCLGDSRENKKTGMPEELVSCSDCGRSGHPSCLQFTANMIAAVKTYRWQCIECKY  283 (336)
T ss_pred             cccceeccccccccccCCchhhcchhhcCCCCCcchhhhhHHHHHHHHhheeeeeecce
Confidence            589999986522     12459999999999999998643    234455799999984


No 77 
>KOG1337 consensus N-methyltransferase [General function prediction only]
Probab=71.24  E-value=2.8  Score=48.75  Aligned_cols=40  Identities=33%  Similarity=0.319  Sum_probs=30.4

Q ss_pred             cccCCCCCCeeEEEEEECCeeEEEEEEcCCCCCCCeeeEeCCC
Q 003510          727 LINHSCEPNCYSRVISVNGDEHIIIFAKRDIKQWEELTYDYRF  769 (814)
Q Consensus       727 fiNHSC~PN~~~~~~~~~~~~~i~i~A~rdI~~GEELt~dY~~  769 (814)
                      +.||++.+. .  ..+......+.+++.++|.+||||++.||.
T Consensus       239 ~~NH~~~~~-~--~~~~~~d~~~~l~~~~~v~~geevfi~YG~  278 (472)
T KOG1337|consen  239 LLNHSPEVI-K--AGYNQEDEAVELVAERDVSAGEEVFINYGP  278 (472)
T ss_pred             hhccCchhc-c--ccccCCCCcEEEEEeeeecCCCeEEEecCC
Confidence            579999992 1  122222348899999999999999999976


No 78 
>smart00109 C1 Protein kinase C conserved region 1 (C1) domains (Cysteine-rich domains). Some bind phorbol esters and diacylglycerol. Some bind RasGTP. Zinc-binding domains.
Probab=70.12  E-value=1.9  Score=32.61  Aligned_cols=33  Identities=27%  Similarity=0.522  Sum_probs=25.0

Q ss_pred             CCccccccCCcccCCCceEEcccccccccccccc
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYG  383 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg  383 (814)
                      ...|.+|...-.... .-+.|..|++.||..|..
T Consensus        11 ~~~C~~C~~~i~~~~-~~~~C~~C~~~~H~~C~~   43 (49)
T smart00109       11 PTKCCVCRKSIWGSF-QGLRCSWCKVKCHKKCAE   43 (49)
T ss_pred             CCCccccccccCcCC-CCcCCCCCCchHHHHHHh
Confidence            358999987533211 467899999999999975


No 79 
>PF02318 FYVE_2:  FYVE-type zinc finger;  InterPro: IPR003315 This entry represents the zinc-binding domain found in rabphilin Rab3A. The small G protein Rab3A plays an important role in the regulation of neurotransmitter release. The crystal structure of the small G protein Rab3A complexed with the effector domain of rabphilin-3A shows that the effector domain of rabphilin-3A contacts Rab3A in two distinct areas. The first interface involves the Rab3A switch I and switch II regions, which are sensitive to the nucleotide-binding state of Rab3A. The second interface consists of a deep pocket in Rab3A that interacts with a SGAWFF structural element of rabphilin-3A. Sequence and structure analysis, and biochemical data suggest that this pocket, or Rab complementarity-determining region (RabCDR), establishes a specific interaction between each Rab protein and its effectors. It has been suggested that RabCDRs could be major determinants of effector specificity during vesicle trafficking and fusion [].; GO: 0008270 zinc ion binding, 0017137 Rab GTPase binding, 0006886 intracellular protein transport; PDB: 2CSZ_A 2ZET_C 1ZBD_B 3BC1_B 2CJS_C 2A20_A.
Probab=66.88  E-value=4.5  Score=37.52  Aligned_cols=49  Identities=22%  Similarity=0.512  Sum_probs=35.3

Q ss_pred             CCccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccC
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ...|..|...-.--.|.-..|..|...|-+.|-..  ......|+|..|..
T Consensus        54 ~~~C~~C~~~fg~l~~~~~~C~~C~~~VC~~C~~~--~~~~~~WlC~vC~k  102 (118)
T PF02318_consen   54 ERHCARCGKPFGFLFNRGRVCVDCKHRVCKKCGVY--SKKEPIWLCKVCQK  102 (118)
T ss_dssp             CSB-TTTS-BCSCTSTTCEEETTTTEEEETTSEEE--TSSSCCEEEHHHHH
T ss_pred             CcchhhhCCcccccCCCCCcCCcCCccccCccCCc--CCCCCCEEChhhHH
Confidence            45899998765444555688999999999999554  23344899999975


No 80 
>PF05502 Dynactin_p62:  Dynactin p62 family;  InterPro: IPR008603 Dynactin is a multi-subunit complex and a required cofactor for most, or all, o f the cellular processes powered by the microtubule-based motor cytoplasmic dyn ein. p62 binds directly to the Arp1 subunit of dynactin [, ].
Probab=64.95  E-value=4.6  Score=46.90  Aligned_cols=82  Identities=22%  Similarity=0.482  Sum_probs=51.5

Q ss_pred             ceEEccccccccccccccccccCCCCceeeccccCCCCCC---------CCCceecCCCCCCceecCCCcchhhhhhccc
Q 003510          366 LFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEP---------PPPCCLCPVVGGAMKPTTDGRWAHLACAIWI  436 (814)
Q Consensus       366 ~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~---------~~~C~lC~~~~Galk~t~~~~WvH~~Ca~~~  436 (814)
                      .|.+|..|.......|...    +-..|||..|....+..         ...|+-||.=.+.|.-+....          
T Consensus         4 ~L~fC~~C~~irc~~c~~~----Ei~~~yCp~CL~~~p~~e~~~~~nrC~r~Cf~CP~C~~~L~~~~~~~----------   69 (483)
T PF05502_consen    4 ELYFCEHCHKIRCPRCVSE----EIDSYYCPNCLFEVPSSEARSEKNRCSRNCFDCPICFSPLSVRASDT----------   69 (483)
T ss_pred             cceecccccccCChhhccc----ccceeECccccccCChhhheeccceeccccccCCCCCCcceeEeccc----------
Confidence            4789999999888888642    22379999998654321         247999997776665443110          


Q ss_pred             cceEEccCCCcccccccccchhcccCccceeeCC
Q 003510          437 PETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGV  470 (814)
Q Consensus       437 pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~  470 (814)
                      +.         .+...........+-+.|.+|.=
T Consensus        70 ~~---------~~~~~~~~~~~~~~~l~C~~C~W   94 (483)
T PF05502_consen   70 PP---------SPPDPSSDSGGKPYYLSCSYCRW   94 (483)
T ss_pred             cc---------ccccccccCCCCCEEEECCCcee
Confidence            00         11222334455566678999873


No 81 
>PF14569 zf-UDP:  Zinc-binding RING-finger; PDB: 1WEO_A.
Probab=62.30  E-value=3.5  Score=34.71  Aligned_cols=49  Identities=24%  Similarity=0.614  Sum_probs=23.0

Q ss_pred             CCccccccCC--cccCCCceEEccccccccccccccccccCCCCceeeccccC
Q 003510          350 LDKCSVCHMD--EEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       350 ~~~C~VC~~~--~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      .-.|.||...  -..+.+.+|.|..|+..|-..||--.. -++ .-.|..|+.
T Consensus         9 ~qiCqiCGD~VGl~~~Ge~FVAC~eC~fPvCr~CyEYEr-keg-~q~CpqCkt   59 (80)
T PF14569_consen    9 GQICQICGDDVGLTENGEVFVACHECAFPVCRPCYEYER-KEG-NQVCPQCKT   59 (80)
T ss_dssp             S-B-SSS--B--B-SSSSB--S-SSS-----HHHHHHHH-HTS--SB-TTT--
T ss_pred             CcccccccCccccCCCCCEEEEEcccCCccchhHHHHHh-hcC-cccccccCC
Confidence            3589999874  245678999999999999999995322 223 668888874


No 82 
>PHA02862 5L protein; Provisional
Probab=61.15  E-value=3.1  Score=39.29  Aligned_cols=50  Identities=28%  Similarity=0.606  Sum_probs=35.2

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecCCCC
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVG  416 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~  416 (814)
                      +.|-||+..++++. .--.|.|-..-|||+|..        .|+       .......|.+|....
T Consensus         3 diCWIC~~~~~e~~-~PC~C~GS~K~VHq~CL~--------~WI-------n~S~k~~CeLCkteY   52 (156)
T PHA02862          3 DICWICNDVCDERN-NFCGCNEEYKVVHIKCMQ--------LWI-------NYSKKKECNLCKTKY   52 (156)
T ss_pred             CEEEEecCcCCCCc-ccccccCcchhHHHHHHH--------HHH-------hcCCCcCccCCCCeE
Confidence            68999999876544 345688999999999974        565       122345677776544


No 83 
>PF11764 N-SET:  COMPASS (Complex proteins associated with Set1p) component N;  InterPro: IPR024657 The COMPASS complex (complex proteins associated with Set1p) is conserved in yeasts and in other eukaryotes up to humans. The COMPASS complex functions to methylate the fourth lysine of Histone 3 and for the silencing of genes close to the telomeres of chromosomes [].  Five domains are conserved in Saccharomyces cerevisiae Set1 and other eukaryotic Set1-related proteins: an amino-terminal RNA-recognition motif (RRM), a semi-conserved central domain, an N-SET domain, the catalytic SET domain, and the C-terminal post-SET domain. This entry represents the N-SET domain, which promotes trimethylation in conjunction with the RRM domain [] and is necessary for binding of the Spp1 component of COMPASS into the complex [].; PDB: 3UVO_B 4ES0_C 3UVN_D 4EWR_C.
Probab=60.13  E-value=2.2  Score=42.17  Aligned_cols=16  Identities=31%  Similarity=0.507  Sum_probs=6.0

Q ss_pred             CCCCCcccccCccccc
Q 003510          557 PSNPSGCARSEPYNYF  572 (814)
Q Consensus       557 ~~npsGcaRsEp~~~~  572 (814)
                      ..|++||||+|||+++
T Consensus        78 ~~h~TGsARtEGy~KI   93 (167)
T PF11764_consen   78 VPHSTGSARTEGYYKI   93 (167)
T ss_dssp             -----SSHHHH-----
T ss_pred             ccCCCcCcccccceeC
Confidence            4588999999999865


No 84 
>PF13901 DUF4206:  Domain of unknown function (DUF4206)
Probab=59.81  E-value=6.1  Score=40.38  Aligned_cols=42  Identities=26%  Similarity=0.789  Sum_probs=32.2

Q ss_pred             CccccccCCc---ccCCCceEEccccccccccccccccccCCCCceeeccccC
Q 003510          351 DKCSVCHMDE---EYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       351 ~~C~VC~~~~---~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ..|.+|..++   ..+.+..+.|..|+..+|..|+..     .   -|.+|..
T Consensus       153 fiCe~C~~~~~IfPF~~~~~~~C~~C~~v~H~~C~~~-----~---~CpkC~R  197 (202)
T PF13901_consen  153 FICEICNSDDIIFPFQIDTTVRCPKCKSVFHKSCFRK-----K---SCPKCAR  197 (202)
T ss_pred             CCCccCCCCCCCCCCCCCCeeeCCcCccccchhhcCC-----C---CCCCcHh
Confidence            6899998754   334456889999999999999962     1   2888864


No 85 
>COG5475 Uncharacterized small protein [Function unknown]
Probab=56.21  E-value=26  Score=27.61  Aligned_cols=51  Identities=16%  Similarity=0.242  Sum_probs=39.9

Q ss_pred             CCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCC--CEEEEeCCCcccccc
Q 003510           35 ELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTH--DFARINVKQVISFLK  100 (814)
Q Consensus        35 ~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~--~~awv~~~~l~~f~~  100 (814)
                      .|..||+|-.|-.|    |+|++..-           ..++.|..+||.-.  .++=..++.|+|+..
T Consensus         4 ~FstgdvV~lKsGG----P~Mtvs~~-----------ss~Gmy~C~Wf~g~g~~~~~F~ed~Lvp~~a   56 (60)
T COG5475           4 SFSTGDVVTLKSGG----PRMTVSGY-----------SSDGMYECRWFDGYGVKREAFHEDELVPGEA   56 (60)
T ss_pred             eeecCcEEEeecCC----ceEEEecc-----------ccCCeEEEEEecCCCcccccccccceecccc
Confidence            59999999999998    88988631           23477999999864  467778888888754


No 86 
>KOG4443 consensus Putative transcription factor HALR/MLL3, involved in embryonic development [General function prediction only]
Probab=55.46  E-value=5.8  Score=46.38  Aligned_cols=46  Identities=28%  Similarity=0.772  Sum_probs=32.9

Q ss_pred             CccccccCCcccCCCceEEcccccccccccccccc--ccCCCCceeecccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL--EPVNGVLWLCNLCR  399 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~--~~~~~~~W~C~~C~  399 (814)
                      .+|-.|...++  ...+++|++|.+++|-+|--..  .++.+ +|+|..|.
T Consensus        69 rvCe~c~~~gD--~~kf~~Ck~cDvsyh~yc~~P~~~~v~sg-~~~ckk~~  116 (694)
T KOG4443|consen   69 RVCEACGTTGD--PKKFLLCKRCDVSYHCYCQKPPNDKVPSG-PWLCKKCT  116 (694)
T ss_pred             eeeeeccccCC--cccccccccccccccccccCCccccccCc-ccccHHHH
Confidence            46666664333  3568899999999998886543  23444 89999885


No 87 
>COG5034 TNG2 Chromatin remodeling protein, contains PhD zinc finger [Chromatin structure and dynamics]
Probab=55.33  E-value=9.1  Score=39.72  Aligned_cols=40  Identities=25%  Similarity=0.603  Sum_probs=30.1

Q ss_pred             cccchhcccCccceeeCC-ccceeEecCCCCcCc-ccchhhH
Q 003510          453 LNRVSKDRWKLLCSICGV-SYGACIQCSNTTCRV-AYHPLCA  492 (814)
Q Consensus       453 ~~~~~~~~~~~~C~~C~~-~~Ga~iqC~~~~C~~-~fH~~CA  492 (814)
                      ++.......+..-++|++ ++|-||.|+..+|.. +||..|-
T Consensus       211 vss~d~se~e~lYCfCqqvSyGqMVaCDn~nCkrEWFH~~CV  252 (271)
T COG5034         211 VSSEDNSEGEELYCFCQQVSYGQMVACDNANCKREWFHLECV  252 (271)
T ss_pred             cCccccccCceeEEEecccccccceecCCCCCchhheecccc
Confidence            333333344556778987 799999999999975 6999996


No 88 
>PF08746 zf-RING-like:  RING-like domain;  InterPro: IPR014857 This is a zinc finger domain that is related to the C3HC4 RING finger domain (IPR001841 from INTERPRO). ; PDB: 3NW0_A 2CT0_A.
Probab=54.76  E-value=5.7  Score=29.76  Aligned_cols=30  Identities=30%  Similarity=0.639  Sum_probs=16.6

Q ss_pred             ceeeCCccceeEecCCCCcCcccchhhHhh
Q 003510          465 CSICGVSYGACIQCSNTTCRVAYHPLCARA  494 (814)
Q Consensus       465 C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~  494 (814)
                      |.+|+...-.-+.|....|...+|..|+..
T Consensus         1 C~~C~~iv~~G~~C~~~~C~~r~H~~C~~~   30 (43)
T PF08746_consen    1 CEACKEIVTQGQRCSNRDCNVRLHDDCFKK   30 (43)
T ss_dssp             -TTT-SB-SSSEE-SS--S--EE-HHHHHH
T ss_pred             CcccchhHeeeccCCCCccCchHHHHHHHH
Confidence            567777555567999999999999999854


No 89 
>PF14446 Prok-RING_1:  Prokaryotic RING finger family 1
Probab=53.80  E-value=11  Score=29.77  Aligned_cols=35  Identities=31%  Similarity=0.789  Sum_probs=30.0

Q ss_pred             ccceeeCCc---cceeEecCCCCcCcccchhhHhhcCceE
Q 003510          463 LLCSICGVS---YGACIQCSNTTCRVAYHPLCARAAGLCV  499 (814)
Q Consensus       463 ~~C~~C~~~---~Ga~iqC~~~~C~~~fH~~CA~~~g~~~  499 (814)
                      -+|.+|+..   .+..|.|.  .|.+.||-.|...+|-..
T Consensus         6 ~~C~~Cg~~~~~~dDiVvCp--~CgapyHR~C~~~~g~C~   43 (54)
T PF14446_consen    6 CKCPVCGKKFKDGDDIVVCP--ECGAPYHRDCWEKAGGCI   43 (54)
T ss_pred             ccChhhCCcccCCCCEEECC--CCCCcccHHHHhhCCceE
Confidence            479999973   68889997  999999999998888653


No 90 
>cd04718 BAH_plant_2 BAH, or Bromo Adjacent Homology domain, plant-specific sub-family with unknown function. BAH domains are found in a variety of proteins playing roles in transcriptional silencing and the remodeling of chromatin. It is assumed that in most or all of these instances the BAH domain mediates protein-protein interactions.
Probab=53.63  E-value=8.7  Score=36.89  Aligned_cols=26  Identities=27%  Similarity=0.627  Sum_probs=19.9

Q ss_pred             cccccccccc--ccCCCCceeeccccCCC
Q 003510          376 MVHARCYGEL--EPVNGVLWLCNLCRPGA  402 (814)
Q Consensus       376 ~vH~~CYg~~--~~~~~~~W~C~~C~~~~  402 (814)
                      .+|..|...+  .+|+| +|+|..|....
T Consensus         1 g~H~~CL~Ppl~~~P~g-~W~Cp~C~~~~   28 (148)
T cd04718           1 GFHLCCLRPPLKEVPEG-DWICPFCEVEK   28 (148)
T ss_pred             CcccccCCCCCCCCCCC-CcCCCCCcCCC
Confidence            3799999753  45665 99999998654


No 91 
>KOG4443 consensus Putative transcription factor HALR/MLL3, involved in embryonic development [General function prediction only]
Probab=53.11  E-value=5.2  Score=46.75  Aligned_cols=48  Identities=25%  Similarity=0.637  Sum_probs=37.5

Q ss_pred             CccccccCCcccCCCceEEcccccccccccccccc---ccCCCCceeecccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL---EPVNGVLWLCNLCR  399 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~---~~~~~~~W~C~~C~  399 (814)
                      ..|-||...+....+.|+.|..|+...|-.|....   ....+ .|-|..|+
T Consensus        19 ~mc~l~~s~G~~~ag~m~ac~~c~~~yH~~cvt~~~~~~~l~~-gWrC~~cr   69 (694)
T KOG4443|consen   19 LMCPLCGSSGKGRAGRLLACSDCGQKYHPYCVTSWAQHAVLSG-GWRCPSCR   69 (694)
T ss_pred             hhhhhhccccccccCcchhhhhhcccCCcchhhHHHhHHHhcC-CcccCCce
Confidence            46778877777777889999999999999998742   22233 59999997


No 92 
>PF12906 RINGv:  RING-variant domain; PDB: 2D8S_A 1VYX_A.
Probab=51.65  E-value=4.9  Score=30.75  Aligned_cols=30  Identities=33%  Similarity=0.791  Sum_probs=18.3

Q ss_pred             cccccCCcccCCCceEEcccccc---cccccccc
Q 003510          353 CSVCHMDEEYQNNLFLQCDKCRM---MVHARCYG  383 (814)
Q Consensus       353 C~VC~~~~~~~~n~iv~C~~C~~---~vH~~CYg  383 (814)
                      |-||+..++.++..+--|. |.-   .||+.|.-
T Consensus         1 CrIC~~~~~~~~~li~pC~-C~Gs~~~vH~~CL~   33 (47)
T PF12906_consen    1 CRICLEGEEEDEPLISPCR-CKGSMKYVHRSCLE   33 (47)
T ss_dssp             ETTTTEE-SSSS-EE-SSS--SSCCGSEECCHHH
T ss_pred             CeEeCCcCCCCCceecccc-cCCCcchhHHHHHH
Confidence            7799887765553333443 555   99999974


No 93 
>PF10447 EXOSC1:  Exosome component EXOSC1/CSL4;  InterPro: IPR019495  The exosome mediates degradation of unstable mRNAs that contain AU-rich elements (AREs) within their 3' untranslated regions []. The proteins in this entry are components of the exosome 3'->5' exoribonuclease complex. They do not have exonuclease activity, but are required for the 3'-processing of the 7S pre-RNA to the mature 5.8S rRNA and for mRNA decay [, ].; PDB: 2NN6_I.
Probab=51.08  E-value=11  Score=32.51  Aligned_cols=13  Identities=38%  Similarity=0.810  Sum_probs=9.4

Q ss_pred             CCCCCCCEEEEee
Q 003510           34 QELEPGDIIWAKL   46 (814)
Q Consensus        34 ~~f~~GdlVwaK~   46 (814)
                      +-|+|||+|.||+
T Consensus        67 ~~FrpGDIVrA~V   79 (82)
T PF10447_consen   67 DCFRPGDIVRARV   79 (82)
T ss_dssp             GT--SSSEEEEEE
T ss_pred             hccCCCCEEEEEE
Confidence            3499999999997


No 94 
>KOG2041 consensus WD40 repeat protein [General function prediction only]
Probab=51.03  E-value=11  Score=44.36  Aligned_cols=75  Identities=27%  Similarity=0.554  Sum_probs=45.5

Q ss_pred             CCCCCCCCccccccCCCccccccCCcccCCCceEEcccccccccccccccccc-CCCCceeeccccCCCCC----CCCCc
Q 003510          335 DLPGGYRPVRVDWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEP-VNGVLWLCNLCRPGAPE----PPPPC  409 (814)
Q Consensus       335 ~lp~~~~~~~~~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~-~~~~~W~C~~C~~~~~~----~~~~C  409 (814)
                      ++-+.+.|+..+. ...-|.+|...-+.   --++|..|+..+- .|-....+ .+..-|+|.+|+.....    .-..|
T Consensus      1103 ~iFsk~~p~d~~~-~~vdc~~cg~~i~~---~~~~c~ec~~kfP-~CiasG~pIt~~~fWlC~~CkH~a~~~EIs~y~~C 1177 (1189)
T KOG2041|consen 1103 RIFSKNPPVDPNS-AKVDCSVCGAKIDP---YDLQCSECQTKFP-VCIASGRPITDNIFWLCPRCKHRAHQHEISKYNCC 1177 (1189)
T ss_pred             HHhccCCCCCCCc-cceeeeecCCcCCc---cCCCChhhcCcCc-eeeccCCccccceEEEccccccccccccccccccC
Confidence            3444455555443 34689999874332   2468999987764 46543332 23347999999976532    22457


Q ss_pred             eecCC
Q 003510          410 CLCPV  414 (814)
Q Consensus       410 ~lC~~  414 (814)
                      .||-.
T Consensus      1178 PLCHs 1182 (1189)
T KOG2041|consen 1178 PLCHS 1182 (1189)
T ss_pred             ccccC
Confidence            78854


No 95 
>PLN00104 MYST -like histone acetyltransferase; Provisional
Probab=50.39  E-value=21  Score=40.59  Aligned_cols=60  Identities=13%  Similarity=0.118  Sum_probs=45.5

Q ss_pred             CCCCCCCCCEEEEeeCCCCCC-CceeeCCCCcCccccccccCCCCcEEEEEeCCCCE--EEEeCCCcc
Q 003510           32 DCQELEPGDIIWAKLTGHAMW-PAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDF--ARINVKQVI   96 (814)
Q Consensus        32 ~~~~f~~GdlVwaK~~GyPwW-Pa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~--awv~~~~l~   96 (814)
                      ....|.+|+.|.|+..+-+-| +|.|++-....     ....+...|.|.|-|.+.+  -||..++|.
T Consensus        50 ~~~~~~VGekVla~~~~Dg~~~~A~VI~~R~~~-----~~~~~~~~YYVHY~g~nrRlDEWV~~~rLd  112 (450)
T PLN00104         50 VMLPLEVGTRVMCRWRFDGKYHPVKVIERRRGG-----SGGPNDYEYYVHYTEFNRRLDEWVKLEQLD  112 (450)
T ss_pred             ccceeccCCEEEEEECCCCCEEEEEEEEEeccC-----CCCCCCceEEEEEecCCccHhhccCHhhcc
Confidence            344699999999999988877 99998754211     0112334699999999998  999999884


No 96 
>PF07649 C1_3:  C1-like domain;  InterPro: IPR011424 This short domain is rich in cysteines and histidines. The pattern of conservation is similar to that found in IPR002219 from INTERPRO. C1 domains are protein kinase C-like zinc finger structures. Diacylglycerol (DAG) kinases (DGKs) have a two or three commonly conserved cysteine-rich C1 domains []. DGKs modulate the balance between the two signaling lipids, DAG and phosphatidic acid (PA), by phosphorylating DAG to yield PA []. The PKD (protein kinase D) family are novel DAG receptors. They have twin C1 domains, designated C1a and C1b, which bind DAG or phorbol esters. Individual C1 domains differ in ligand-binding activity and selectivity []. ; GO: 0047134 protein-disulfide reductase activity, 0055114 oxidation-reduction process; PDB: 1V5N_A.
Probab=49.67  E-value=7.9  Score=26.42  Aligned_cols=27  Identities=33%  Similarity=0.775  Sum_probs=12.3

Q ss_pred             cceeeCCccc--eeEecCCCCcCcccchhhH
Q 003510          464 LCSICGVSYG--ACIQCSNTTCRVAYHPLCA  492 (814)
Q Consensus       464 ~C~~C~~~~G--a~iqC~~~~C~~~fH~~CA  492 (814)
                      .|..|+...+  ....|.  .|.-.+|..||
T Consensus         2 ~C~~C~~~~~~~~~Y~C~--~Cdf~lH~~Ca   30 (30)
T PF07649_consen    2 RCDACGKPIDGGWFYRCS--ECDFDLHEECA   30 (30)
T ss_dssp             --TTTS----S--EEE-T--TT-----HHHH
T ss_pred             cCCcCCCcCCCCceEECc--cCCCccChhcC
Confidence            5888998544  577997  99999999998


No 97 
>PF09926 DUF2158:  Uncharacterized small protein (DUF2158);  InterPro: IPR019226 This entry represents a family of predominantly prokaryotic proteins with no known function. 
Probab=49.63  E-value=33  Score=27.05  Aligned_cols=41  Identities=32%  Similarity=0.570  Sum_probs=28.3

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCC
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHD   86 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~   86 (814)
                      |++||+|--|-.|    |.|++..  +..    ......+.+..+||..+.
T Consensus         1 f~~GDvV~LKSGG----p~MTV~~--v~~----~~~~~~~~v~C~WFd~~~   41 (53)
T PF09926_consen    1 FKIGDVVQLKSGG----PRMTVTE--VGP----NAGASGGWVECQWFDGHG   41 (53)
T ss_pred             CCCCCEEEEccCC----CCeEEEE--ccc----cccCCCCeEEEEeCCCCC
Confidence            7899999999999    6777662  111    112234568899998765


No 98 
>KOG3799 consensus Rab3 effector RIM1 and related proteins, contain Rab3a binding domain [Intracellular trafficking, secretion, and vesicular transport]
Probab=49.54  E-value=8.2  Score=35.85  Aligned_cols=52  Identities=35%  Similarity=0.760  Sum_probs=36.7

Q ss_pred             cCCCccccccCCcccCCCceEEcccccccccccccccccc-CCCCceeeccccC
Q 003510          348 KDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEP-VNGVLWLCNLCRP  400 (814)
Q Consensus       348 ~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~-~~~~~W~C~~C~~  400 (814)
                      .++..|.||....-.++ .=-.|.-|++.+-..|-|-... .+..-|+|..|..
T Consensus        63 ~ddatC~IC~KTKFADG-~GH~C~YCq~r~CARCGGrv~lrsNKv~wvcnlc~k  115 (169)
T KOG3799|consen   63 GDDATCGICHKTKFADG-CGHNCSYCQTRFCARCGGRVSLRSNKVMWVCNLCRK  115 (169)
T ss_pred             CcCcchhhhhhcccccc-cCcccchhhhhHHHhcCCeeeeccCceEEeccCCcH
Confidence            35689999987543322 2235889999999999885443 3455799999974


No 99 
>PLN02400 cellulose synthase
Probab=48.96  E-value=14  Score=46.23  Aligned_cols=50  Identities=26%  Similarity=0.667  Sum_probs=38.6

Q ss_pred             CCccccccCC--cccCCCceEEccccccccccccccccccCCCCceeeccccCC
Q 003510          350 LDKCSVCHMD--EEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPG  401 (814)
Q Consensus       350 ~~~C~VC~~~--~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~  401 (814)
                      ..+|.||.++  -..++++.|-|..|.-.|-..||- .+.-+| .=.|..|+..
T Consensus        36 gqiCqICGD~VG~t~dGe~FVAC~eCaFPVCRpCYE-YERkeG-nq~CPQCkTr   87 (1085)
T PLN02400         36 GQICQICGDDVGVTETGDVFVACNECAFPVCRPCYE-YERKDG-TQCCPQCKTR   87 (1085)
T ss_pred             CceeeecccccCcCCCCCEEEEEccCCCccccchhh-eecccC-CccCcccCCc
Confidence            3599999875  245678899999999999999993 333334 7789999753


No 100
>cd04712 BAH_DCM_I BAH, or Bromo Adjacent Homology domain, as present in DNA (Cytosine-5)-methyltransferases (DCM) 1. DNA methylation, or the covalent addition of a methyl group to cytosine within the context of the CpG dinucleotide, has profound effects on the genome. These effects include transcriptional repression via inhibition of transcription factor binding, the recruitment of methyl-binding proteins and their associated chromatin remodeling factors, X chromosome inactivation, imprinting, and the suppression of parasitic DNA sequences. DNA methylation is also essential for proper embryonic development and is an important player in both DNA repair and genome stability. BAH domains are found in a variety of proteins playing roles in transcriptional silencing and the remodeling of chromatin. It is assumed that in most or all of these instances the BAH domain mediates protein-protein interactions.
Probab=48.73  E-value=17  Score=34.31  Aligned_cols=49  Identities=10%  Similarity=0.152  Sum_probs=32.7

Q ss_pred             CCCCCCCCEEEEeeCCCCC---------CCceeeCCCCcCccccccccCCCCcEEEEEeCCCC
Q 003510           33 CQELEPGDIIWAKLTGHAM---------WPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHD   86 (814)
Q Consensus        33 ~~~f~~GdlVwaK~~GyPw---------WPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~   86 (814)
                      +..+++||+|..+-.+-+-         ||+.|.....+-.     ...+...++|+||-...
T Consensus         3 ~~~i~vGD~V~v~~d~~~~~~~~~~~~~~~~~i~~V~~~~e-----~~~g~~~~h~~W~yrp~   60 (130)
T cd04712           3 GLTIRVGDVVSVERDDADSTTKWNDDHRWLPLVQFVEYMKK-----GSDGSKMFHGRWLYRGC   60 (130)
T ss_pred             CCEEeCCCEEEEcCCCCCccccccccccccceEEEEEEeee-----cCCCceEEEEEEEEcch
Confidence            5678999999999887653         6777766433222     22334578888886543


No 101
>KOG0955 consensus PHD finger protein BR140/LIN-49 [General function prediction only]
Probab=45.69  E-value=16  Score=45.92  Aligned_cols=64  Identities=22%  Similarity=0.355  Sum_probs=47.0

Q ss_pred             CCCCCEEEEeeCCCCCCCceeeCCCCcCccccccc------------------cCCCCcEEEEEeCCCC-EEEEeCCCcc
Q 003510           36 LEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNK------------------ISGGRSIPVQFFGTHD-FARINVKQVI   96 (814)
Q Consensus        36 f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~------------------~~~~~~~~V~FFg~~~-~awv~~~~l~   96 (814)
                      +.+=++||||..||||-|+.++++.+.......+.                  +.....+.|.||.+.- .-|++...+.
T Consensus       943 l~~~~~~~akc~g~~s~~~l~l~p~~~~~~~~~~g~~~~p~~dv~~l~eq~~~~~~~~l~~~L~~~n~~~~~~~~~s~~~ 1022 (1051)
T KOG0955|consen  943 LEELKLVWAKCRGYPSYPALILDPKMPREGNFHNGPDPAPPTDVLALPEQRTNKAPETLFLVLFFDNKRCWQWLPRSKVL 1022 (1051)
T ss_pred             eeehhceeehhcCCccchhhhcccccccccCccCCCCCCCCcccccchHHHhcccChhheEEEeecccccccccCCCCcc
Confidence            77888999999999999999998766544333211                  1122345699999876 5999999877


Q ss_pred             ccc
Q 003510           97 SFL   99 (814)
Q Consensus        97 ~f~   99 (814)
                      +.-
T Consensus      1023 ~l~ 1025 (1051)
T KOG0955|consen 1023 ELG 1025 (1051)
T ss_pred             ccc
Confidence            764


No 102
>PLN02638 cellulose synthase A (UDP-forming), catalytic subunit
Probab=42.78  E-value=17  Score=45.49  Aligned_cols=50  Identities=26%  Similarity=0.636  Sum_probs=38.5

Q ss_pred             CCccccccCC--cccCCCceEEccccccccccccccccccCCCCceeeccccCC
Q 003510          350 LDKCSVCHMD--EEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPG  401 (814)
Q Consensus       350 ~~~C~VC~~~--~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~  401 (814)
                      ..+|.||++.  -..++++.|-|..|+-.|-..||- .+.-+| .=.|..|+..
T Consensus        17 ~qiCqICGD~vg~~~~Ge~FVAC~eC~FPVCrpCYE-YEr~eG-~q~CPqCktr   68 (1079)
T PLN02638         17 GQVCQICGDNVGKTVDGEPFVACDVCAFPVCRPCYE-YERKDG-NQSCPQCKTK   68 (1079)
T ss_pred             CceeeecccccCcCCCCCEEEEeccCCCccccchhh-hhhhcC-CccCCccCCc
Confidence            3599999875  245677899999999999999993 333344 7789999753


No 103
>PLN02436 cellulose synthase A
Probab=41.82  E-value=19  Score=45.08  Aligned_cols=50  Identities=22%  Similarity=0.558  Sum_probs=38.5

Q ss_pred             CCccccccCCc--ccCCCceEEccccccccccccccccccCCCCceeeccccCC
Q 003510          350 LDKCSVCHMDE--EYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPG  401 (814)
Q Consensus       350 ~~~C~VC~~~~--~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~  401 (814)
                      ..+|.||.++-  ..++++.|-|.-|+-.|-..||- .+..+ +.=.|..|+..
T Consensus        36 ~~iCqICGD~Vg~t~dGe~FVACn~C~fpvCr~Cye-yer~e-g~~~Cpqckt~   87 (1094)
T PLN02436         36 GQTCQICGDEIELTVDGEPFVACNECAFPVCRPCYE-YERRE-GNQACPQCKTR   87 (1094)
T ss_pred             CccccccccccCcCCCCCEEEeeccCCCccccchhh-hhhhc-CCccCcccCCc
Confidence            35999998753  55678899999999999999993 33333 37789999753


No 104
>PF07227 DUF1423:  Protein of unknown function (DUF1423);  InterPro: IPR004082 A total of 715 potential protein-coding genes have been identified in the nucleotide sequence of Arabidopsis thaliana chromosome 5, with an average gene density of 1 gene per 4001 bp []. Amongst the gene products is a well-conserved family of 130.7kDa proteins that share no sequence similarity with any other known proteins, other than in plants. The sequences are characterised by an N-terminal domain of variable length, a central cysteine-rich region and a relatively acidic C-terminal domain. The sequences may possess a PHD finger.
Probab=41.59  E-value=13  Score=42.02  Aligned_cols=13  Identities=46%  Similarity=1.058  Sum_probs=11.3

Q ss_pred             CCcchhhhhhccc
Q 003510          424 DGRWAHLACAIWI  436 (814)
Q Consensus       424 ~~~WvH~~Ca~~~  436 (814)
                      .|.|+|+-||+-.
T Consensus       152 CgH~cH~dCALr~  164 (446)
T PF07227_consen  152 CGHWCHLDCALRH  164 (446)
T ss_pred             CCceehhhhhccc
Confidence            5789999999974


No 105
>PF10080 DUF2318:  Predicted membrane protein (DUF2318);  InterPro: IPR018758 This domain of unknown function is found in hypothetical bacterial membrane proteins with no known function. 
Probab=40.38  E-value=13  Score=33.51  Aligned_cols=33  Identities=27%  Similarity=0.599  Sum_probs=26.3

Q ss_pred             CccccccCCcccCCCceEEcccccccccccccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYG  383 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg  383 (814)
                      +.|.||...+......-|.|..|++..+..=.|
T Consensus        36 daCeiC~~~GY~q~g~~lvC~~C~~~~~~~~ig   68 (102)
T PF10080_consen   36 DACEICGPKGYYQEGDQLVCKNCGVRFNLPTIG   68 (102)
T ss_pred             EeccccCCCceEEECCEEEEecCCCEEehhhcc
Confidence            589999877766656677899999999987555


No 106
>COG5194 APC11 Component of SCF ubiquitin ligase and anaphase-promoting complex [Posttranslational modification, protein turnover, chaperones / Cell division and chromosome partitioning]
Probab=40.25  E-value=9.8  Score=32.22  Aligned_cols=32  Identities=31%  Similarity=0.781  Sum_probs=26.0

Q ss_pred             ccceeeCC-ccceeEecCC------------CCcCcccchhhHhh
Q 003510          463 LLCSICGV-SYGACIQCSN------------TTCRVAYHPLCARA  494 (814)
Q Consensus       463 ~~C~~C~~-~~Ga~iqC~~------------~~C~~~fH~~CA~~  494 (814)
                      ..|.||+. -.|.|++|..            +.|.-+||..|-.+
T Consensus        21 d~CaICRnhim~~C~eCq~~~~~~~eC~v~wG~CnHaFH~HCI~r   65 (88)
T COG5194          21 DVCAICRNHIMGTCPECQFGMTPGDECPVVWGVCNHAFHDHCIYR   65 (88)
T ss_pred             chhhhhhccccCcCcccccCCCCCCcceEEEEecchHHHHHHHHH
Confidence            37999986 4689999987            35999999999854


No 107
>PF13639 zf-RING_2:  Ring finger domain; PDB: 2KIZ_A 4EPO_C 1IYM_A 2EP4_A 2ECT_A 2JRJ_A 2ECN_A 2ECM_A 3NG2_A 2EA6_A ....
Probab=39.26  E-value=14  Score=27.49  Aligned_cols=31  Identities=23%  Similarity=0.584  Sum_probs=22.7

Q ss_pred             CccccccCCcccCCCceEEcccccccccccccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYG  383 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg  383 (814)
                      +.|.||...-.. .+.++... |+=.+|..|..
T Consensus         1 d~C~IC~~~~~~-~~~~~~l~-C~H~fh~~Ci~   31 (44)
T PF13639_consen    1 DECPICLEEFED-GEKVVKLP-CGHVFHRSCIK   31 (44)
T ss_dssp             -CETTTTCBHHT-TSCEEEET-TSEEEEHHHHH
T ss_pred             CCCcCCChhhcC-CCeEEEcc-CCCeeCHHHHH
Confidence            369999987654 34455555 99999999975


No 108
>PF11781 RRN7:  RNA polymerase I-specific transcription initiation factor Rrn7;  InterPro: IPR021752  Rrn7 is a transcription binding factor that associates strongly with both Rrn6 and Rrn11 to form a complex which itself binds the TATA-binding protein and is required for transcription by the core domain of the RNA PolI promoter [],[]. 
Probab=39.09  E-value=21  Score=25.71  Aligned_cols=26  Identities=31%  Similarity=0.744  Sum_probs=19.8

Q ss_pred             CccccccCCcccCCCceEEccccccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMM  376 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~  376 (814)
                      ..|.+|.......++-..+|+.|+-.
T Consensus         9 ~~C~~C~~~~~~~~dG~~yC~~cG~~   34 (36)
T PF11781_consen    9 EPCPVCGSRWFYSDDGFYYCDRCGHQ   34 (36)
T ss_pred             CcCCCCCCeEeEccCCEEEhhhCceE
Confidence            45999998766666778889888754


No 109
>smart00744 RINGv The RING-variant domain is a C4HC3 zinc-finger like motif found in a number of cellular and viral proteins. Some of these proteins have been shown both in vivo and in vitro to have ubiquitin E3 ligase activity. The RING-variant domain is reminiscent of both the RING and the PHD domains and may represent an evolutionary intermediate. To describe this domain the term PHD/LAP domain has been used in the past. Extended description: The RING-variant (RINGv) domain contains a C4HC3 zinc-finger-like motif similar to the PHD domain, while some of the spacing between the Cys/His residues follow a pattern somewhat closer to that found in the RING domain. The RINGv domain, similar to the RING, PHD and LIM domains, is thought to bind two zinc ions co-ordinated by the highly conserved Cys and His residues. RING variant domain: C-x (2) -C-x(10-45)-C-x (1) -C-x (7) -H-x(2)-C-x(11-25)-C-x(2)-C As opposed to a PHD: C-x(1-2) -C-x (7-13)-C-x(2-4)-C-x(4-5)-H-x(2)-C-x(10-21)-C-x(2)-C Class
Probab=38.33  E-value=13  Score=28.61  Aligned_cols=31  Identities=23%  Similarity=0.685  Sum_probs=19.1

Q ss_pred             ccccccCCcccCCCceE-Ecc--cccccccccccc
Q 003510          352 KCSVCHMDEEYQNNLFL-QCD--KCRMMVHARCYG  383 (814)
Q Consensus       352 ~C~VC~~~~~~~~n~iv-~C~--~C~~~vH~~CYg  383 (814)
                      .|.||+..++ ++++++ -|.  +-...||+.|.-
T Consensus         1 ~CrIC~~~~~-~~~~l~~PC~C~G~~~~vH~~Cl~   34 (49)
T smart00744        1 ICRICHDEGD-EGDPLVSPCRCKGSLKYVHQECLE   34 (49)
T ss_pred             CccCCCCCCC-CCCeeEeccccCCchhHHHHHHHH
Confidence            4899998333 344443 333  233679999974


No 110
>smart00547 ZnF_RBZ Zinc finger domain. Zinc finger domain in Ran-binding proteins (RanBPs), and other proteins. In RanBPs, this domain binds RanGDP.
Probab=37.55  E-value=19  Score=23.50  Aligned_cols=23  Identities=22%  Similarity=0.502  Sum_probs=18.1

Q ss_pred             ceeeccccCCCCCCCCCceecCC
Q 003510          392 LWLCNLCRPGAPEPPPPCCLCPV  414 (814)
Q Consensus       392 ~W~C~~C~~~~~~~~~~C~lC~~  414 (814)
                      +|.|..|..........|..|..
T Consensus         2 ~W~C~~C~~~N~~~~~~C~~C~~   24 (26)
T smart00547        2 DWECPACTFLNFASRSKCFACGA   24 (26)
T ss_pred             cccCCCCCCcChhhhccccccCC
Confidence            79999998766556678888864


No 111
>KOG0825 consensus PHD Zn-finger protein [General function prediction only]
Probab=36.92  E-value=15  Score=43.74  Aligned_cols=30  Identities=30%  Similarity=0.805  Sum_probs=25.3

Q ss_pred             ccceeeCCc--cceeEecCCCCcCcc-cchhhHhh
Q 003510          463 LLCSICGVS--YGACIQCSNTTCRVA-YHPLCARA  494 (814)
Q Consensus       463 ~~C~~C~~~--~Ga~iqC~~~~C~~~-fH~~CA~~  494 (814)
                      -.|.||...  --.+|-|.  .|... ||..|--.
T Consensus       216 ~~C~IC~~~DpEdVLLLCD--sCN~~~YH~YCLDP  248 (1134)
T KOG0825|consen  216 VKCDICTVHDPEDVLLLCD--SCNKVYYHVYCLDP  248 (1134)
T ss_pred             ccceeeccCChHHhheeec--ccccceeeccccCc
Confidence            579999974  56889999  99999 99999744


No 112
>PF08666 SAF:  SAF domain;  InterPro: IPR013974  This entry includes a range of different proteins, such as antifreeze proteins, flagellar FlgA proteins, and CpaB pilus proteins. ; PDB: 1C89_A 3NLA_A 3RDN_A 1C8A_A 3FRN_A 1WVO_A 3K3S_H 3G8R_B 1XUU_A 1XUZ_A ....
Probab=36.49  E-value=22  Score=28.38  Aligned_cols=16  Identities=31%  Similarity=0.376  Sum_probs=11.9

Q ss_pred             EEEEcCCCCCCCeeeE
Q 003510          750 IIFAKRDIKQWEELTY  765 (814)
Q Consensus       750 ~i~A~rdI~~GEELt~  765 (814)
                      +++|.|||++|+.|+-
T Consensus         3 vvVA~~di~~G~~i~~   18 (63)
T PF08666_consen    3 VVVAARDIPAGTVITA   18 (63)
T ss_dssp             EEEESSTB-TT-BECT
T ss_pred             EEEEeCccCCCCEEcc
Confidence            4789999999999963


No 113
>PLN02915 cellulose synthase A [UDP-forming], catalytic subunit
Probab=36.09  E-value=21  Score=44.65  Aligned_cols=49  Identities=27%  Similarity=0.619  Sum_probs=37.7

Q ss_pred             CCccccccCC--cccCCCceEEccccccccccccccccccCCCCceeeccccC
Q 003510          350 LDKCSVCHMD--EEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       350 ~~~C~VC~~~--~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ..+|.||++.  -..++++.|-|..|+..|-..||- .+..+| .=.|..|+.
T Consensus        15 ~~~c~iCGd~vg~~~~Ge~FVAC~eC~fpvCr~cye-ye~~~g-~~~cp~c~t   65 (1044)
T PLN02915         15 AKTCRVCGDEVGVKEDGQPFVACHVCGFPVCKPCYE-YERSEG-NQCCPQCNT   65 (1044)
T ss_pred             cchhhccccccCcCCCCCEEEEeccCCCccccchhh-hhhhcC-CccCCccCC
Confidence            3699999875  245667899999999999999993 333334 678888874


No 114
>PLN02195 cellulose synthase A
Probab=34.55  E-value=23  Score=44.04  Aligned_cols=48  Identities=21%  Similarity=0.549  Sum_probs=37.1

Q ss_pred             CccccccCC--cccCCCceEEccccccccccccccccccCCCCceeeccccC
Q 003510          351 DKCSVCHMD--EEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       351 ~~C~VC~~~--~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ..|.||++.  -+.++++.|-|..|+..|-..||- .+.-+| .=-|..|+.
T Consensus         7 ~~c~~cgd~~~~~~~g~~fvaC~eC~~pvCrpCye-yer~eg-~q~CpqCkt   56 (977)
T PLN02195          7 PICATCGEEVGVDSNGEAFVACHECSYPLCKACLE-YEIKEG-RKVCLRCGG   56 (977)
T ss_pred             ccceecccccCcCCCCCeEEEeccCCCccccchhh-hhhhcC-CccCCccCC
Confidence            589999873  345667899999999999999993 333334 678888874


No 115
>PF05641 Agenet:  Agenet domain;  InterPro: IPR008395 This domain is related to the TUDOR domain IPR008191 from INTERPRO []. The function of the agenet domain is unknown. This signature matches one of the two Agenet domains in the FMR proteins [].; GO: 0003723 RNA binding; PDB: 2BKD_N 3O8V_A 3KUF_A 3H8Z_A.
Probab=34.28  E-value=41  Score=27.76  Aligned_cols=52  Identities=15%  Similarity=0.217  Sum_probs=29.9

Q ss_pred             CCCCCEEEEee--CCCC--CCCceeeCCCCcCccccccccCCCCcEEEEEeC--CC------CEEEEeCCCccccc
Q 003510           36 LEPGDIIWAKL--TGHA--MWPAIVVDESLIGDYKGLNKISGGRSIPVQFFG--TH------DFARINVKQVISFL   99 (814)
Q Consensus        36 f~~GdlVwaK~--~GyP--wWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg--~~------~~awv~~~~l~~f~   99 (814)
                      |++|+.|=.+-  .||.  |+||.|.....            .+.|.|+|-.  +.      -.-||....|.|--
T Consensus         1 F~~G~~VEV~s~e~g~~gaWf~a~V~~~~~------------~~~~~V~Y~~~~~~~~~~~~l~e~V~~~~iRP~p   64 (68)
T PF05641_consen    1 FKKGDEVEVSSDEDGFRGAWFPATVLKENG------------DDKYLVEYDDLPDEDGESPPLKEWVDARRIRPCP   64 (68)
T ss_dssp             --TT-EEEEEE-SBTT--EEEEEEEEEEET------------T-EEEEEETT-SS--------EEEEEGGGEEE--
T ss_pred             CCCCCEEEEEEcCCCCCcEEEEEEEEEeCC------------CcEEEEEECCcccccccccccEEEechheEECcC
Confidence            67899887665  4665  99999976311            1168999842  11      25678777777653


No 116
>PLN02189 cellulose synthase
Probab=34.05  E-value=23  Score=44.21  Aligned_cols=50  Identities=26%  Similarity=0.659  Sum_probs=38.2

Q ss_pred             CCccccccCCc--ccCCCceEEccccccccccccccccccCCCCceeeccccCC
Q 003510          350 LDKCSVCHMDE--EYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPG  401 (814)
Q Consensus       350 ~~~C~VC~~~~--~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~  401 (814)
                      ...|.||++.-  ..+++..|-|.-|+-.|-..||- .+..+| .=.|..|+..
T Consensus        34 ~~~C~iCgd~vg~~~~g~~fvaC~~C~fpvCr~Cye-yer~eg-~q~CpqCkt~   85 (1040)
T PLN02189         34 GQVCEICGDEIGLTVDGDLFVACNECGFPVCRPCYE-YERREG-TQNCPQCKTR   85 (1040)
T ss_pred             CccccccccccCcCCCCCEEEeeccCCCccccchhh-hhhhcC-CccCcccCCc
Confidence            35999998753  35667899999999999999993 333333 7789999753


No 117
>PF12773 DZR:  Double zinc ribbon
Probab=33.06  E-value=36  Score=26.03  Aligned_cols=38  Identities=21%  Similarity=0.458  Sum_probs=22.5

Q ss_pred             eEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceec
Q 003510          367 FLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLC  412 (814)
Q Consensus       367 iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC  412 (814)
                      ..+|..|+..+-        ..+...++|..|..........|.-|
T Consensus        12 ~~fC~~CG~~l~--------~~~~~~~~C~~Cg~~~~~~~~fC~~C   49 (50)
T PF12773_consen   12 AKFCPHCGTPLP--------PPDQSKKICPNCGAENPPNAKFCPNC   49 (50)
T ss_pred             ccCChhhcCChh--------hccCCCCCCcCCcCCCcCCcCccCcc
Confidence            456777776665        22334678888876554444555554


No 118
>PF11793 FANCL_C:  FANCL C-terminal domain; PDB: 3K1L_A.
Probab=32.20  E-value=20  Score=29.92  Aligned_cols=32  Identities=34%  Similarity=0.758  Sum_probs=13.2

Q ss_pred             ccceeeCCc---cc--eeEecCCCCcCcccchhhHhh
Q 003510          463 LLCSICGVS---YG--ACIQCSNTTCRVAYHPLCARA  494 (814)
Q Consensus       463 ~~C~~C~~~---~G--a~iqC~~~~C~~~fH~~CA~~  494 (814)
                      ..|.||...   .+  .-+.|.+..|...||..|-..
T Consensus         3 ~~C~IC~~~~~~~~~~p~~~C~n~~C~~~fH~~CL~~   39 (70)
T PF11793_consen    3 LECGICYSYRLDDGEIPDVVCPNPSCGKKFHLLCLSE   39 (70)
T ss_dssp             -S-SSS--SS-TT-----B--S-TT----B-SGGGHH
T ss_pred             CCCCcCCcEecCCCCcCceEcCCcccCCHHHHHHHHH
Confidence            468999852   22  347999999999999999744


No 119
>KOG0954 consensus PHD finger protein [General function prediction only]
Probab=31.80  E-value=29  Score=41.31  Aligned_cols=34  Identities=21%  Similarity=0.271  Sum_probs=23.7

Q ss_pred             cceeeCCccceeEecCCCCcCcccchhhHhh-cCceE
Q 003510          464 LCSICGVSYGACIQCSNTTCRVAYHPLCARA-AGLCV  499 (814)
Q Consensus       464 ~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~-~g~~~  499 (814)
                      .|.+|-+.+|++-.=..+  ..+-|+.||.. -.+.+
T Consensus       325 pCvLCPkkGGamK~~~sg--T~wAHvsCALwIPEVsi  359 (893)
T KOG0954|consen  325 PCVLCPKKGGAMKPTKSG--TKWAHVSCALWIPEVSI  359 (893)
T ss_pred             CeeeccccCCcccccCCC--CeeeEeeeeeccceeec
Confidence            699999987877654422  37889999944 34443


No 120
>cd04370 BAH BAH, or Bromo Adjacent Homology domain (also called ELM1 and BAM for Bromo Adjacent Motif). BAH domains have first been described as domains found in the polybromo protein and Yeast Rsc1/Rsc2 (Remodeling of the Structure of Chromatin). They also occur in mammalian DNA methyltransferases and the MTA1 subunits of histone deacetylase complexes. A BAH domain is also found in Yeast Sir3p and in the origin receptor complex protein 1 (Orc1p), where it was found to interact with the N-terminal lobe of the silence information regulator 1 protein (Sir1p), confirming the initial hypothesis that BAH plays a role in protein-protein interactions.
Probab=31.31  E-value=52  Score=29.86  Aligned_cols=43  Identities=16%  Similarity=0.272  Sum_probs=30.5

Q ss_pred             CCCCCCCEEEEeeCC----CCCCCceeeCCCCcCccccccccCCCCcEEEEEeCC
Q 003510           34 QELEPGDIIWAKLTG----HAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGT   84 (814)
Q Consensus        34 ~~f~~GdlVwaK~~G----yPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~   84 (814)
                      ..|++||.|..+-..    -|.|.|+|..-..        ...+...+.|+||=.
T Consensus         2 ~~y~vgd~V~v~~~~~~~~~~~~i~~I~~i~~--------~~~~~~~~~v~wf~r   48 (123)
T cd04370           2 ITYEVGDSVYVEPDDSIKSDPPYIARIEELWE--------DTNGSKQVKVRWFYR   48 (123)
T ss_pred             CEEecCCEEEEecCCcCCCCCCEEEEEeeeeE--------CCCCCEEEEEEEEEc
Confidence            468899999999887    6899999965321        112334677888754


No 121
>PF00641 zf-RanBP:  Zn-finger in Ran binding protein and others;  InterPro: IPR001876 Zinc finger (Znf) domains are relatively small protein motifs which contain multiple finger-like protrusions that make tandem contacts with their target molecule. Some of these domains bind zinc, but many do not; instead binding other metals such as iron, or no metal at all. For example, some family members form salt bridges to stabilise the finger-like folds. They were first identified as a DNA-binding motif in transcription factor TFIIIA from Xenopus laevis (African clawed frog), however they are now recognised to bind DNA, RNA, protein and/or lipid substrates [, , , , ]. Their binding properties depend on the amino acid sequence of the finger domains and of the linker between fingers, as well as on the higher-order structures and the number of fingers. Znf domains are often found in clusters, where fingers can have different binding specificities. There are many superfamilies of Znf motifs, varying in both sequence and structure. They display considerable versatility in binding modes, even between members of the same class (e.g. some bind DNA, others protein), suggesting that Znf motifs are stable scaffolds that have evolved specialised functions. For example, Znf-containing proteins function in gene transcription, translation, mRNA trafficking, cytoskeleton organisation, epithelial development, cell adhesion, protein folding, chromatin remodelling and zinc sensing, to name but a few []. Zinc-binding motifs are stable structures, and they rarely undergo conformational changes upon binding their target.  This entry represents the zinc finger domain found in RanBP2 proteins. Ran is an evolutionary conserved member of the Ras superfamily that regulates all receptor-mediated transport between the nucleus and the cytoplasm. Ran binding protein 2 (RanBP2) is a 358kDa nucleoporin located on the cytoplasmic side of the nuclear pore complex which plays a role in nuclear protein import []. RanBP2 contains multiple zinc fingers which mediate binding to RanGDP []. More information about these proteins can be found at Protein of the Month: Zinc Fingers [].; GO: 0008270 zinc ion binding, 0005622 intracellular; PDB: 2D9G_A 2EBR_A 2WX0_C 2WX1_C 2WWZ_C 3GJ6_B 2LK0_A 2LK1_A 3GJ5_B 3GJ8_B ....
Probab=31.00  E-value=14  Score=25.10  Aligned_cols=24  Identities=25%  Similarity=0.614  Sum_probs=16.9

Q ss_pred             CceeeccccCCCCCCCCCceecCC
Q 003510          391 VLWLCNLCRPGAPEPPPPCCLCPV  414 (814)
Q Consensus       391 ~~W~C~~C~~~~~~~~~~C~lC~~  414 (814)
                      +.|.|..|..........|..|..
T Consensus         3 g~W~C~~C~~~N~~~~~~C~~C~~   26 (30)
T PF00641_consen    3 GDWKCPSCTFMNPASRSKCVACGA   26 (30)
T ss_dssp             SSEEETTTTEEEESSSSB-TTT--
T ss_pred             cCccCCCCcCCchHHhhhhhCcCC
Confidence            389999999766666678888853


No 122
>PF07227 DUF1423:  Protein of unknown function (DUF1423);  InterPro: IPR004082 A total of 715 potential protein-coding genes have been identified in the nucleotide sequence of Arabidopsis thaliana chromosome 5, with an average gene density of 1 gene per 4001 bp []. Amongst the gene products is a well-conserved family of 130.7kDa proteins that share no sequence similarity with any other known proteins, other than in plants. The sequences are characterised by an N-terminal domain of variable length, a central cysteine-rich region and a relatively acidic C-terminal domain. The sequences may possess a PHD finger.
Probab=30.98  E-value=35  Score=38.61  Aligned_cols=31  Identities=23%  Similarity=0.639  Sum_probs=21.7

Q ss_pred             ccccccCCc-ccCCCceEEccccccccccccc
Q 003510          352 KCSVCHMDE-EYQNNLFLQCDKCRMMVHARCY  382 (814)
Q Consensus       352 ~C~VC~~~~-~~~~n~iv~C~~C~~~vH~~CY  382 (814)
                      -|.||...+ ..+.-.-|.||-|+-..|..|-
T Consensus       130 ~C~iC~kfD~~~n~~~Wi~Cd~CgH~cH~dCA  161 (446)
T PF07227_consen  130 MCCICSKFDDNKNTCSWIGCDVCGHWCHLDCA  161 (446)
T ss_pred             CccccCCcccCCCCeeEEeccCCCceehhhhh
Confidence            466776532 2233447899999999999994


No 123
>PF12861 zf-Apc11:  Anaphase-promoting complex subunit 11 RING-H2 finger
Probab=29.83  E-value=27  Score=30.29  Aligned_cols=34  Identities=21%  Similarity=0.447  Sum_probs=24.4

Q ss_pred             CCCccccccCCcc---------cCCCceEEcccccccccccccc
Q 003510          349 DLDKCSVCHMDEE---------YQNNLFLQCDKCRMMVHARCYG  383 (814)
Q Consensus       349 ~~~~C~VC~~~~~---------~~~n~iv~C~~C~~~vH~~CYg  383 (814)
                      +++.|.||+...+         .++-+|+.+. |+-.+|..|.-
T Consensus        20 ~dd~CgICr~~fdg~Cp~Ck~Pgd~Cplv~g~-C~H~FH~hCI~   62 (85)
T PF12861_consen   20 NDDVCGICRMPFDGCCPDCKFPGDDCPLVWGK-CSHNFHMHCIL   62 (85)
T ss_pred             CCCceeeEecccccCCCCccCCCCCCceeecc-CccHHHHHHHH
Confidence            4689999987543         2344566555 99999999963


No 124
>PF13771 zf-HC5HC2H:  PHD-like zinc-binding domain
Probab=29.80  E-value=42  Score=29.03  Aligned_cols=35  Identities=26%  Similarity=0.326  Sum_probs=27.7

Q ss_pred             CCCceecCCCCCCceecC---CCcchhhhhhccccceE
Q 003510          406 PPPCCLCPVVGGAMKPTT---DGRWAHLACAIWIPETC  440 (814)
Q Consensus       406 ~~~C~lC~~~~Galk~t~---~~~WvH~~Ca~~~pe~~  440 (814)
                      ...|.+|...+||.....   .....|+.||+...-..
T Consensus        36 ~~~C~~C~~~~Ga~i~C~~~~C~~~fH~~CA~~~~~~~   73 (90)
T PF13771_consen   36 KLKCSICKKKGGACIGCSHPGCSRSFHVPCARKAGCFI   73 (90)
T ss_pred             CCCCcCCCCCCCeEEEEeCCCCCcEEChHHHccCCeEE
Confidence            468999999978887665   46899999999865443


No 125
>KOG0782 consensus Predicted diacylglycerol kinase [Signal transduction mechanisms]
Probab=29.78  E-value=15  Score=42.08  Aligned_cols=20  Identities=35%  Similarity=0.913  Sum_probs=16.4

Q ss_pred             eEEccccccccccccccccc
Q 003510          367 FLQCDKCRMMVHARCYGELE  386 (814)
Q Consensus       367 iv~C~~C~~~vH~~CYg~~~  386 (814)
                      --.|.-|.+.||..|.....
T Consensus       199 rRkCAaCkIVvHT~CieqLe  218 (1004)
T KOG0782|consen  199 RRKCAACKIVVHTNCIEQLE  218 (1004)
T ss_pred             hccceeeeEEEechHHHHHH
Confidence            34799999999999986544


No 126
>PF02452 PemK:  PemK-like protein;  InterPro: IPR003477 PemK is a growth inhibitor in Escherichia coli known to bind to the promoter region of the Pem operon, auto-regulating synthesis. It is responsible for mediating cell death through inhibiting protein synthesis through the cleavage of single-stranded RNA. PemK is part of the PemK-PemI system, where PemI is an antitoxin that inhibits the action of the PemK toxin []. PemK homologues have been found in a wide range of bacteria, which together form an endonuclease family that interfere with mRNA function. This family consists of the PemK protein in addition to ChpA, ChpB, Kid and MazF.; GO: 0003677 DNA binding; PDB: 1M1F_A 2C06_A 3NFC_F 1UB4_B 1NE8_A.
Probab=29.67  E-value=93  Score=27.65  Aligned_cols=68  Identities=18%  Similarity=0.273  Sum_probs=36.9

Q ss_pred             CCCCEEEEeeC--CC---CCCCceeeCCCCcCc-----cccccccCC-C-C-cEEEEEeCC---CC----EEEEeCCCcc
Q 003510           37 EPGDIIWAKLT--GH---AMWPAIVVDESLIGD-----YKGLNKISG-G-R-SIPVQFFGT---HD----FARINVKQVI   96 (814)
Q Consensus        37 ~~GdlVwaK~~--Gy---PwWPa~V~~~~~~~~-----~~~~~~~~~-~-~-~~~V~FFg~---~~----~awv~~~~l~   96 (814)
                      +.||+||+.+.  |-   -.=||+|++......     ...+..+.. . . .+.|.--..   ..    -+||...++.
T Consensus         1 k~GdI~~v~~p~~~~e~~k~RP~vVls~~~~n~~~~v~v~piTs~~~~~~~~~~~~~i~~~~~~~~~~~~~s~v~~~~i~   80 (110)
T PF02452_consen    1 KRGDIVWVDFPDFGSEMGKRRPAVVLSNNAFNENGTVVVVPITSKKPNKKPFPFHVEIEPDDYNGLKGLKDSYVRCDQIR   80 (110)
T ss_dssp             STTEEEEEE-S--TTS--SEEEEEE-S-HHHHHHSEEEEEEEESSTTSSSSCTTEEEETCSHCTSSS---SEEEECCCEE
T ss_pred             CCceEEEEECCCCCcccCCcccEEEEEeecccccCceeEEEeeeccccccccceEEEEcccccccccccCCceeEEEEEE
Confidence            57999999994  21   378999998752211     001111111 1 1 334544433   12    2999999999


Q ss_pred             ccccchhc
Q 003510           97 SFLKGLLS  104 (814)
Q Consensus        97 ~f~~~~~~  104 (814)
                      .+....+.
T Consensus        81 ~i~~~~~~   88 (110)
T PF02452_consen   81 TIDKERLR   88 (110)
T ss_dssp             EEECCCTE
T ss_pred             EECHHHCe
Confidence            99865443


No 127
>KOG0696 consensus Serine/threonine protein kinase [Signal transduction mechanisms]
Probab=29.64  E-value=22  Score=39.80  Aligned_cols=85  Identities=24%  Similarity=0.312  Sum_probs=49.1

Q ss_pred             CCCccccccCCcccCCCceEEcccccccccccccccc--------ccCCC---------------CceeeccccCCCCCC
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGEL--------EPVNG---------------VLWLCNLCRPGAPEP  405 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~--------~~~~~---------------~~W~C~~C~~~~~~~  405 (814)
                      +..+|+-|..---.-.-+=.+|.-|...||+.|.-..        .-++.               ++-||+.|-.-.   
T Consensus        55 qPTfCsHCkDFiwGfgKQGfQCqvC~fvvHkrChefVtF~CPGadkg~dtDdpr~kHkf~~~tYssPTFCDhCGsLL---  131 (683)
T KOG0696|consen   55 QPTFCSHCKDFIWGFGKQGFQCQVCCFVVHKRCHEFVTFSCPGADKGPDTDDPRSKHKFKIHTYSSPTFCDHCGSLL---  131 (683)
T ss_pred             CCchhhhhhhheeccccCceeeeEEeehhhhhhcceEEEECCCCCCCCCCCCcccccceeeeecCCCchhhhHHHHH---
Confidence            3468999965322223345799999999999997421        11110               124555553210   


Q ss_pred             CCCceecCCCCCCceecCCCcchhhhhhccccceEEc
Q 003510          406 PPPCCLCPVVGGAMKPTTDGRWAHLACAIWIPETCLT  442 (814)
Q Consensus       406 ~~~C~lC~~~~Galk~t~~~~WvH~~Ca~~~pe~~~~  442 (814)
                            =+....-||-.+...=||-.|..-+|...=.
T Consensus       132 ------yGl~HQGmKC~~C~mNVH~rCv~nVPslCG~  162 (683)
T KOG0696|consen  132 ------YGLIHQGMKCDTCDMNVHHRCVENVPSLCGT  162 (683)
T ss_pred             ------HHHHhcccccccccchHHHHHhhcCCcccCC
Confidence                  0111223555566677999999888876533


No 128
>KOG3409 consensus Exosomal 3'-5' exoribonuclease complex, subunit ski4 (Csl4) [Translation, ribosomal structure and biogenesis]
Probab=29.63  E-value=32  Score=33.74  Aligned_cols=14  Identities=43%  Similarity=0.864  Sum_probs=12.0

Q ss_pred             CCCCCCCCEEEEee
Q 003510           33 CQELEPGDIIWAKL   46 (814)
Q Consensus        33 ~~~f~~GdlVwaK~   46 (814)
                      .+.|+|||+|.||+
T Consensus       120 ~ksFrPgDiVlAkV  133 (193)
T KOG3409|consen  120 YKSFRPGDIVLAKV  133 (193)
T ss_pred             hhccCCCcEEEEEE
Confidence            44699999999987


No 129
>KOG0383 consensus Predicted helicase [General function prediction only]
Probab=29.59  E-value=28  Score=41.93  Aligned_cols=31  Identities=29%  Similarity=0.674  Sum_probs=26.1

Q ss_pred             ccceeeCCccceeEecCCCCcCcccchhhHhhcC
Q 003510          463 LLCSICGVSYGACIQCSNTTCRVAYHPLCARAAG  496 (814)
Q Consensus       463 ~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~~g  496 (814)
                      ..|.+|+. +|-.|-|+  .|..+||..|.-.-+
T Consensus        48 e~c~ic~~-~g~~l~c~--tC~~s~h~~cl~~pl   78 (696)
T KOG0383|consen   48 EACRICAD-GGELLWCD--TCPASFHASCLGPPL   78 (696)
T ss_pred             hhhhhhcC-CCcEEEec--cccHHHHHHccCCCC
Confidence            47999998 68888898  999999999984443


No 130
>KOG4299 consensus PHD Zn-finger protein [General function prediction only]
Probab=29.22  E-value=19  Score=42.08  Aligned_cols=46  Identities=24%  Similarity=0.570  Sum_probs=33.3

Q ss_pred             CCccccccCCcccCCCceEEccccccccccccccccccC--CCCceeeccccC
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPV--NGVLWLCNLCRP  400 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~--~~~~W~C~~C~~  400 (814)
                      ...|.+|...+.     ++.|+.|--++|+.|-+....+  .+..|.|..|..
T Consensus        47 ~ts~~~~~~~gn-----~~~~~~~~~s~h~~~~~~~~sp~~~~~~~~~~~~~~   94 (613)
T KOG4299|consen   47 ATSCGICKSGGN-----LLCCDHCPASFHLECDKPPLSPDLKGSEINCSRCPK   94 (613)
T ss_pred             hhhcchhhhcCC-----ccccccCccccchhccCcccCcccccccccccCCCc
Confidence            568888887654     5678899999999987754433  344688888865


No 131
>PF11302 DUF3104:  Protein of unknown function (DUF3104);  InterPro: IPR021453  This family of proteins with unknown function appears to be restricted to Cyanobacteria. 
Probab=27.89  E-value=1.4e+02  Score=25.31  Aligned_cols=57  Identities=18%  Similarity=0.198  Sum_probs=42.8

Q ss_pred             CCCCCEEEEeeCC-------CCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCCEEEEeCCCccc
Q 003510           36 LEPGDIIWAKLTG-------HAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHDFARINVKQVIS   97 (814)
Q Consensus        36 f~~GdlVwaK~~G-------yPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~~awv~~~~l~~   97 (814)
                      +++||.|..+=..       -.||=|.|+.-..     +.+.+....-+.|-=-.+...-||..+.+..
T Consensus         6 Vk~Gd~ViV~~~~~~~~~~~~dWWmg~Vi~~~g-----gaR~P~~~tlFQVadVDtG~I~wVnaD~Vt~   69 (75)
T PF11302_consen    6 VKPGDTVIVQDEQEVGQKQDKDWWMGQVIHCEG-----GARDPKVPTLFQVADVDTGVIRWVNADEVTH   69 (75)
T ss_pred             cCCCCEEEEecCccccccCCCCcEEEEEEEEec-----cccCCCCCceEEEEEccCCeEEEEEchheee
Confidence            6899999999887       7899999987532     1233333455779999999999999876643


No 132
>PF13832 zf-HC5HC2H_2:  PHD-zinc-finger like domain
Probab=27.83  E-value=34  Score=31.02  Aligned_cols=29  Identities=28%  Similarity=0.725  Sum_probs=24.6

Q ss_pred             CCccccccCCcccCCCceEEccc--cccccccccc
Q 003510          350 LDKCSVCHMDEEYQNNLFLQCDK--CRMMVHARCY  382 (814)
Q Consensus       350 ~~~C~VC~~~~~~~~n~iv~C~~--C~~~vH~~CY  382 (814)
                      ...|.||....    ...+.|..  |...+|..|-
T Consensus        55 ~~~C~iC~~~~----G~~i~C~~~~C~~~fH~~CA   85 (110)
T PF13832_consen   55 KLKCSICGKSG----GACIKCSHPGCSTAFHPTCA   85 (110)
T ss_pred             CCcCcCCCCCC----ceeEEcCCCCCCcCCCHHHH
Confidence            36999999863    34899997  9999999996


No 133
>smart00109 C1 Protein kinase C conserved region 1 (C1) domains (Cysteine-rich domains). Some bind phorbol esters and diacylglycerol. Some bind RasGTP. Zinc-binding domains.
Probab=26.72  E-value=33  Score=25.62  Aligned_cols=32  Identities=31%  Similarity=0.649  Sum_probs=25.3

Q ss_pred             ccceeeCCccc---eeEecCCCCcCcccchhhHhhcC
Q 003510          463 LLCSICGVSYG---ACIQCSNTTCRVAYHPLCARAAG  496 (814)
Q Consensus       463 ~~C~~C~~~~G---a~iqC~~~~C~~~fH~~CA~~~g  496 (814)
                      ..|.+|++...   ..++|.  .|....|..|+....
T Consensus        12 ~~C~~C~~~i~~~~~~~~C~--~C~~~~H~~C~~~v~   46 (49)
T smart00109       12 TKCCVCRKSIWGSFQGLRCS--WCKVKCHKKCAEKVP   46 (49)
T ss_pred             CCccccccccCcCCCCcCCC--CCCchHHHHHHhhcC
Confidence            46999998433   368897  899999999997654


No 134
>KOG2807 consensus RNA polymerase II transcription initiation/nucleotide excision repair factor TFIIH, subunit SSL1 [Transcription; Replication, recombination and repair]
Probab=24.45  E-value=42  Score=36.18  Aligned_cols=88  Identities=17%  Similarity=0.456  Sum_probs=50.4

Q ss_pred             cCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcchhhhhhccccceEEccCCCcccccccccchhcccC--cc
Q 003510          387 PVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWAHLACAIWIPETCLTDVKRMEPIDGLNRVSKDRWK--LL  464 (814)
Q Consensus       387 ~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~WvH~~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~--~~  464 (814)
                      ++.+..++|..|+...-.....|-.|...-   .-+.     |+.=+.          ..+-|+.....++.....  ..
T Consensus       271 ~~~~~Gy~CP~CkakvCsLP~eCpiC~ltL---Vss~-----hLARSy----------hhL~PL~~F~Eip~~~~~~~~~  332 (378)
T KOG2807|consen  271 ELSGGGYFCPQCKAKVCSLPIECPICSLTL---VSSP-----HLARSY----------HHLFPLKPFVEIPETEYNGSRF  332 (378)
T ss_pred             ccccCceeCCcccCeeecCCccCCccceeE---ecch-----HHHHHH----------HhhcCCcchhhccccccCCCcc
Confidence            345668999999975544456788886432   1111     111111          112233333444443322  24


Q ss_pred             ceeeCC--ccceeEecCCCCcCcccchhhHhh
Q 003510          465 CSICGV--SYGACIQCSNTTCRVAYHPLCARA  494 (814)
Q Consensus       465 C~~C~~--~~Ga~iqC~~~~C~~~fH~~CA~~  494 (814)
                      |..|+.  ..+...+|.  .|+..|=.-|-..
T Consensus       333 Cf~C~~~~~~~~~y~C~--~Ck~~FCldCDv~  362 (378)
T KOG2807|consen  333 CFACQGELLSSGRYRCE--SCKNVFCLDCDVF  362 (378)
T ss_pred             eeeeccccCCCCcEEch--hccceeeccchHH
Confidence            999943  467788998  8999998888643


No 135
>PF10367 Vps39_2:  Vacuolar sorting protein 39 domain 2;  InterPro: IPR019453  This entry represents a domain found in the vacuolar sorting protein Vps39 and transforming growth factor beta receptor-associated protein Trap1. Vps39, a component of the C-Vps complex, is thought to be required for the fusion of endosomes and other types of transport intermediates with the vacuole [, ]. In Saccharomyces cerevisiae (Baker's yeast), Vps39 has been shown to stimulate nucleotide exchange []. Trap1 plays a role in the TGF-beta/activin signaling pathway. It associates with inactive heteromeric TGF-beta and activin receptor complexes, mainly through the type II receptor, and is released upon activation of signaling [, ]. The precise function of this domain has not been characterised In Vps39 this domain is involved in localisation and in mediating the interactions with Vps11 []. 
Probab=24.40  E-value=54  Score=29.22  Aligned_cols=31  Identities=32%  Similarity=0.634  Sum_probs=21.0

Q ss_pred             CCCccccccCCcccCCCceEEccccccccccccc
Q 003510          349 DLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCY  382 (814)
Q Consensus       349 ~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CY  382 (814)
                      +...|.||...-..  ..++ ---|+..||..|+
T Consensus        77 ~~~~C~vC~k~l~~--~~f~-~~p~~~v~H~~C~  107 (109)
T PF10367_consen   77 ESTKCSVCGKPLGN--SVFV-VFPCGHVVHYSCI  107 (109)
T ss_pred             CCCCccCcCCcCCC--ceEE-EeCCCeEEecccc
Confidence            44689999885432  2333 3356799999996


No 136
>PF04810 zf-Sec23_Sec24:  Sec23/Sec24 zinc finger;  InterPro: IPR006895 Zinc finger (Znf) domains are relatively small protein motifs which contain multiple finger-like protrusions that make tandem contacts with their target molecule. Some of these domains bind zinc, but many do not; instead binding other metals such as iron, or no metal at all. For example, some family members form salt bridges to stabilise the finger-like folds. They were first identified as a DNA-binding motif in transcription factor TFIIIA from Xenopus laevis (African clawed frog), however they are now recognised to bind DNA, RNA, protein and/or lipid substrates [, , , , ]. Their binding properties depend on the amino acid sequence of the finger domains and of the linker between fingers, as well as on the higher-order structures and the number of fingers. Znf domains are often found in clusters, where fingers can have different binding specificities. There are many superfamilies of Znf motifs, varying in both sequence and structure. They display considerable versatility in binding modes, even between members of the same class (e.g. some bind DNA, others protein), suggesting that Znf motifs are stable scaffolds that have evolved specialised functions. For example, Znf-containing proteins function in gene transcription, translation, mRNA trafficking, cytoskeleton organisation, epithelial development, cell adhesion, protein folding, chromatin remodelling and zinc sensing, to name but a few []. Zinc-binding motifs are stable structures, and they rarely undergo conformational changes upon binding their target.  COPII (coat protein complex II)-coated vesicles carry proteins from the endoplasmic reticulum (ER) to the Golgi complex []. COPII-coated vesicles form on the ER by the stepwise recruitment of three cytosolic components: Sar1-GTP to initiate coat formation, Sec23/24 heterodimer to select SNARE and cargo molecules, and Sec13/31 to induce coat polymerisation and membrane deformation [].  Sec23 p and Sec24p are structurally related, folding into five distinct domains: a beta-barrel, a zinc-finger, an alpha/beta trunk domain (IPR006896 from INTERPRO), an all-helical region (IPR006900 from INTERPRO), and a C-terminal gelsolin-like domain (IPR007123 from INTERPRO). This entry describes an approximately 55-residue Sec23/24 zinc-binding domain, which lies against the beta-barrel at the periphery of the complex. More information about these proteins can be found at Protein of the Month: Zinc Fingers [].; GO: 0008270 zinc ion binding, 0006886 intracellular protein transport, 0006888 ER to Golgi vesicle-mediated transport, 0030127 COPII vesicle coat; PDB: 3EFO_B 3EG9_B 3EGD_A 2YRC_A 2NUP_A 2YRD_A 3EGX_A 2NUT_A 3EH1_A 1PD0_A ....
Probab=23.77  E-value=43  Score=24.59  Aligned_cols=31  Identities=29%  Similarity=0.860  Sum_probs=16.5

Q ss_pred             eEEccccccccccccccccccCCCCceeeccccC
Q 003510          367 FLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRP  400 (814)
Q Consensus       367 iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~  400 (814)
                      ++.|.+|+..+--.|-   ....+..|.|..|..
T Consensus         2 p~rC~~C~aylNp~~~---~~~~~~~w~C~~C~~   32 (40)
T PF04810_consen    2 PVRCRRCRAYLNPFCQ---FDDGGKTWICNFCGT   32 (40)
T ss_dssp             S-B-TTT--BS-TTSE---EETTTTEEEETTT--
T ss_pred             ccccCCCCCEECCcce---EcCCCCEEECcCCCC
Confidence            5678888877766663   223455899999975


No 137
>cd05791 S1_CSL4 S1_CSL4: CSL4, S1-like RNA-binding domain. S1-like RNA-binding domains are found in a wide variety of RNA-associated proteins. ScCSL4 protein is a subunit of the exosome complex. The exosome plays a central role in 3' to 5' RNA processing and degradation in eukarytes and archaea. Its functions include the removal of incorrectly processed RNA and the maintenance of proper levels of mRNA, rRNA and a number of small RNA species. In S. cerevisiae, the exosome includes nine core components, six of which are homologous to bacterial RNase PH. These form a hexameric ring structure. The other three subunits (RrP4, Rrp40, and Csl4) contain an S1 RNA binding domain and are part of the "S1 pore structure".
Probab=23.54  E-value=48  Score=29.22  Aligned_cols=16  Identities=38%  Similarity=0.617  Sum_probs=13.6

Q ss_pred             CCCCCCEEEEeeCCCC
Q 003510           35 ELEPGDIIWAKLTGHA   50 (814)
Q Consensus        35 ~f~~GdlVwaK~~GyP   50 (814)
                      -|++||+|-||+-.+-
T Consensus        60 ~f~~GDiV~AkVis~~   75 (92)
T cd05791          60 CFRPGDIVRAKVISLG   75 (92)
T ss_pred             hcCCCCEEEEEEEEcC
Confidence            4999999999997653


No 138
>KOG4477 consensus RING1 interactor RYBP and related Zn-finger-containing proteins [Transcription]
Probab=23.49  E-value=38  Score=33.36  Aligned_cols=32  Identities=22%  Similarity=0.509  Sum_probs=26.0

Q ss_pred             CCceeeccccCCCCCCCCCceecCCCCCCcee
Q 003510          390 GVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKP  421 (814)
Q Consensus       390 ~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~  421 (814)
                      .+.|-|..|.+........|++|..+.|--.+
T Consensus        22 eg~WdCsvCTFrNsAeAfkC~vCdvRKGTSTR   53 (228)
T KOG4477|consen   22 EGKWDCSVCTFRNSAEAFKCFVCDVRKGTSTR   53 (228)
T ss_pred             cCceeeeeeeecchhhhhheeeeccccccccc
Confidence            34799999998776677899999998886544


No 139
>PF10367 Vps39_2:  Vacuolar sorting protein 39 domain 2;  InterPro: IPR019453  This entry represents a domain found in the vacuolar sorting protein Vps39 and transforming growth factor beta receptor-associated protein Trap1. Vps39, a component of the C-Vps complex, is thought to be required for the fusion of endosomes and other types of transport intermediates with the vacuole [, ]. In Saccharomyces cerevisiae (Baker's yeast), Vps39 has been shown to stimulate nucleotide exchange []. Trap1 plays a role in the TGF-beta/activin signaling pathway. It associates with inactive heteromeric TGF-beta and activin receptor complexes, mainly through the type II receptor, and is released upon activation of signaling [, ]. The precise function of this domain has not been characterised In Vps39 this domain is involved in localisation and in mediating the interactions with Vps11 []. 
Probab=23.39  E-value=33  Score=30.66  Aligned_cols=31  Identities=26%  Similarity=0.583  Sum_probs=20.6

Q ss_pred             ccceeeCCccceeEecCCCCcCcccchhhHhh
Q 003510          463 LLCSICGVSYGACIQCSNTTCRVAYHPLCARA  494 (814)
Q Consensus       463 ~~C~~C~~~~Ga~iqC~~~~C~~~fH~~CA~~  494 (814)
                      ..|.+|+++-|...--.+ -|...||..|+.+
T Consensus        79 ~~C~vC~k~l~~~~f~~~-p~~~v~H~~C~~r  109 (109)
T PF10367_consen   79 TKCSVCGKPLGNSVFVVF-PCGHVVHYSCIKR  109 (109)
T ss_pred             CCccCcCCcCCCceEEEe-CCCeEEecccccC
Confidence            469999996554322222 4568999999853


No 140
>PF09465 LBR_tudor:  Lamin-B receptor of TUDOR domain;  InterPro: IPR019023  The Lamin-B receptor is a chromatin and lamin binding protein in the inner nuclear membrane. It is one of the integral inner nuclear envelope membrane proteins responsible for targeting nuclear membranes to chromatin, being a downstream effector of Ran, a small Ras-like nuclear GTPase which regulates NE assembly. Lamin-B receptor interacts with importin beta, a Ran-binding protein, thereby directly contributing to the fusion of membrane vesicles and the formation of the nuclear envelope []. ; PDB: 2L8D_A 2DIG_A.
Probab=22.82  E-value=1.2e+02  Score=24.13  Aligned_cols=25  Identities=12%  Similarity=0.492  Sum_probs=18.1

Q ss_pred             CCCCCCCEEEEeeCCCCCC-CceeeC
Q 003510           34 QELEPGDIIWAKLTGHAMW-PAIVVD   58 (814)
Q Consensus        34 ~~f~~GdlVwaK~~GyPwW-Pa~V~~   58 (814)
                      .+|..|++|-+|-.|-.-| +|+|.+
T Consensus         4 ~k~~~Ge~V~~rWP~s~lYYe~kV~~   29 (55)
T PF09465_consen    4 RKFAIGEVVMVRWPGSSLYYEGKVLS   29 (55)
T ss_dssp             SSS-SS-EEEEE-TTTS-EEEEEEEE
T ss_pred             ccccCCCEEEEECCCCCcEEEEEEEE
Confidence            6799999999998888877 888866


No 141
>cd04721 BAH_plant_1 BAH, or Bromo Adjacent Homology domain, plant-specific sub-family with unknown function. BAH domains are found in a variety of proteins playing roles in transcriptional silencing and the remodeling of chromatin. It is assumed that in most or all of these instances the BAH domain mediates protein-protein interactions.
Probab=22.78  E-value=86  Score=29.59  Aligned_cols=52  Identities=17%  Similarity=0.218  Sum_probs=36.3

Q ss_pred             CCCCCCCCEEEEeeCCCCCCCceeeCCCCcCccccccccCCCCcEEEEEeCCCC--EEEEeC
Q 003510           33 CQELEPGDIIWAKLTGHAMWPAIVVDESLIGDYKGLNKISGGRSIPVQFFGTHD--FARINV   92 (814)
Q Consensus        33 ~~~f~~GdlVwaK~~GyPwWPa~V~~~~~~~~~~~~~~~~~~~~~~V~FFg~~~--~awv~~   92 (814)
                      +..+++||.|..+-.+=..|=|+|.+-..        ...+...+.|+||-..+  .++.++
T Consensus         5 ~~~i~vGD~V~v~~~~~~~~va~Ie~i~e--------d~~g~~~v~v~WF~~p~E~~~~~~~   58 (130)
T cd04721           5 GVTISVHDFVYVLSEEEDRYVAYIEDLYE--------DKKGSKMVKVRWFHTTDEVGAALSP   58 (130)
T ss_pred             CEEEECCCEEEEeCCCCCcEEEEEEEEEE--------cCCCCEEEEEEEecCHHHhccccCC
Confidence            44589999999998877789999965321        11233468899999765  454444


No 142
>cd00029 C1 Protein kinase C conserved region 1 (C1) . Cysteine-rich zinc binding domain. Some members of this domain family bind phorbol esters and diacylglycerol, some are reported to bind RasGTP. May occur in tandem arrangement. Diacylglycerol (DAG) is a second messenger, released by activation of Phospholipase D. Phorbol Esters (PE) can act as analogues of DAG and mimic its downstream effects in, for example, tumor promotion. Protein Kinases C are activated by DAG/PE, this activation is mediated by their N-terminal conserved region (C1). DAG/PE binding may be phospholipid dependent. C1 domains may also mediate DAG/PE signals in chimaerins (a family of Rac GTPase activating proteins), RasGRPs (exchange factors for Ras/Rap1), and Munc13 isoforms (scaffolding proteins involved in exocytosis).
Probab=22.71  E-value=47  Score=24.98  Aligned_cols=32  Identities=31%  Similarity=0.689  Sum_probs=25.2

Q ss_pred             ccceeeCCccc----eeEecCCCCcCcccchhhHhhcC
Q 003510          463 LLCSICGVSYG----ACIQCSNTTCRVAYHPLCARAAG  496 (814)
Q Consensus       463 ~~C~~C~~~~G----a~iqC~~~~C~~~fH~~CA~~~g  496 (814)
                      ..|.+|++...    .-++|.  .|....|..|+....
T Consensus        12 ~~C~~C~~~i~~~~~~~~~C~--~C~~~~H~~C~~~v~   47 (50)
T cd00029          12 TFCDVCRKSIWGLFKQGLRCS--WCKVKCHKKCADKVP   47 (50)
T ss_pred             CChhhcchhhhccccceeEcC--CCCCchhhhhhccCC
Confidence            46999987422    667897  899999999997654


No 143
>COG5175 MOT2 Transcriptional repressor [Transcription]
Probab=22.59  E-value=28  Score=37.49  Aligned_cols=51  Identities=24%  Similarity=0.590  Sum_probs=36.6

Q ss_pred             cccCCCccccccCCcccCCCceEEccccccccccccccc-cccCCCCceeeccccC
Q 003510          346 DWKDLDKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGE-LEPVNGVLWLCNLCRP  400 (814)
Q Consensus       346 ~~~~~~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~-~~~~~~~~W~C~~C~~  400 (814)
                      ..++++.|-.|.+.-+..+--+.-| -|+-.|.|.||.- .....   -.|..|+.
T Consensus        10 sedeed~cplcie~mditdknf~pc-~cgy~ic~fc~~~irq~ln---grcpacrr   61 (480)
T COG5175          10 SEDEEDYCPLCIEPMDITDKNFFPC-PCGYQICQFCYNNIRQNLN---GRCPACRR   61 (480)
T ss_pred             cccccccCcccccccccccCCcccC-CcccHHHHHHHHHHHhhcc---CCChHhhh
Confidence            4566788999998766554445556 5999999999974 33333   47899964


No 144
>KOG2752 consensus Uncharacterized conserved protein, contains N-recognin-type Zn-finger [General function prediction only]
Probab=22.16  E-value=1e+02  Score=33.19  Aligned_cols=113  Identities=16%  Similarity=0.268  Sum_probs=64.1

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCCCCCCCCCceecCCCCCCceecCCCcchhh
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPGAPEPPPPCCLCPVVGGAMKPTTDGRWAHL  430 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~~~~~~~~C~lC~~~~Galk~t~~~~WvH~  430 (814)
                      -.|--|.-...    ...+|-.|.+..|..=-++.... ...|.|+.|.....    .|.+=+...+..+ .+.+.|.|-
T Consensus        56 ~sClTC~P~~~----~agvC~~C~~~CH~~H~lveL~t-KR~FrCDCg~sk~g----~~sc~l~~~~~~~-n~~N~YNhN  125 (345)
T KOG2752|consen   56 FSCLTCTPAPE----MAGVCYACSLSCHDGHELVELYT-KRNFRCDCGNSKFG----RCSCNLLEDKDAE-NSENLYNHN  125 (345)
T ss_pred             eEeecccCChh----hceeEEEeeeeecCCceeeeccc-cCCccccccccccc----ccccccccccccc-cchhhhhhh
Confidence            35666654322    46789999999998765554433 44899999976443    2222223333333 445567775


Q ss_pred             hhhccccceEEccCCCcccccccccchhcccCccceeeCCccceeEecCCCCcCcccc-hhhHhhcCc
Q 003510          431 ACAIWIPETCLTDVKRMEPIDGLNRVSKDRWKLLCSICGVSYGACIQCSNTTCRVAYH-PLCARAAGL  497 (814)
Q Consensus       431 ~Ca~~~pe~~~~~~~~~~~v~~~~~~~~~~~~~~C~~C~~~~Ga~iqC~~~~C~~~fH-~~CA~~~g~  497 (814)
                      .=.++.-    .+...-.|+..                  -.|.++||.  -|..+|| -.|-....+
T Consensus       126 fqG~~C~----Cd~~Ypdp~~~------------------~e~~m~QC~--iCEDWFHce~c~~~~~~  169 (345)
T KOG2752|consen  126 FQGLFCK----CDTPYPDPVRT------------------EEGEMLQCV--ICEDWFHCEGCMQAKTF  169 (345)
T ss_pred             hcceeEE----ecCCCCCcccc------------------ccceeeeEE--eccchhcccccCcccch
Confidence            4443311    11111122221                  158899998  8999999 566554443


No 145
>KOG1844 consensus PHD Zn-finger proteins [General function prediction only]
Probab=21.88  E-value=53  Score=38.50  Aligned_cols=49  Identities=27%  Similarity=0.851  Sum_probs=36.3

Q ss_pred             CccccccCCcccCCCceEEccccccccccccccccccCCCCceeeccccCC
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCRMMVHARCYGELEPVNGVLWLCNLCRPG  401 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~~~vH~~CYg~~~~~~~~~W~C~~C~~~  401 (814)
                      ..|. |...++. +..++.|+-|..--|..|+|+.....-....|..|...
T Consensus        87 ~~c~-c~~~~~~-~g~~i~c~~c~~Wqh~~C~g~~~~~~p~~y~c~~c~~~  135 (508)
T KOG1844|consen   87 SRCD-CGLEDDM-EGLMIQCDWCGRWQHKICCGSFKSTKPDKYVCEICTPR  135 (508)
T ss_pred             cccc-cccccCC-CceeeCCcccCcccCceeeeecCCCCchhceeeeeccc
Confidence            3554 7665442 67899999999999999999765433236889999754


No 146
>PF08274 PhnA_Zn_Ribbon:  PhnA Zinc-Ribbon ;  InterPro: IPR013987 The PhnA protein family includes the uncharacterised Escherichia coli protein PhnA and its homologues. The E. coli phnA gene is part of a large operon associated with alkylphosphonate uptake and carbon-phosphorus bond cleavage []. The protein is not related to the characterised phosphonoacetate hydrolase designated PhnA []. This entry represents the N-terminal domain of PhnA, which is predicted to form a zinc-ribbon.; PDB: 2AKL_A.
Probab=21.56  E-value=42  Score=23.19  Aligned_cols=24  Identities=29%  Similarity=0.848  Sum_probs=12.2

Q ss_pred             CccccccCCcccCCCceEEccccc
Q 003510          351 DKCSVCHMDEEYQNNLFLQCDKCR  374 (814)
Q Consensus       351 ~~C~VC~~~~~~~~n~iv~C~~C~  374 (814)
                      ..|-.|.......++.++.|..|+
T Consensus         3 p~Cp~C~se~~y~D~~~~vCp~C~   26 (30)
T PF08274_consen    3 PKCPLCGSEYTYEDGELLVCPECG   26 (30)
T ss_dssp             ---TTT-----EE-SSSEEETTTT
T ss_pred             CCCCCCCCcceeccCCEEeCCccc
Confidence            368888887777777888888886


No 147
>KOG3268 consensus Predicted E3 ubiquitin ligase [Posttranslational modification, protein turnover, chaperones]
Probab=21.36  E-value=25  Score=34.35  Aligned_cols=36  Identities=22%  Similarity=0.461  Sum_probs=25.7

Q ss_pred             cCCCccccccCCcccCCCceEEccc--ccccccccccc
Q 003510          348 KDLDKCSVCHMDEEYQNNLFLQCDK--CRMMVHARCYG  383 (814)
Q Consensus       348 ~~~~~C~VC~~~~~~~~n~iv~C~~--C~~~vH~~CYg  383 (814)
                      +....|.||.--.-++.-+-..|++  |+..+||-|.-
T Consensus       163 d~~~~cgicyayqldGTipDqtCdN~qCgkpFHqiCL~  200 (234)
T KOG3268|consen  163 DELGACGICYAYQLDGTIPDQTCDNIQCGKPFHQICLT  200 (234)
T ss_pred             hhhhcccceeeeecCCccccccccccccCCcHHHHHHH
Confidence            3445788887655444445567995  99999999973


Done!