Citrus Sinensis ID: 010632

Local Sequence Feature Prediction

Prediction and (Method)	Result

Residue Number Marker

Protein Sequence

Secondary Structure (PSIPRED)

Secondary Structure Prediction (SSPRO)

Coil and Loop (DISEMBL)

Flexible Loop (DISEMBL)

Low Complexity Region (SEG)

Disordered region (IsUnstruct)

Disordered Region (DISOPRED)

Disordered Region (DISEMBL)

Disordered Region (DISPRO)

Transmembrane Helix (TMHMM)

Transmembrane Helix (HMMTOP)

Transmembrane Helix (MEMSAT)

TM Helix, Signal Peptide (MEMSAT_SVM)

TM Helix, Signal Peptide (Phobius)

Signal Peptide (SignalP HMM Mode)

Signal Peptide (SignalP NN Mode)

Coiled Coils (COILS)

Positional Conservation

--------10--------20--------30--------40--------50--------60--------70--------80--------90-------100-------110-------120-------130-------140-------150-------160-------170-------180-------190-------200-------210-------220-------230-------240-------250-------260-------270-------280-------290-------300-------310-------320-------330-------340-------350-------360-------370-------380-------390-------400-------410-------420-------430-------440-------450-------460-------470-------480-------490-------500-----

MVLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYINAPFVGAVAFFSSKTTTN

cHHHHHHHHcHHHHHHHHHHHHHHHHHHHHHHccccccccHHHHHHHHHHHHHHccccccccccccccccccccccccccccccccccccccccccccccHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHcccccccEEEEEEccccccccccccccccccccccccccccccccHHHHHHHHHHHHHHHHcccccHHHHHHHHHHHHHHHHHHHHcccccccccccccccccccccccHHHHHHHHHHHHHHccccHHHHHHHHccHHccccccccccccccHHHHHHHHHHHccccccHHHHHHHHHHHHHHHHHHccccccccccccccccccccccccHHHHHHHHHHHHHHHHHHHccccccccccccccHHHHHHHHHHcccEEcccccccccEEEEcccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccHHHHcccHHHHHHHHHHccccccc

cccHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHccccccHHHHHHHHHHHHHHcEcEcccccccccccccEcccccHHHcccccccEcccccccEEHHHHHHHHHHHHHHHHHcHHHHHHHHHHHHHHHHHHHHHHHHHcccccccEEEEEccHHHHHcccccHHHccccccEEEEEccEccHHHHHHHHHHHHHHHHHcccccHHHHHHHHHHHHHHHHHHHHccccHHHccccccccHHccccccHHHHHHHHHHHHHHHccHHHHHHHHHHHHHcccccccccccccccHHHHHHHHHHHHHHccccHHHHHHHHHHHHHHHHccccccccEEEccccEEEEcccccHHHHHHHHHHHHHHHHHHHHccccEEcccccccHHHHHHHHHHHHHHHHcccccccccEcccccccccccEcHHHHccccccccccEccccccHHccccccccccccccEccccccccccccccccccccEccHHHHHHHHHHHHHHHcccccc

MVLSIlrkmdpvtkFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILffegqrsgrlppnqqltwrgnsglsdgssyhvdlvggyydagdnvkfglpmAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLlkastatpgalyvqvgdpnmdhhcwerpedmdtprnvykvstqnpgsdVAAETAAALAAASVvfkdsdpsysTKLLKTAMKVFDFadkyrgsysdslnsvvcpfycsysgyldELLWGASWLHRASQNSSYLAYIQSnghilgaddddysfswddkraGTKVLLSKGFLEKNTQEFQLYKahsdnyicslipgsssfqaqytagglfykasesnlqYVTTTAFLLLTYAKYlssnggvatcgssTVKAENLIALAKKQVDyilgdnpakmsymvgfgerypqhvhhrgsslpsihahpdhiacndgfqylysrspnpnvltgailggpdnrdnfaddrnnyqqsepatyinapfVGAVAFFSSKTTTN

mvlsilrkmdpvtKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAETAAALAAASvvfkdsdpsYSTKLLKTAMKVFDFADKYrgsysdslnsVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSepatyinapfVGAVAFFSSKTTTN

MVLSILRKMDPVTKFSLTLQIlgltlcalsllcsaFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVaaetaaalaaaSVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGAddddysfswddKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPdnrdnfaddrnnYQQSEPATYINAPFVGAVAFFSSKTTTN

****ILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQ***********TWRG***LSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWE****************************AALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILG********************ATYINAPFVGAVAFF*******

*************KFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYINAPFVGAVAF*SSK****

MVLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQ**********SIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYINAPFVGAVAFFSSKTTTN

*VLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYINAPFVGAVAFFSSK****

ooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo

iiiiiiiiiiiiiiiiHHHHHHHHHHHHHHHHHHHHHHooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo

iiiiiiiiiiiiiiHHHHHHHHHHHHHHHHHHHHHHHHHooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooHHHHHHHHHHHHHHHHHHHHHHHHHiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii

SSSSSSSSSSSSSSSSSSSSSSSSSSSSSiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiHHHHHHHHHHHHHHHHoooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooHHHHHHHHHHHHHHHHiiiiiiii

SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSoooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo

SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo

xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

no confident homologs detected

Close Homologs for Annotation Transfer

Close Homologs in SWISS-PROT Database Detected by BLAST

Original result of BLAST against SWISS-PROT Database

ID	Alignment graph	Length	Definition	RBH(Q2H)	RBH(H2Q)	Q cover	H cover	Identity	E-value
Query		505	2.2.26 [Sep-21-2011]
P05522		494	Endoglucanase 1 OS=Persea	N/A	no	0.966	0.987	0.781	0.0
Q6YXT7		523	Endoglucanase 19 OS=Oryza	yes	no	0.926	0.894	0.68	0.0
Q6Z715		503	Endoglucanase 4 OS=Oryza	no	no	0.944	0.948	0.644	0.0
Q9SRX3		501	Endoglucanase 1 OS=Arabid	yes	no	0.906	0.914	0.655	1e-178
O81416		516	Endoglucanase 17 OS=Arabi	no	no	0.910	0.891	0.637	1e-176
Q8LQ92		499	Endoglucanase 3 OS=Oryza	no	no	0.910	0.921	0.613	1e-174
O49296		489	Endoglucanase 4 OS=Arabid	no	no	0.938	0.969	0.587	1e-162
Q9CAC1		492	Endoglucanase 8 OS=Arabid	no	no	0.918	0.943	0.584	1e-161
Q652F9		497	Endoglucanase 17 OS=Oryza	no	no	0.942	0.957	0.590	1e-161
Q9C9H5		484	Endoglucanase 9 OS=Arabid	no	no	0.912	0.952	0.606	1e-161

>sp\|P05522\|GUN1_PERAE Endoglucanase 1 OS=Persea americana GN=CEL1 PE=2 SV=1	Back alignment and function desciption

 Score =  794 bits (2051), Expect = 0.0,   Method: Compositional matrix adjust.
 Identities = 386/494 (78%), Positives = 431/494 (87%), Gaps = 6/494 (1%)

Query: 11  PVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRG 70
           P++ F L L      +C + + C + +   YSDAL KSILFFEGQRSG+LP NQ+LTWRG
Sbjct: 6   PLSLFHLLL------VCTVMVKCCSASDLHYSDALEKSILFFEGQRSGKLPTNQRLTWRG 59

Query: 71  NSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAI 130
           +SGLSDGSSYHVDLVGGYYDAGDN+KFGLPMAFTTT+L+W +IEFG  M   +ENA+AA+
Sbjct: 60  DSGLSDGSSYHVDLVGGYYDAGDNLKFGLPMAFTTTMLAWGIIEFGCLMPEQVENARAAL 119

Query: 131 RWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQNPGSDVAAET 190
           RW TDYLLKASTAT  +LYVQVG+PN DH CWERPEDMDTPRNVYKVSTQNPGSDVAAET
Sbjct: 120 RWSTDYLLKASTATSNSLYVQVGEPNADHRCWERPEDMDTPRNVYKVSTQNPGSDVAAET 179

Query: 191 AAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSGYLD 250
           AAALAAAS+VF DSD SYSTKLL TA+KVF+FAD+YRGSYSDSL SVVCPFYCSYSGY D
Sbjct: 180 AAALAAASIVFGDSDSSYSTKLLHTAVKVFEFADQYRGSYSDSLGSVVCPFYCSYSGYND 239

Query: 251 ELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNT 310
           ELLWGASWLHRASQN+SY+ YIQSNGH LGADDDDYSFSWDDKR GTKVLLSKGFL+   
Sbjct: 240 ELLWGASWLHRASQNASYMTYIQSNGHTLGADDDDYSFSWDDKRVGTKVLLSKGFLQDRI 299

Query: 311 QEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLS 370
           +E QLYK H+DNYICSLIPG+SSFQAQYT GGL YK S SNLQYVT+TAFLLLTYA YL+
Sbjct: 300 EELQLYKVHTDNYICSLIPGTSSFQAQYTPGGLLYKGSASNLQYVTSTAFLLLTYANYLN 359

Query: 371 SNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQHVHHRGSSLPS 430
           S+GG A+CG++TV A+NLI+LAKKQVDYILG NPAKMSYMVGFGERYPQHVHHRGSSLPS
Sbjct: 360 SSGGHASCGTTTVTAKNLISLAKKQVDYILGQNPAKMSYMVGFGERYPQHVHHRGSSLPS 419

Query: 431 IHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYINAP 490
           +  HP+ I CN GFQYLYS  PNPN+L GAILGGPDNRD+F+DDRNNYQQSEPATYINAP
Sbjct: 420 VQVHPNSIPCNAGFQYLYSSPPNPNILVGAILGGPDNRDSFSDDRNNYQQSEPATYINAP 479

Query: 491 FVGAVAFFSSKTTT 504
            VGA+AFF++   T
Sbjct: 480 LVGALAFFAANPVT 493

Involved in ripening fruit process.
Persea americana (taxid: 3435)
EC: 3EC: .EC: 2EC: .EC: 1EC: .EC: 4

>sp\|Q6YXT7\|GUN19_ORYSJ Endoglucanase 19 OS=Oryza sativa subsp. japonica GN=Os08g0114200 PE=2 SV=1	Back alignment and function description

>sp\|Q6Z715\|GUN4_ORYSJ Endoglucanase 4 OS=Oryza sativa subsp. japonica GN=GLU14 PE=2 SV=1	Back alignment and function description

>sp\|Q9SRX3\|GUN1_ARATH Endoglucanase 1 OS=Arabidopsis thaliana GN=CEL2 PE=2 SV=1	Back alignment and function description

>sp\|O81416\|GUN17_ARATH Endoglucanase 17 OS=Arabidopsis thaliana GN=At4g02290 PE=2 SV=1	Back alignment and function description

>sp\|Q8LQ92\|GUN3_ORYSJ Endoglucanase 3 OS=Oryza sativa subsp. japonica GN=GLU8 PE=2 SV=1	Back alignment and function description

>sp\|O49296\|GUN4_ARATH Endoglucanase 4 OS=Arabidopsis thaliana GN=At1g23210 PE=2 SV=1	Back alignment and function description

>sp\|Q9CAC1\|GUN8_ARATH Endoglucanase 8 OS=Arabidopsis thaliana GN=CEL1 PE=2 SV=1	Back alignment and function description

>sp\|Q652F9\|GUN17_ORYSJ Endoglucanase 17 OS=Oryza sativa subsp. japonica GN=GLU13 PE=2 SV=1	Back alignment and function description

>sp\|Q9C9H5\|GUN9_ARATH Endoglucanase 9 OS=Arabidopsis thaliana GN=CEL3 PE=1 SV=1	Back alignment and function description

Close Homologs in the Non-Redundant Database Detected by BLAST

Original result of BLAST against Nonredundant Database

GI	Alignment Graph	Length	Definition	Q cover	H cover	Identity	E-value
Query		505
2290681		505	acidic cellulase [Citrus sinensis]	1.0	1.0	0.998	0.0
224057986		494	predicted protein [Populus trichocarpa]	0.976	0.997	0.847	0.0
255555765		494	endo-1,4-beta-glucanase, putative [Ricin	0.978	1.0	0.838	0.0
429326590		494	korrigan [Populus tomentosa]	0.976	0.997	0.839	0.0
13383303		494	endo-1,4-beta glucanase [Populus alba]	0.976	0.997	0.837	0.0
347466579		494	endo-1,4-beta-glucanase [Populus trichoc	0.976	0.997	0.833	0.0
429326592		494	korrigan [Populus tomentosa]	0.976	0.997	0.831	0.0
4691450		494	endo-1,4-beta glucanase [Populus alba] g	0.976	0.997	0.829	0.0
1125032		494	cellulase precursor [Populus alba]	0.976	0.997	0.833	0.0
359474153		466	PREDICTED: endoglucanase 1 isoform 1, pa	0.912	0.989	0.874	0.0

>gi\|2290681\|gb\|AAB65155.1\| acidic cellulase [Citrus sinensis]	Back alignment and taxonomy information

 Score = 1047 bits (2708), Expect = 0.0,   Method: Compositional matrix adjust.
 Identities = 504/505 (99%), Positives = 505/505 (100%)

Query: 1   MVLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRL 60
           MVLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRL
Sbjct: 1   MVLSILRKMDPVTKFSLTLQILGLTLCALSLLCSAFTFQDYSDALGKSILFFEGQRSGRL 60

Query: 61  PPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQ 120
           PPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQ
Sbjct: 61  PPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQ 120

Query: 121 NHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQ 180
           NHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQ
Sbjct: 121 NHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVSTQ 180

Query: 181 NPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCP 240
           NPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCP
Sbjct: 181 NPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCP 240

Query: 241 FYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVL 300
           +YCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVL
Sbjct: 241 YYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVL 300

Query: 301 LSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAF 360
           LSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAF
Sbjct: 301 LSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTTAF 360

Query: 361 LLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQH 420
           LLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQH
Sbjct: 361 LLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYPQH 420

Query: 421 VHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQ 480
           VHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQ
Sbjct: 421 VHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQ 480

Query: 481 SEPATYINAPFVGAVAFFSSKTTTN 505
           SEPATYINAPFVGAVAFFSSKTTTN
Sbjct: 481 SEPATYINAPFVGAVAFFSSKTTTN 505

Source: Citrus sinensis

Species: Citrus sinensis

Genus: Citrus

Family: Rutaceae

Order: Sapindales

Class:

Phylum: Streptophyta

Superkingdom: Eukaryota

>gi\|224057986\|ref\|XP_002299423.1\| predicted protein [Populus trichocarpa] gi\|222846681\|gb\|EEE84228.1\| predicted protein [Populus trichocarpa] gi\|347466577\|gb\|AEO97201.1\| endo-1,4-beta-glucanase [Populus trichocarpa] gi\|347466631\|gb\|AEO97228.1\| endo-1,4-beta-glucanase [Populus trichocarpa]	Back alignment and taxonomy information

>gi\|255555765\|ref\|XP_002518918.1\| endo-1,4-beta-glucanase, putative [Ricinus communis] gi\|223541905\|gb\|EEF43451.1\| endo-1,4-beta-glucanase, putative [Ricinus communis]	Back alignment and taxonomy information

>gi\|429326590\|gb\|AFZ78635.1\| korrigan [Populus tomentosa]	Back alignment and taxonomy information

>gi\|13383303\|dbj\|BAB39482.1\| endo-1,4-beta glucanase [Populus alba]	Back alignment and taxonomy information

>gi\|347466579\|gb\|AEO97202.1\| endo-1,4-beta-glucanase [Populus trichocarpa] gi\|347466633\|gb\|AEO97229.1\| endo-1,4-beta-glucanase [Populus trichocarpa]	Back alignment and taxonomy information

>gi\|429326592\|gb\|AFZ78636.1\| korrigan [Populus tomentosa]	Back alignment and taxonomy information

>gi\|4691450\|dbj\|BAA77239.1\| endo-1,4-beta glucanase [Populus alba] gi\|13383305\|dbj\|BAB39483.1\| endo-1,4-beta-glucanase [Populus alba]	Back alignment and taxonomy information

>gi\|1125032\|dbj\|BAA06877.1\| cellulase precursor [Populus alba]	Back alignment and taxonomy information

>gi\|359474153\|ref\|XP_002279780.2\| PREDICTED: endoglucanase 1 isoform 1, partial [Vitis vinifera]	Back alignment and taxonomy information

Prediction of Gene Ontology (GO) Terms

Close Homologs with Gene Ontology terms Detected by BLAST

Original result of BLAST against Gene Ontology (AMIGO)

ID	Alignment graph	Length	Definition	Q cover	H cover	Identity	E-value
Query		505
TAIR\|locus:2024670		501	CEL2 "cellulase 2" [Arabidopsi	0.904	0.912	0.613	8e-156
TAIR\|locus:2137824		516	GH9B13 "glycosyl hydrolase 9B1	0.908	0.889	0.595	4.5e-153
TAIR\|locus:2017704		484	CEL5 "cellulase 5" [Arabidopsi	0.904	0.944	0.568	3.7e-142
TAIR\|locus:2825314		484	CEL3 "cellulase 3" [Arabidopsi	0.912	0.952	0.565	7.8e-142
TAIR\|locus:2033600		492	GH9B1 "glycosyl hydrolase 9B1"	0.916	0.941	0.547	3e-140
TAIR\|locus:2028015		489	GH9B6 "glycosyl hydrolase 9B6"	0.910	0.940	0.557	7.2e-139
TAIR\|locus:2120242		497	GH9B18 "glycosyl hydrolase 9B1	0.912	0.927	0.543	6.5e-138
TAIR\|locus:2118519		478	GH9B14 "glycosyl hydrolase 9B1	0.897	0.947	0.508	7.2e-123
TAIR\|locus:2120232		493	GH9B17 "glycosyl hydrolase 9B1	0.912	0.935	0.476	2.4e-122
TAIR\|locus:2128394		479	GH9B15 "glycosyl hydrolase 9B1	0.897	0.945	0.497	2.3e-119

TAIR\|locus:2024670 CEL2 "cellulase 2" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

 Score = 1519 (539.8 bits), Expect = 8.0e-156, P = 8.0e-156
 Identities = 282/460 (61%), Positives = 342/460 (74%)

Query:    40 DYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGL 99
             +Y DAL KSILFFEGQRSG+LPPNQ++TWR NSGLSDGS+ +VDLVGGYYDAGDN+KFG 
Sbjct:    43 NYKDALSKSILFFEGQRSGKLPPNQRMTWRSNSGLSDGSALNVDLVGGYYDAGDNMKFGF 102

Query:   100 PMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDH 159
             PMAFTTT+LSWS+IEFG  M++ L NAK AIRW TD+LLKA T+ P  +YVQVGDPNMDH
Sbjct:   103 PMAFTTTMLSWSLIEFGGLMKSELPNAKDAIRWATDFLLKA-TSHPDTIYVQVGDPNMDH 161

Query:   160 HCWERPEDMDTPRNVYKVSTQNPGSDVXXXXXXXXXXXSVVFKDSDPSYSTKLLKTAMKV 219
              CWERPEDMDTPR+V+KV   NPGSD+           S+VF+  DPSYS  LL+ A+ V
Sbjct:   162 ACWERPEDMDTPRSVFKVDKNNPGSDIAGEIAAALAAASIVFRKCDPSYSNHLLQRAITV 221

Query:   220 FDFADKYRGSYSDSLNSVVCPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHIL 279
             F FADKYRG YS  L   VCPFYCSYSGY DELLWGA+WL +A+ N +YL YI++NG IL
Sbjct:   222 FTFADKYRGPYSAGLAPEVCPFYCSYSGYQDELLWGAAWLQKATNNPTYLNYIKANGQIL 281

Query:   280 GAXXXXXXXXXXXKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYT 339
             GA           K  G ++LLSK FL +  +  + YK H+D++ICS++PG+SS  +QYT
Sbjct:   282 GADEFDNMFSWDNKHVGARILLSKEFLIQKVKSLEEYKEHADSFICSVLPGASS--SQYT 339

Query:   340 AGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYI 399
              GGL +K  ESN+QYVT+T+FLLLTYAKYL+S   VA CG S V    L ++AKKQVDY+
Sbjct:   340 PGGLLFKMGESNMQYVTSTSFLLLTYAKYLTSARTVAYCGGSVVTPARLRSIAKKQVDYL 399

Query:   400 LGDNPAKMSYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTG 459
             LG NP KMSYMVG+G +YP+ +HHRGSSLPS+  HP  I C+DGF    S+SPNPN L G
Sbjct:   400 LGGNPLKMSYMVGYGLKYPRRIHHRGSSLPSVAVHPTRIQCHDGFSLFTSQSPNPNDLVG 459

Query:   460 AILGGPXXXXXXXXXXXXYQQSEPATYINAPFVGAVAFFS 499
             A++GGP            Y +SEPATYINAP VGA+A+ +
Sbjct:   460 AVVGGPDQNDQFPDERSDYGRSEPATYINAPLVGALAYLA 499

GO:0003824 "catalytic activity" evidence=IEA

GO:0004553 "hydrolase activity, hydrolyzing O-glycosyl compounds" evidence=IEA;ISS

GO:0005576 "extracellular region" evidence=ISM

GO:0005975 "carbohydrate metabolic process" evidence=IEA

GO:0007389 "pattern specification process" evidence=TAS

GO:0008810 "cellulase activity" evidence=TAS

GO:0009624 "response to nematode" evidence=IEP

GO:0009855 "determination of bilateral symmetry" evidence=RCA

GO:0009944 "polarity specification of adaxial/abaxial axis" evidence=RCA

GO:0010014 "meristem initiation" evidence=RCA

GO:0010051 "xylem and phloem pattern formation" evidence=RCA

GO:0010093 "specification of floral organ identity" evidence=RCA

GO:0048440 "carpel development" evidence=RCA

GO:0048507 "meristem development" evidence=RCA

TAIR\|locus:2137824 GH9B13 "glycosyl hydrolase 9B13" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2017704 CEL5 "cellulase 5" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2825314 CEL3 "cellulase 3" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2033600 GH9B1 "glycosyl hydrolase 9B1" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2028015 GH9B6 "glycosyl hydrolase 9B6" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2120242 GH9B18 "glycosyl hydrolase 9B18" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2118519 GH9B14 "glycosyl hydrolase 9B14" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2120232 GH9B17 "glycosyl hydrolase 9B17" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

TAIR\|locus:2128394 GH9B15 "glycosyl hydrolase 9B15" [Arabidopsis thaliana (taxid:3702)]	Back alignment and assigned GO terms

Prediction of Enzyme Commission (EC) Number

EC Number Prediction by Annotation Transfer from SWISS-PROT Entries

Original result of BLAST against SWISS-PROT

ID	Name	Annotated EC number	Identity	Query coverage	Hit coverage	RBH(Q2H)	RBH(H2Q)
P22503	GUN_PHAVU	3, ., 2, ., 1, ., 4	0.5320	0.8950	0.9112	N/A	no
Q9SRX3	GUN1_ARATH	3, ., 2, ., 1, ., 4	0.6550	0.9069	0.9141	yes	no
P05522	GUN1_PERAE	3, ., 2, ., 1, ., 4	0.7813	0.9663	0.9878	N/A	no
Q6YXT7	GUN19_ORYSJ	3, ., 2, ., 1, ., 4	0.68	0.9267	0.8948	yes	no

EC Number Prediction by Ezypred Server

Original result from Ezypred Server

Fail to connect to Ezypred Server

EC Number Prediction by EFICAz Software

Prediction Level	EC number	Confidence of Prediction
3rd Layer	3.2.1.4	0.979
3rd Layer	3.2.1	0.983

Prediction of Functionally Associated Proteins

Functionally Associated Proteins Detected by STRING

Original result from the STRING server

Fail to connect to STRING server

Conserved Domains and Related Protein Families

Conserved Domains Detected by RPS-BLAST

Original result of RPS-BLAST against CDD database part I

ID	Alignment Graph	Length	Definition	E-value
Query		505
PLN02266		510	PLN02266, PLN02266, endoglucanase	0.0
PLN02308		492	PLN02308, PLN02308, endoglucanase	0.0
pfam00759		437	pfam00759, Glyco_hydro_9, Glycosyl hydrolase famil	0.0
PLN03009		495	PLN03009, PLN03009, cellulase	0.0
PLN02175		484	PLN02175, PLN02175, endoglucanase	0.0
PLN02613		498	PLN02613, PLN02613, endoglucanase	0.0
PLN02171		629	PLN02171, PLN02171, endoglucanase	0.0
PLN00119		489	PLN00119, PLN00119, endoglucanase	0.0
PLN02340		614	PLN02340, PLN02340, endoglucanase	1e-179
PLN02420		525	PLN02420, PLN02420, endoglucanase	1e-175
PLN02909		486	PLN02909, PLN02909, Endoglucanase	1e-174
PLN02345		469	PLN02345, PLN02345, endoglucanase	1e-171

>gnl\|CDD\|215150 PLN02266, PLN02266, endoglucanase	Back alignment and domain information

 Score =  739 bits (1908), Expect = 0.0
 Identities = 316/501 (63%), Positives = 383/501 (76%), Gaps = 17/501 (3%)

Query: 15  FSLTLQILGLTLCALSLLCSAFTF----------------QDYSDALGKSILFFEGQRSG 58
            S TL  L + L    LLC+ F+                  +Y DAL KSILFFEGQRSG
Sbjct: 5   LSSTLLRLFIFLAFSLLLCNGFSSSSNNPFHHRHHPRLASHNYRDALTKSILFFEGQRSG 64

Query: 59  RLPPNQQLTWRGNSGLSDGSSYHVDLVGGYYDAGDNVKFGLPMAFTTTLLSWSVIEFGSS 118
           +LP +Q++TWR +SGLSDGS+ HVDLVGGYYDAGDNVKFG PMAFTTT+LSWSVIEFG  
Sbjct: 65  KLPSSQRMTWRRDSGLSDGSAMHVDLVGGYYDAGDNVKFGFPMAFTTTMLSWSVIEFGGL 124

Query: 119 MQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPEDMDTPRNVYKVS 178
           M++ L+NAK AIRW TDYLLKA TA P  +YVQVGD N DH CWERPEDMDTPR+V+KV 
Sbjct: 125 MKSELQNAKDAIRWATDYLLKA-TAHPDTIYVQVGDANKDHACWERPEDMDTPRSVFKVD 183

Query: 179 TQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVV 238
              PGSDVAAETAAALAAAS+VF+ SDP+YS  L++ A++VF FADKYRG+YS+ L   V
Sbjct: 184 KNTPGSDVAAETAAALAAASLVFRKSDPTYSKLLVRRAIRVFQFADKYRGAYSNGLKPDV 243

Query: 239 CPFYCSYSGYLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTK 298
           CPFYCSYSGY DELLWGA+WLH+A++N +YL YIQ NG ILGAD+ D +F WD+K  G +
Sbjct: 244 CPFYCSYSGYQDELLWGAAWLHKATKNPTYLNYIQVNGQILGADEFDNTFGWDNKHVGAR 303

Query: 299 VLLSKGFLEKNTQEFQLYKAHSDNYICSLIPGSSSFQAQYTAGGLFYKASESNLQYVTTT 358
           +LLSK FL +  Q    YK H+DN+ICS+IPG+     QYT GGL +K S+SN+QYVT+T
Sbjct: 304 ILLSKAFLVQKVQSLHEYKGHADNFICSVIPGAPFSSTQYTPGGLLFKMSDSNMQYVTST 363

Query: 359 AFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKMSYMVGFGERYP 418
           +FLLLTYAKYL+S   V  CG + V    L ++AKKQVDY+LGDNP KMSYMVG+G RYP
Sbjct: 364 SFLLLTYAKYLTSAKTVVNCGGTVVTPARLRSIAKKQVDYLLGDNPLKMSYMVGYGPRYP 423

Query: 419 QHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNY 478
           + +HHRGSSLPS+ AHP  I C+ GF  + S+SPNPNVL GA++GGPD  D F D+R++Y
Sbjct: 424 RRIHHRGSSLPSVAAHPAKIQCSQGFSIMNSQSPNPNVLVGAVVGGPDQHDRFPDERSDY 483

Query: 479 QQSEPATYINAPFVGAVAFFS 499
           +QSEPATYINAP VGA+A+ +
Sbjct: 484 EQSEPATYINAPLVGALAYLA 504

Length = 510

>gnl\|CDD\|177943 PLN02308, PLN02308, endoglucanase	Back alignment and domain information

>gnl\|CDD\|216104 pfam00759, Glyco_hydro_9, Glycosyl hydrolase family 9	Back alignment and domain information

>gnl\|CDD\|166650 PLN03009, PLN03009, cellulase	Back alignment and domain information

>gnl\|CDD\|177832 PLN02175, PLN02175, endoglucanase	Back alignment and domain information

>gnl\|CDD\|215331 PLN02613, PLN02613, endoglucanase	Back alignment and domain information

>gnl\|CDD\|215115 PLN02171, PLN02171, endoglucanase	Back alignment and domain information

>gnl\|CDD\|177732 PLN00119, PLN00119, endoglucanase	Back alignment and domain information

>gnl\|CDD\|215194 PLN02340, PLN02340, endoglucanase	Back alignment and domain information

>gnl\|CDD\|178040 PLN02420, PLN02420, endoglucanase	Back alignment and domain information

>gnl\|CDD\|178497 PLN02909, PLN02909, Endoglucanase	Back alignment and domain information

>gnl\|CDD\|177979 PLN02345, PLN02345, endoglucanase	Back alignment and domain information

Conserved Domains Detected by HHsearch

Original result of HHsearch against CDD database

ID	Alignment Graph	Length	Definition	Probability
Query		505
PLN02266		510	endoglucanase	100.0
PLN02308		492	endoglucanase	100.0
PLN02175		484	endoglucanase	100.0
PLN02340		614	endoglucanase	100.0
PLN00119		489	endoglucanase	100.0
PLN02420		525	endoglucanase	100.0
PLN02909		486	Endoglucanase	100.0
PLN02613		498	endoglucanase	100.0
PLN03009		495	cellulase	100.0
PLN02171		629	endoglucanase	100.0
PLN02345		469	endoglucanase	100.0
PF00759		444	Glyco_hydro_9: Glycosyl hydrolase family 9; InterP	100.0
cd00249		384	AGE AGE domain; N-acyl-D-glucosamine 2-epimerase d	97.16
cd00249		384	AGE AGE domain; N-acyl-D-glucosamine 2-epimerase d	95.83
KOG2787		403	consensus Lanthionine synthetase C-like protein 1	94.83
COG1331		667	Highly conserved protein containing a thioredoxin	94.81
PF03663		370	Glyco_hydro_76: Glycosyl hydrolase family 76 ; Int	94.5
PF07221		346	GlcNAc_2-epim: N-acylglucosamine 2-epimerase (GlcN	91.17
PF07944		520	DUF1680: Putative glycosyl hydrolase of unknown fu	91.04
COG3533		589	Uncharacterized protein conserved in bacteria [Fun	85.21

>PLN02266 endoglucanase	Back alignment and domain information

Probab=100.00  E-value=1e-126  Score=1010.31  Aligned_cols=485  Identities=64%  Similarity=1.132  Sum_probs=445.7

Q ss_pred             HHHHHHHHHhh-hhh-c--------ccCCChhhHHHHHHHHHHhhHHhcCCCCCCCCCCCCCCCCCCCCCCCcccccccc
Q 010632           18 TLQILGLTLCA-LSL-L--------CSAFTFQDYSDALGKSILFFEGQRSGRLPPNQQLTWRGNSGLSDGSSYHVDLVGG   87 (505)
Q Consensus        18 ~~~~~~~~~~~-~~~-~--------~~~~~~~~Y~~~l~~sl~ff~~QR~G~l~~~~~~~w~~~s~l~Dg~~~~~dlsGG   87 (505)
                      +|+..-+++|+ .++ +        ...+++++|.++|++||+||++||||++|++++++||+++|+.||.+.++||+||
T Consensus        14 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Y~~aL~~sl~fy~~QRsG~lp~~~~~~Wr~ds~~~Dg~~~~~DlsGG   93 (510)
T PLN02266         14 IFLAFSLLLCNGFSSSSNNPFHHRHHPRLASHNYRDALTKSILFFEGQRSGKLPSSQRMTWRRDSGLSDGSAMHVDLVGG   93 (510)
T ss_pred             HHHHHHHHhcCCCccccCCcccccCCCCCCcchHHHHHHHHHHHHHHhcCcCCCcccCCCCcccCCCCCCCcCcccCCCc
Confidence            34445567787 222 2        3567889999999999999999999999999999999999999999999999999


Q ss_pred             eeccCCCcccccchHHHHHHHHHHHHHhhhcchhhHHHHHHHHHHHHHHHHHcccCCCCceEEEcCCCCCCCCCCCCCCC
Q 010632           88 YYDAGDNVKFGLPMAFTTTLLSWSVIEFGSSMQNHLENAKAAIRWGTDYLLKASTATPGALYVQVGDPNMDHHCWERPED  167 (505)
Q Consensus        88 W~DAGD~~Ky~~~~a~s~~~L~~a~~ef~~~~~~~~pdiLde~kwg~D~llkmq~~~~g~~y~~vg~~~~dh~~W~~Pe~  167 (505)
                      |||||||+||++|+|+++++|+|+++||++.|.+++||||||||||+|||||| |+.+|+||+|||++..||.+|++||+
T Consensus        94 wyDAGD~~Kf~~p~a~s~t~L~w~~~ef~~~~~~~~pd~Ldelkw~~D~llk~-~~~~~~vy~qVg~~~~Dh~~W~~Pe~  172 (510)
T PLN02266         94 YYDAGDNVKFGFPMAFTTTMLSWSVIEFGGLMKSELQNAKDAIRWATDYLLKA-TAHPDTIYVQVGDANKDHACWERPED  172 (510)
T ss_pred             ceeCCCCceecchHHHHHHHHHHHHHhhhhccccccHHHHHHHHHHHHHHHHh-ccCCCeEEEEeCCCCCCcccCCChhh
Confidence            99999999999999999999999999999999999999999999999999999 88999999999999999999999999


Q ss_pred             CCCCcceeecCCCCCchHHHHHHHHHHHHHhhhcccCChHHHHHHHHHHHHHHHHHHHccCCCCCCCCCcccccccCCCC
Q 010632          168 MDTPRNVYKVSTQNPGSDVAAETAAALAAASVVFKDSDPSYSTKLLKTAMKVFDFADKYRGSYSDSLNSVVCPFYCSYSG  247 (505)
Q Consensus       168 ~~~~R~~~~~~~~~p~s~~a~~~aAalA~as~vf~~~D~~~A~~~L~~A~~ay~~a~~~~~~y~~~~~~~~~g~Y~s~~~  247 (505)
                      ++.+|++|.|+.++|||++++++|||||+||||||++||+||++||++||++|+||+++|+.|.+.+....+++|.+.++
T Consensus       173 ~~~~R~~y~i~~~~pgsd~a~e~AAALAaas~vfk~~D~~yA~~~L~~Ak~ly~fa~~~~g~y~~~~~~~~~~~y~s~s~  252 (510)
T PLN02266        173 MDTPRSVFKVDKNTPGSDVAAETAAALAAASLVFRKSDPTYSKLLVRRAIRVFQFADKYRGAYSNGLKPDVCPFYCSYSG  252 (510)
T ss_pred             cCCCCeeEEeCCCCCchHHHHHHHHHHHHHHHHhccCCHHHHHHHHHHHHHHHHHHHhCCCCccCCCCcccCCCcccCCc
Confidence            99999999999999999999999999999999999999999999999999999999999999877543334678887578


Q ss_pred             chhHHHHHHHHHHHHcCChhHHHHHHHcccccCCCCCCCccCccchhhHHHHhhcccccccchHHHHHHHHHHHHHHHHh
Q 010632          248 YLDELLWGASWLHRASQNSSYLAYIQSNGHILGADDDDYSFSWDDKRAGTKVLLSKGFLEKNTQEFQLYKAHSDNYICSL  327 (505)
Q Consensus       248 ~~De~~wAA~eLy~aTgd~~Yl~~~~~~~~~~~~~~~~~~~~Wd~~~~~~~~lla~~~~~~~~~~~~~~~~~ad~~~~~~  327 (505)
                      +.||++|||+|||++|||++|+++++.....++.....+.++||++..|+++||++.+..+..+.++.|++.++.++|.+
T Consensus       253 ~~DEl~WAAawLy~ATGd~~Yl~~~~~~~~~~g~~~~~~~~~WD~k~~ga~vLLa~~~~~~~~~~~~~yk~~~d~~~~~~  332 (510)
T PLN02266        253 YQDELLWGAAWLHKATKNPTYLNYIQVNGQILGADEFDNTFGWDNKHVGARILLSKAFLVQKVQSLHEYKGHADNFICSV  332 (510)
T ss_pred             chHHHHHHHHHHHHHhCCHHHHHHHHHHHhhccccccCCccCcchhHHHHHHHHHHHHhhcchHHHHHHHHHHHHHHHhc
Confidence            99999999999999999999999998875545433345689999999999999988544444567788999999999999


Q ss_pred             CCCCCCCcccccCCccccccCCChHHHHHHHHHHHHHHHhHhhhCCCccccCCCccchHHHHHHHHhcccccccCCCCCc
Q 010632          328 IPGSSSFQAQYTAGGLFYKASESNLQYVTTTAFLLLTYAKYLSSNGGVATCGSSTVKAENLIALAKKQVDYILGDNPAKM  407 (505)
Q Consensus       328 ~~~~~~~~~~~t~~g~~w~~~w~n~~~~~n~a~l~~~y~~~l~~~~~~~~~~~~~~~~~~y~~~a~~qldYiLG~Np~~~  407 (505)
                      .+++++..+++||||+.|..+|||+||++|++||+++|++++..++.++.||+......+|+++|++|||||||+||+++
T Consensus       333 ~~~~~~~~~~~TpGGL~~~~~wg~lrYa~~~afla~vya~~l~~~~~~~~cg~~~~~~~~~~~fA~~QidYiLG~NP~~~  412 (510)
T PLN02266        333 IPGAPFSSTQYTPGGLLFKMSDSNMQYVTSTSFLLLTYAKYLTSAKTVVNCGGTVVTPARLRSIAKKQVDYLLGDNPLKM  412 (510)
T ss_pred             cCCCCCCccccCCCeeEEeCCCCcHHHHHHHHHHHHHHHHHHHhcCCceecCCCccCHHHHHHHHHhhhceeccCCCCCC
Confidence            88887767899999999999999999999999999999999988777888998777889999999999999999999999


Q ss_pred             ceEeeeCCCCCCCccccCCCCCCCCCCCCccccCCCcccccCCCCCCCCcccccccCCCCCCCcccCcCccccCcccccC
Q 010632          408 SYMVGFGERYPQHVHHRGSSLPSIHAHPDHIACNDGFQYLYSRSPNPNVLTGAILGGPDNRDNFADDRNNYQQSEPATYI  487 (505)
Q Consensus       408 SyVtG~G~~~p~~pHHR~s~~~~~~~~p~~~~c~~g~~~~~~~~pn~~~l~GalvGGPn~~d~y~D~~~~y~~nEvaId~  487 (505)
                      |||||||.|+|++||||+||||++..+|.++.|.+||.|++++.||||+|.||||||||..|.|.|+|.+|++|||||||
T Consensus       413 SyvVG~G~~~P~~pHHR~as~p~~~~~~~~~~C~~g~~~~~~~~~n~~vL~GAlVGGPd~~D~y~D~r~~y~~nEva~dy  492 (510)
T PLN02266        413 SYMVGYGPRYPRRIHHRGSSLPSVAAHPAKIQCSQGFSIMNSQSPNPNVLVGAVVGGPDQHDRFPDERSDYEQSEPATYI  492 (510)
T ss_pred             ceEEecCCCCCccccccCCCCCCcccCccccCCCCCccccCCCCCCcceecceeecCCCCCCCCCccccccccCcceeec
Confidence            99999999999999999999999988899999999999999999999999999999999999999999999999999999


Q ss_pred             chHHHHHHHHhhcccC
Q 010632          488 NAPFVGAVAFFSSKTT  503 (505)
Q Consensus       488 NA~lv~~la~l~~~~~  503 (505)
                      ||+||++||+|.+.-+
T Consensus       493 NA~~vgalA~l~~~yg  508 (510)
T PLN02266        493 NAPLVGALAYLAHSYG  508 (510)
T ss_pred             chHHHHHHHHHHHHhc
Confidence            9999999999987644

>PLN02308 endoglucanase	Back alignment and domain information

>PLN02175 endoglucanase	Back alignment and domain information

>PLN02340 endoglucanase	Back alignment and domain information

>PLN00119 endoglucanase	Back alignment and domain information

>PLN02420 endoglucanase	Back alignment and domain information

>PLN02909 Endoglucanase	Back alignment and domain information

>PLN02613 endoglucanase	Back alignment and domain information

>PLN03009 cellulase	Back alignment and domain information

>PLN02171 endoglucanase	Back alignment and domain information

>PLN02345 endoglucanase	Back alignment and domain information

>PF00759 Glyco_hydro_9: Glycosyl hydrolase family 9; InterPro: IPR001701 O-Glycosyl hydrolases 3	Back alignment and domain information

>cd00249 AGE AGE domain; N-acyl-D-glucosamine 2-epimerase domain; Responsible for intermediate epimerization during biosynthesis of N-acetylneuraminic acid	Back alignment and domain information

>cd00249 AGE AGE domain; N-acyl-D-glucosamine 2-epimerase domain; Responsible for intermediate epimerization during biosynthesis of N-acetylneuraminic acid	Back alignment and domain information

>KOG2787 consensus Lanthionine synthetase C-like protein 1 [Defense mechanisms]	Back alignment and domain information

>COG1331 Highly conserved protein containing a thioredoxin domain [Posttranslational modification, protein turnover, chaperones]	Back alignment and domain information

>PF03663 Glyco_hydro_76: Glycosyl hydrolase family 76 ; InterPro: IPR005198 O-Glycosyl hydrolases 3	Back alignment and domain information

>PF07221 GlcNAc_2-epim: N-acylglucosamine 2-epimerase (GlcNAc 2-epimerase); InterPro: IPR010819 N-acylglucosamine 2-epimerase (AGE, 5	Back alignment and domain information

>PF07944 DUF1680: Putative glycosyl hydrolase of unknown function (DUF1680); InterPro: IPR012878 The members of this family are sequences derived from hypothetical bacterial and eukaryotic proteins of unknown function	Back alignment and domain information

>COG3533 Uncharacterized protein conserved in bacteria [Function unknown]	Back alignment and domain information

Homologous Structure Templates

Structure Templates Detected by BLAST

Original result of BLAST against Protein Data Bank

ID	Alignment Graph	Length	Definition	E-value
Query		505
1ks8_A		433	The Structure Of Endoglucanase From Termite, Nasuti		3e-74
1js4_A		605	EndoEXOCELLULASE:CELLOBIOSE FROM THERMOMONOSPORA Le		1e-73
2xfg_A		466	Reassembly And Co-Crystallization Of A Family 9 Pro		5e-59
4dod_A		475	The Structure Of Cbescii Cela Gh9 Module Length = 4		6e-57
1ga2_A		614	The Crystal Structure Of Endoglucanase 9g From Clos		2e-54
1k72_A		614	The X-ray Crystal Structure Of Cel9g Complexed With		2e-54
1ia6_A		441	Crystal Structure Of The Cellulase Cel9m Of C. Cell		2e-48
2yik_A		611	Catalytic Domain Of Clostridium Thermocellum Celt L		4e-37
3ez8_A		537	Crystal Structure Of Endoglucanase Cel9a From The T		4e-08

>pdb|1KS8|A Chain A, The Structure Of Endoglucanase From Termite, Nasutitermes Takasagoensis, At Ph 2.5. Length = 433