Difference between revisions of "Team:UFSCar-Brasil/part2.html"

Line 31: Line 31:
 
           <p>Chaperones efficiency coefficient still means the proportion of correct and incorrectly folded proteins. Considering the case of 100% of solubility, this coefficient tends to infinity, since the insoluble portion tends to zero. In this sense, a case of this type would be impossible to work, to prevent this, we decided work with protein yield. Protein yield coefficient would be given as percent (0-100) and calculated as follows:
 
           <p>Chaperones efficiency coefficient still means the proportion of correct and incorrectly folded proteins. Considering the case of 100% of solubility, this coefficient tends to infinity, since the insoluble portion tends to zero. In this sense, a case of this type would be impossible to work, to prevent this, we decided work with protein yield. Protein yield coefficient would be given as percent (0-100) and calculated as follows:
  
             $$%=100 soluvel/(soluvel+insoluvel) (Eq. 1)$$,
+
             $$%=100 soluvel/(soluvel+insoluvel)$$(Eq. 1),
  
 
           <p><b>Table 2:</b> Chaperone arrangements related to chaperones efficiency and protein yield coefficients. (TABELA 2)</p>
 
           <p><b>Table 2:</b> Chaperone arrangements related to chaperones efficiency and protein yield coefficients. (TABELA 2)</p>

Revision as of 18:39, 16 September 2015

Protein Solubilization toolkit

Where are the singular effects?

Simulation and analysis

In this modeling step, we will develop a study about different chaperones arrangement efficiency in the proteins folding, using as example our protein of interest, Limonene Synthase. As it was not possible to obtain the complete system of this toolkit, there are no available experimental data to reinforce our findings. Nevertheless, the modeling of this section is extremely significant and could be useful to another teams with some similar problems. In this sense, we decided to model our system starting from a simulated dataset where we use fake data, and in the future, real data could simply replace them.

First of all, the experiment to measure the efficiency of each chaperone and arrangement of them was conceived in the following form:

All chaperones would be tested alone (IbpA+B, ClpB and DnaK), in pairs and all together. The proteins would be encoded in plasmid pSB1C3 under control of a constitutive promoter, allied to our gene of interest under the same promoter. Protein of interest would be produced by some hours, and the cells would be harvested and lysed by ultrasound. Finally, the cell debris would be precipitated by centrifugation and the soluble and insoluble portions would be recovered. After, a SDS-PAGE the band of interest would be quantified with optical densitometry. Chaperone efficiency coefficient would be given as the reatio between soluble to insoluble bands.

Simulated data following this procedures were provided in the table bellow. A control group without any chaperones was included to comparision, and all measurements were made in triplicates. This table shows portion of well folded proteins (soluble) and misfolded ones (insoluble).

Table 1: Simulated data using different chaperone sets and the solubility after the treatment.

Chaperones efficiency coefficient still means the proportion of correct and incorrectly folded proteins. Considering the case of 100% of solubility, this coefficient tends to infinity, since the insoluble portion tends to zero. In this sense, a case of this type would be impossible to work, to prevent this, we decided work with protein yield. Protein yield coefficient would be given as percent (0-100) and calculated as follows: $$%=100 soluvel/(soluvel+insoluvel)$$(Eq. 1),

Table 2: Chaperone arrangements related to chaperones efficiency and protein yield coefficients. (TABELA 2)

Para visualizar como esse grande conjunto de combinações se relacionam entre si em termos do rendimento utilizamos um modelo de análise hierárquica de Cluster na página da web, que pode ser encontrada na referencia (link), de onde foi feito os cálculos utilizados na criação do dendograma da Figura 1. Essa análise basicamente agrupa dados que estão mais próximos e separa dos que estão mais distantes, ou seja, conforme podemos observar os valores obtidos com todas as chaperonas atuando juntas, aqui denominada de “Todas”, estão mais isoladas das demais combinações por ser o maior valor dentre as demais e por isso está estatisticamente mais ‘distante’ dos demais grupos. Da mesma forma observamos as duplas “Ibp+Clpb” e “Ibp+dnaK” agrupadas no mesmo ramo, assim concluímos que seus valores são próximos e por isso podem ser separado dos demais. (DENDOGRAMA)

Figure 1: Dendogram of distances using simulated dataset generating a clustering complex behaviour.

Juntamente com a figura 1 obtemos também o coeficiente de correlação cofenética de 0.841345528026065. Esse coeficiente mede quão fiel são as distâncias calculadas no dendograma entre seus pontos.

Pode-se observar que a combinação de “todas” as chaperonas juntas está mais distante das demais, o que era esperado já que seu rendimento apresentou o maior valor. Já as combinações “Ibp+Dnak” e “Ibp+clpb” estão juntas em um ramo, indicando que seus valores de rendimento são muito próximos, além de estarem em um ramo próximo da combinação das três indicando que seus rendimentos não são tão altos quanto da atuação de todas as chaperonas juntas, mas suficiente próximos. Isso pode indicar que caso não se possa utilizar as todas juntas numa bactéria as combinações “Ibp+Dnak” ou “Ibp+clpb” seriam muito boas substitutas.

Como é possível observar, o rendimento das chaperonas atuando em conjunto não é nada trivial, já que sofrem interações mutuas é muito difícil de prever qual será o seu comportamento em conjunto com base em valores individuais.

Para que seja possível tentar prever essa interferência entre elas, equacionamos todas as combinações possíveis de rendimento correspondente para cada combinação e multiplicamos elas por um fator matemático \(x_i\). O objetivo é interpretar os valores dessas constantes, para que fosse possível comparar a influência que cada componente de chaperona isolado influencia no conjunto das combinações.

Onde cada índice \(x_i\) representa uma combinação das três chaperonas estudadas, assim: \(x_1 \rightarrow Ibp\); \(x_2\rightarrow Clbp\); \(x_3\rightarrow Dnak\);\(x_4\rightarrow Ibp+Clbp\); \(x_5\rightarrow Ibp+Dnak\);\(x_6 \rightarrow Clbp+Dnak\); \(x_7 \rightarrow Ibp+Dnak+Clpb\).

O resultado obtido da resolução deste sistema foi :

(Exp. 1) $$x_1=(471/124)x_7-(251/248)x_6 $$
(Exp. 2) $$x_2= -(314/71)x_7 +(502/213)x_6$$
(Exp. 3) $$x_3=(471/109)x_7 - (251/218)x_6$$
(Exp. 4) $$x_4=(251/612)x_6 $$
(Exp. 5) $$x_5=(1884/503)x_7-(502/503)x_6 $$
(Exp. 6) $$x_6=x_6 $$
(Exp. 7) $$x_7=x_7 $$

É possível escrever todos os parâmetros com base em dois valores \(x_6\) e \(x_7\), ou seja, a relação entre todas as chaperonas estava vincula a duas relações específicas, que são “todas” as chaperonas juntas e a combinação “Dnak+clpb”. Assim fixando-se uma das constantes é possível estudar o comportamento das outras por meio de gráficos. (GRAFICO 1 E GRAFICO 2)

Figure 2: KKK.
Figure 3: KKK.

Pode-se perceber que não há uma única solução para nosso problema, e provavelmente mesmo com valores reais talvez não exista uma solução única, mas pelos gráficos é possível, mesmo assim, tirar algumas relações de dependência entre os coeficientes, como por exemplo quando tem-se fixo x7 a componente x2 é crescente com inclinação maior que x1, que decresce conforme se aumenta o valor de x6, isso indica que sua influencia nas combinações de chaperonas da Clpb é maior que a Ibp nestas configurações, porem esse resultado se inverte a partir do momento que aumentamos os valores relativos a x7.

Como não foi possível obtermos resultados experimentais para validar nossas discussões e prever resultados, deixamos esta modelagem como um modelo teórico que pode ser empregado e testado em futuros projetos de nossa ou outra equipe iGEM que queira emprega-la.

Referencias

S. Garcia-Vallve, J. Palau and A. Romeu (1999) Horizontal gene transfer in glycosyl hydrolases inferred from codon usage in Escherichia coli and Bacillus subtilis. Molecular Biology and Evololution 16(9):1125-1134.

DendroUPGAMA url : http://genomes.urv.cat/UPGMA/

Our amazing sponsors!