(Parte 1 de 8)

Estimação de parâmetros de populações de plantas daninhas usando inferência Bayesiana

Marcel Rodrigues Lopes

Dissertação apresentada à Escola de Engenharia de São Carlos da Universidade de São Paulo, como parte dos requisitos para obtenção do título de Mestre em Engenharia Elétrica

Orientadora: Profa. Dra. Vilma Alves de Oliveira

À meus pais Maria Dulce e Diógenes, por toda força e carinho que sempre me deram...

A minha avó Dulce Dalmiglio, pelo exemplo de vida e dedicação...

Ao mestre Takamori que iluminou meu caminho esclarecendo o verdadeiro objetivo da vida....

Agradecimentos

Todo trabalho científico é resultante de um trabalho em equipe. Assim, algum mérito que este trabalho possa apresentar é dedicado àqueles que direta e indiretamente colaboraram em sua realização, em especial...

À minha família, pelo amor, carinho, dedicação e por terem me ajudado nos bons e maus momentos da minha vida.

À minha orientadora Professora Vilma Alves de Oliveira por toda paciência e dedicação.

A todos amigos do Laboratório de Contole (LAC), em especial a Glaucia, o Fabio, a Lilian, o Wilson, o Alexandre, o Maurílio e o Rafael.

Aos meus amigos da minha cidade, no qual eu tenho o orgulho de ter a amizade,

Marinho, Fábio, Luciano, Fernando Frare, Fernando Fonseca, Daniel, Nelson, Nélio e Vando.

Aos professores e funcionários do Departamento de Engenharia Elétrica da EESC/USP, por toda colaboração.

Aos amigos de S.Carlos, Araraquara e São Paulo, Leonardo, Marina, Marcos Persegil, Soraia, Luís Libardi, Emanuel, Amanda, Paulo, Sr.Acachi, Sra. Rosa, Claudio, Ronaldo, Marco, Hideki, Mauro, Yukimi, Sérgio, Kiyomi, Noro, Yoshio, Alexandre, Rodrigo, Ivan, Geovani, Peko, Márcio, Haroldo, Rony, Nenão e Raquel por toda a demonstração de companheirismo e carinho que sempre deram.

Aos orgãos públicos de fomento, CNPq, pela bolsa de estudo concedida e CAPES pelo auxílio financeiro concedido via projeto PROCAD.

Aos professores de budismo Hideto, Ayako, Matsumoto, Omi, Harada, Tsubaki,

Yamamoto, Ueki, Yoshizawa, Nishimura e Mitsuharu por todo esforço e dedicação em me explicar o verdadeiro sentido da vida....

Conteúdo

Resumo vi Abstract vii

1.1 Dinâmica de comunidades de plantas daninhas1
1.2 Representação matemática da dinâmica populacional1
1.3 Objetivos e organização do trabalho5

1 Introdução 1

2.1 O pensamento clássico7
2.2 O pensamento Bayesiano9
2.3 Distribuições a priori informativas16
2.3.1 Informação a priori com base em um especialista18
2.4 Distribuições a priori não-informativas19
2.4.1 Método de Bayes-Laplace20
2.4.2 Método de Jeffreys21
2.5 Métodos de Monte Carlo e Simpson2
2.5.1 Monte Carlo simples2
2.5.2 Monte Carlo via função de importância24
2.5.3 Método numérico de Simpson26
2.5.4 Regra de Simpson27
2.6 Métodos de Monte Carlo via cadeias de Markov29
2.6.1 Cadeias de Markov30
2.6.2 Algoritmo de Metrópolis-Hastings31
2.6.3 Amostrador de Gibbs3
2.7 Estimador de máxima verossimilhança via MCMC37
2.7.1 Famílias de densidades normalizadas37

2 Inferência Estatística 7 i

2.8 Validação e seleção de modelos39
2.8.2 Comparação de modelos42
2.8.3 Seleção de modelos via métodos MCMC43

CONTEÚDO iv 2.8.1 Medidas de diagnóstico - medida de adequabilidade de um modelo 40

3.1 Modelo de regressão não-linear45
3.2 Densidade a priori para os parâmetros46
3.3 Densidades a posteriori para os parâmetros47
3.4 Distribuição à posteriori do modelo de 2 parâmetros49
3.4.1 Uma densidade a priori não-informativa para θ = (s,a) e σ49
3.4.2 Densidade a posteriori conjunta para θ e σ50
3.4.3 Densidades a posteriori marginais para s e a50
3.5 Distribuição à posteriori do modelo de 3 parâmetros51
3.5.1 Uma densidade a priori não-informativa para θ = (s,a,b) e σ51
3.5.2 Densidade a posteriori conjunta para θ(s,a,b) e σ52
3.5.3 Densidades a posteriori marginais para s,a e b52
3.6 MCMC para os parâmetros e seleção dos modelos53
3.6.1 Algorítmo MCMC54
3.6.2 Densidades preditivas ordenadas (DPO)54
3.6.3 Métodos de seleção AIC e BIC5
3.6.4 MCMC em estimador de máxima verossimilhança56

3 Modelos para populações de plantas daninhas 45

4.1 Inferência Bayesiana via método de Simpson58
4.2 Inferência Bayesiana via método MCMC58
4.4 Discussão dos resultados59
4.4.1 Método numérico de Simpson59
4.4.2 Taxas de rejeição e convergência das cadeias60
4.4.3 Seleção de modelos60
4.4.4 Estimador de máxima verossimilhança usando o MCMC61

4 Resultados 57 4.3 Inferência clássica via método de máxima verossimilhança usando MCMC 59 5 Conclusão 73

A.2 Frequência relativa75
A.3 Probabilidade condicionada e eventos independentes7
A.3.1 Eventos independentes78

CONTEÚDO v

B.1 Modelo de 2 parâmetros79
B.1.1 Parâmetro a79

B Algorítmo para o cálculo das posterioris pelo método de Simpson 79 Bibliografia 8

Resumo

O banco de sementes de plantas daninhas pode vir a ser um sério problema para a atividade agrícola por manter infestações por longos períodos. A dinâmica da população de plantas daninhas pode ser representada por modelos matemático que relaciona as densidades de sementes produzidas e de plântulas em áreas de cultivo. Os valores dos parâmetros dos modelos podem ser inferidos diretamente de experimentação e análise estatística. O presente trabalho tem por objetivo estimar parâmetros de populações das plantas daninhas anuais denominadas Digitaria ciliares, Panicum maximum e Euphorbia heterophylla e avaliar um modelo espacial com 2 e 3 parâmetros, a partir de um experimento conduzido em cultura de Zea mays (milho) usando inferência Bayesiana.

Palavras-chave: Dinâmica populacional, Inferência Bayesiana, Priori nãoinformativa, Densidade preditiva, Monte Carlo em cadeia de Markov.

Abstract

The seeds bank of weed could be a serious problem to the agricultural activity because it maintains infestations for long periods. The dynamics of weed populations can be described by mathematical models that relates the produced seeds and seedlings densities in areas of crop. The values of the parameters of the models can be inferred from experimentation and statistics analysis. The objective of this work is to estimate parameters of anual weed populations denoted Digitaria ciliares, Panicum maximum e Euphorbia heterophylla and evaluate a spatial model with 2 and 3 parameters from experimental data of Zea mays (corn) fields using Bayesian inference.

vii

Capítulo 1 Introdução

1.1 Dinâmica de comunidades de plantas daninhas

Tem havido um grande interesse na simulação do impacto do uso de herbicidas para controle de populações de plantas daninhas visando a identificação do nível de aplicação adequado. E, os modelos matemáticos têm se tornado ferramentas valiosas para a simulação de diferentes situações das variáveis do problema (Doyle, 1997). Existem diversos exemplos de modelagem de população ecológica em termos de dinâmica nãolinear. A população de plantas daninhas apresenta um ciclo de vida que começa com a germinação no solo, seguida por crescimento vegetativo, floração, produção de semente, difusão de semente, sobrevivência ou mortalidade de sementes no solo, e, germinação no ano seguinte (Sakai, 2001). Devido à existência de sementes dormentes no solo, a população enterrada possui sementes de diferentes gerações. A densidade das plântulas (plantas que germinaram) daninhas afeta fatores ecológicos como taxa de mortalidade e nascimento, fecundidade e produção. Em plantas, um crescimento na densidade inicial resulta em alta taxa de mortalidade e baixa taxa de crescimento, baixa fecundidade e decréscimo de produção de sementes. Isto acontece porque aumenta a competição por recursos como água, luz e nutrientes.

1.2 Representação matemática da dinâmica populacional

Sakai (2001) descreveu a dinâmica populacional de plantas daninhas através de fatores dependentes e independentes da densidade de plantas daninhas e obteve o número de

1.2. REPRESENTAÇÃO MATEMÁTICA DA DINÂMICA POPULACIONAL 2 sementes por área (densidade de sementes) em sucessivos anos a partir do número de sementes do ano inicial observado. A densidade de sementes existentes no ciclo t + 1 é determinada pela densidade de sementes do ciclo anterior t, sendo descrita por onde t é o ciclo de vida das plantas, x é o número de sementes por área, g, o, s e v são as taxas de germinação, floração, produtividade (número de sementes produzidas por planta) e de sementes viáveis no solo no ano seguinte, respectivamente, com g, o e s constantes. Com exceção da taxa de produtividade s, as taxas são probabilidades e encontram-se entre 0 (zero) e 1 (um). O segundo termo de (1.1) representa as gerações sobrepostas e quando as sementes no solo não persistirem durante um ano tem-se v = 0. O modelo (1.1) considera somente a densidade da população em intervalos de uma geração individual a cada ciclo e é por isto denominado modelo de um único estádio. A densidade de plântulas de daninhas denotada y pode ser descrita por onde y é o número de plântulas por área e g parâmetro que representa a taxa de germinação de sementes já introduzida. A densidade de plântulas influencia parâmetros ecológicos devido ao efeito densidade, isto é, a taxa de crescimento da população, a população em pleno vigor vegetativo, a população em floração e o número de sementes produzidas são funções da densidade de plântulas de daninhas, já a taxa de germinação é independente da densidade. Assim, o e s em (1.1) não são constantes, mas, funções da densidade de plântulas de daninhas. Desta forma, um modelo para a densidade de sementes produzidas pode ser expresso, por exemplo, como função da densidade de plântulas de daninhas

xt+1 = F(yt),t = 1,2,(1.3)

onde F:ℜ → ℜ. Logo, a dinâmica populacional de plantas daninhas pode ser descrita por (1.2) e (1.3) que relacionam as densidades de sementes produzidas e de plântulas. Note que os sistemas (1.2) e (1.3) representam a independência e dependência da taxa de crescimento populacional da densidade de plântulas, respectivamente. Baseado nestas equações, a relação entre a densidade de sementes xt e xt+1 pode ser expresso por um

1.2. REPRESENTAÇÃO MATEMÁTICA DA DINÂMICA POPULACIONAL 3 sistema dinâmico discreto com o número de sementes no solo sendo a variável de estado x

xt+1 = F(gxt),t = 1,2,(1.4)

Wu (2001) apresenta a dinâmica populacional de plantas daninhas em função da densidade de plântulas controladas com aplicação de herbicida, cuja forma funcional utilizada para a função resposta de taxa de herbicida é a exponencial. Neste caso, o modelo de densidade de plântulas (1.2) é modificado para onde agora y é a densidade de plântulas de daninhas sobreviventes à aplicação de herbicida, h a taxa de eficiência do herbicida e H a dosagem de herbicida que pode ser interpretada como a toxidade do herbicida usado. Das daninhas sobreviventes ao herbicida algumas produzem sementes e um novo ciclo é iniciado. Para simplificar, Wu (2001) considerou que todas as sementes ou germinaram (g = 1) ou morreram (v = 0), isto é, se g = 1 ou v = 0, então, (1 − g)vxt = 0 e que pode haver produção de sementes a partir das daninhas sobreviventes à aplicação de herbicida (syt). Como Wu (2001) não se refere à taxa de floração, considera-se o = 1 em (1.1). Sob estas condições, a densidade de sementes no banco é dada por

Note que Wu (2001) incluiu uma variável e dois parâmetros ao modelo (1.5): H, s e h, respectivamente, enquanto que Sakai (2001) considerou s como uma função da densidade de plântulas. Em geral, g, h e s são variáveis aleatórias porque são influenciadas por tempestades, temperatura e outros fatores incertos. Cousens e Mortimer (1995) apresentam um modelo da dinâmica populacional de plantas daninhas baseado na trajetória da densidade da população (plântulas ou sementes). Neste contexto, um modelo para a produção de sementes sob baixas densidades de plantas daninhas é da forma onde R é a taxa de crescimento populacional em baixa densidade. Com a competição intra-específica, a taxa de crescimento populacional proposta por Hassell (1975) e

1.2. REPRESENTAÇÃO MATEMÁTICA DA DINÂMICA POPULACIONAL 4

Edelstein-Keshet (1988) é da forma

com R a taxa de crescimento em baixa densidade, d a taxa de declínio de φ com o aumento da densidade e b a forma da trajetória populacional (taxa que reflete a intensidade do efeito da densidade de plantas daninhas na produção de sementes). Observe que o modelo (1.7) com a taxa de crescimento dada por (1.8) possui a forma geral de (1.3) com R, d e b constantes ou dependentes da densidade. Considerando-se R = sg e d = ag e combinando-se (1.8), (1.9) e (1.2) obtém-se finalmente

A solução de equilíbrio de (1.7) com a taxa de crescimento como em (1.8) é

Assim, a trajetória da densidade da população pode ser caracterizada pela flutuação de φ com o tempo sobre as gerações da população. O tipo de trajetória depende dos valores de R e b. Se b = 1 ou R ≤ e (e é o número de Euler ou neperiano) a densidade da população converge monotonicamente e/ou assintoticamente para o equilíbrio. Se 1 < b < 2 e e < R < e2 a densidade converge para o equilíbrio com oscilações amortecidas. Se b > 2 e R > e2 podem ocorrer comportamentos complexos, tais como o caos. Quando b = 1 e R = 1 a densidade da população se extingue. Lembrando que e é o número neperiano e seu valor aproximado é de 2,718, tem-se que a trajetória populacional define quatro zonas no gráfico R versus b (Figura 1.1).

A dinâmica populacional de uma espécie pode ser afetada por níveis populacionais de outras espécies, assim, se uma das espécies é uma daninha e a outra é a cultura semeadas em uma mesma densidade a cada ciclo, a densidade de sementes de daninhas pode ser dada por

(Parte 1 de 8)

Comentários