Análise no Rn - Diferenciabilidade

Análise no Rn - Diferenciabilidade

(Parte 1 de 4)

Capítulo 2 Diferenciabilidade

Neste capítulo vamos estudar o cálculo diferencial de funções f : Rn → Rm. As vezes, chamaremos uma função de várias variáveis com valores em Rm de uma aplicação. A teoria se baseia na aproximação linear local dessas aplicações como no caso em que m = n = 1. Dentre os resultados que obteremos está o que trata da diferenciabilidade da composta de duas funções (Regra da Cadeia). Além disso, sendo a derivada uma aproximação linear de uma função em um ponto onde ela é diferenciável, estudaremos que tipo de informações qualitativas podemos obter analisando somente a derivada. Os principais resultados nessa direção são o Teorema da Função Inversa e o Teorema da Função Implícita. O primeiro destes teorema ainda nos fornecerá consequências importantes que são as Formas Locais das Imersões e das Submersões e o Teorema do Posto.

Primeira aula ↓

2.1 Definições básicas

Uma primeira tentativa para definirmos a diferenciabilidade de uma função f : Rn → Rm seria a seguinte: fixamos n−1 variáveis e tratamos f como sendo uma função de apenas uma variável. Isto feito, supondo que f está sendo considerada como função de xi, definimos a derivada parcial de f na direção xi como no caso de uma variável. Assim, as derivadas parciais dão informações a respeito de f ao longo das direções dadas pelos eixos coordenados.

Existe porém uma pequena modificação deste conceito que estuda a variação de f localmente em direções dadas por um vetor fixado u.

Definição 2.1.1 Sejam A ⊂ Rn um aberto, x0 ∈ A, u 6= 0 um vetor em Rn e f : A → Rm. A derivada direcional de f em x0 na direção de u, denotada por f′(x0;u), é definida por

sempre que este limite existir.

Outra notação para f′(x0;u) é ∂ f

Observação 2.1.2 No caso em que u = ei, onde ei é o i-ésimo vetor da base canônica de Rn, temos que a derivada direcional de f na direção de u coincide com a derivada parcial de f na direção ei, e denotamos por ∂ f

Exemplo 2.1.3 Seja f : Rn → R dada por f(x) = ‖x‖2 e u ∈ Rn qualquer vetor fixado. Então

14 CAPÍTULO 2. DIFERENCIABILIDADE

Ao tentarmos obter informações sobre a continuidade de uma função analisando suas derivadas direcionais encontraremos alguns problemas.

Exemplo 2.1.4 Seja f : R2 → R dada por

1 caso contrário.

Então ∂ f

∂y (0,0) = 1. Entretanto, f não é contínua na origem. Note ainda que, para qualquer direção

No exemplo anterior a derivada direcional não existia em direções diferentes daquelas dadas pelos eixos.

Existem ainda funções que possuem derivadas direcionais em todas as direções em um dado ponto x0 mas que supreendetemente são descontínuas em x0.

Exemplo 2.1.5 Seja f : R2 → R dada por

Consideremos um vetor u = (a,b) qualquer. Temos então que, se a 6= 0,

Segue que

Assim, existem as derivadas direcionais de f em (0,0) em todas as direções. Entretanto, f não é contínua em (0,0). De fato, f(0,0) = 0 mas, se calcularmos o limite de f em (0,0) sobre a parábola x = y2 obteremos 1/2.

Para obtermos continuidade necessitamos de um conceito mais forte que derivadas direcionais que é a diferenciabilidade. Recordemos o caso de funções de R em R.

Dada uma função f : R → R, definimos a derivada de f por meio do limite (se ele existir)

Definamos

Então g não está definida em h = 0, mas

2.1. DEFINIÇÕES BÁSICAS 15

Definimos g da seguinte forma:

Podemos então verificar que, se f é diferenciável, existe uma função g tal que

Reciprocamente, suponha que existe λ ∈ R e uma função g tal que

Logo, tomando o limite h → 0 na expressão acima e observando que obtemos que f é diferenciável e que sua derivada f′(x) vale justamente λ.

Segue dessa análise que a existência de um número λ e de uma função g satisfazendo (2.2) poderia ser usada como definição de diferenciabilidade de funções de uma variável real. Notemos ainda na expressão (2.1) que a quantidade T(h) := f′(x)h é linear em h. A derivada total de uma função de várias variáveis será definida preservando as propriedades acima.

Definição 2.1.6 Seja A ⊂ Rn e f : A → Rm. Suponha que A contenha uma vizinhança de x0. Dizemos que f é diferenciável em x0 se existe uma matriz B, do tipo m×n, tal que

A matriz B é chamada de derivada ou diferencial de f em x0, e é denotada por B = Df(x0).

Na Definição 2.1.6utilizamos a normado sup, mas poderíamoster utilizado a normaeuclidiana sem nenhuma perda. Para que esta definição faça sentido devemos observar que a matriz Df(x0), quando existe, é única.

Lema 2.1.7 A derivada de f : A ⊂ Rn → Rm, quando existe, é única.

Demonstração. Suponha que B e C sejam duas matrizes que satisfazem a condição na definição de derivada. Segue que

Fixado u 6= 0, tomamos H = tu e fazemos t → 0. Segue que (C−B)·u = 0 e, como u é qualquer,C = B.

No caso em que a derivada de f : A ⊂ Rn → Rm existe em todo ponto do aberto A dizemos que f é diferenciável em A. Neste caso a aplicação derivada de f é a aplicação

16 CAPÍTULO 2. DIFERENCIABILIDADE

Exemplo 2.1.8 Qualquer matriz B ∈ L (Rn,Rm) pode ser vista ais simplesmente como uma função entre esses espaços. Mas por linearidade, B(x0+H)−B(x0) = B(H). Segue que DB(x0) = B

Mostremos que a definição de diferenciabilidade que acabamos de dar, na qual a matriz Df(x0) é conhecida como derivada de Fréchet, é mais forte que o conceito de derivada direcional, conhecida como derivada de

Gâteaux. De fato, diferenciabilidade implica em continuidade.

Teorema 2.1.9 Seja A ⊂ Rn e f : A → Rm. Se f é diferenciável em x0 ∈ A então f é contínua em x0. Demonstração. Para H pequeno de forma que x0+H ∈ A temos que

Como a expressão dentro do parênteses tende a 0 quando H → 0 temos que lim

Logo f é contínua em x0.

Podemos ainda recuperar o conceito de derivada direcional utilizando o conceito de diferenciabilidade.

Proposição 2.1.10 Seja A ⊂ Rn e f : A → Rm. Se f é diferenciável em x0 ∈ A então f′(x0;u) existe para qualquer vetor u ∈ Rn e

Em particular, se m = 1 então

Demonstração. Seja B := Df(x0). Tomemos H = tu, t 6= 0, e substituimos na definição de diferenciabilidade. Obtemos que

Multiplicamos (2.3) por |u| ou por −|u|, dependendo se t > 0 ou t < 0, respectivamente. Em ambos os casos obtemos

lim

Segue que f′(x0;u) = B·u. Suponhamos agora que m = 1. Então, por definição, Df(x0) é uma matriz 1×m que escrevemos como

Pela primeira parte deste teorema temos que

O resultado segue.

Observação 2.1.1 No caso em que f : A ⊂ Rn → R é diferenciável em x0, usamos a notação

chamado de gradiente de f em x0.

2.2. O TEOREMADOVALORMÉDIO 17

Sejam {e1,...,en} e {u1,...,um} as bases canônicas de Rn e Rm respectivamente. Dada f : A ⊂ Rn → Rm diferenciável em x0 ∈ A, definamos a transformação linear T : Rn → Rm por

Com esta notação temos que

Fazendo o produto interno de ambos os lados da igualdade (2.4) com uj, j = 1,...,m, vemos que cada termo na soma possui limite, o qual é justamente ∂ f j

Segue que a matriz de T com relação às bases canônicas de Rn e Rm é

(x0)
(x0)

Tal matriz é chamada de Jacobiana de f em x0, sendo denotada por Df(x0). Ela está definida em qualquer ponto de Rn onde f é diferenciável.

Segunda aula ↓ Vamos resumir a discussão sobre matrizes e derivadas na proposição a seguir.

a) A função f é diferenciável em x0 ∈ A se, e somente se, cada uma de suas componentes f1,..., fm são diferenciáveis em x0.

b) Se f é diferenciável em x0 ∈ A, então a matriz Jacobiana de f em x0 é a matriz da derivada de f em x0.

2.2 O Teorema do Valor Médio

Para uma função diferenciável g: R → R, o Teorema do Valor Médio afirma que g(x)−g(y) = g′(z)(x−y), para algum z ∈ (x,y). Entretanto esta relação não é válida em geral para funções de Rn em Rm. Vamos demonstrar que uma versão corrigida do teorema é válida. Utilizaremos a seguinte notação: para x,y ∈ Rn, definimos

18 CAPÍTULO 2. DIFERENCIABILIDADE

Teorema 2.2.1 (Teorema do Valor Médio) Sejam A ⊂ Rn um aberto e f : A → Rm diferenciável em todo ponto de A. Sejam x,y ∈ A tais que L(x,y) ⊂ A. Então, para todo a ∈ Rm, existe z ∈ L(x,y) tal que〈

Demonstração. Seja u = y−x. Como A é aberto e L(x,y) ⊂ A, temos que existe δ > 0 tal que x+tu ∈ A, para qualquer −δ < t < 1+δ (basta usar o Teorema 1.5.8). Agora fixemos a ∈ Rm e definamos F : (−δ,1+δ) → Rm por

Notemos que

Em particular,F é diferenciávelem (0,1). Segue do Teorema do Valor Médio de uma variável que existe 0 < θ < 1 tal que

Observação 2.2.2 É interessante observarque o Teorema do ValorMédio 2.2.1possui implicaçõessimples, porém já interessantes.

a) No caso em que m = 1, tomando a = 1, o Teorema 2.2.1 implica que

para algum z ∈ L(x,y).

b) Tomando a = f(y) − f(x) podemos usar a Desigualdade de Cauchy-Schwarz do Exercício 2 para, após dividirmos por ‖f(y)− f(x)‖, obtermos do Teorema 2.2.1 que onde M é a norma de Df(z), para algum z ∈ L(x,y). Em particular, se A é convexo e as derivadas parciais de f são limitadas em A, então f é Lipschitz, uma vez que, para quaisquer y,x ∈ A, temos que L(x,y) ⊂ A.

2.3 Uma condição suficiente para diferenciabilidade

Até agora obtemos resultados que são consequências da hipótese de diferenciabilidade de uma função. Entretanto, vimos também que nem a existência das derivadas direcionais em todas as direções de uma certa função em um dado ponto não implicam na diferenciabilidade desta função neste ponto (já que pode acontecer de não termos nem mesmo continuidade). O principal resultado desta seção mostra que a continuidade das derivadas parciais é suficiente para garantirmos a diferenciabilidade. Antes vamos explicitr uma versão mais simples da Regra da Cadeia que já utilizamos na demonstração do Teorema do Valor Médio.

Lema 2.3.1 Seja g: A ⊂ Rn → R uma função diferenciável no aberto A e considere φ(t) = g(x0+tu). Para todo t de maneira que φ esteja bem definida temos

Teorema 2.3.2 Seja A ⊂ Rn um aberto e f : A → Rm, com f = (f1,..., fm). Suponha que as derivadas parciais ∂ f j

∂xi das funções componentes existem em cada ponto de A e são contínuas em A. Então f é diferenciável em A.

2.3. UMA CONDIÇÃO SUFICIENTEPARA DIFERENCIABILIDADE 19

Demonstração. Primeiramente notemos que é suficiente demonstrarmos o teorema no caso de uma função com valores em R. De fato, a diferenciabilidade de f = (f1,..., fm) é equivalente à diferenciabilidade de cada componente.

Dados x0 ∈ A e ε > 0, consideremos o pontos x ∈ A tais que |x−x0| < ε. Seja H = (h1,...,hn) ∈ Rn com 0 < |H| < ε. Consideremos então os seguintes pontos de Rn que são vértices de um paralelepípedo retângulo centrado em x0:

Podemos escrever

Suponhamos hj 6= 0 e definamos φ(t) := f(pj−1 +tej), t ∈ [−δ,hj +δ], para algum δ > 0. Notemos ainda que φ é diferenciável em t pelo Lema 2.3.1 (pois as derivadas parciais de f existem e são contínuas). Aplicando o

Teorema do Valor Médio à φ concluimos que

para algum cj ∈ (0,hj), onde qj = pj−1 +cjej. Notemos que se hj = 0, então (2.6) vale automaticamente. Substituindo (2.6) em (2.5) obtemos

Subtraindo 〈∇f(x0),H〉 em ambos os lados da igualdade (2.7) e dividindo por |H| chegamos na identidade

Fazendo H → 0, vemos que qj → x0. Usando a continuidade das derivadas pariciais e a limitação do quociente hj/|H| obtemos o resultado.

Uma função f : A ⊂ Rn → Rm cujas derivadas parciais existem e são contínuas em A é chamada de continuamente diferenciável ou de classe C1 em A, ou ainda f ∈ C1(A,Rm). No decorrer deste texto usaremos ainda a notação

Suponha que f : A ⊂ Rn → Rm e que as derivadas pariciais das componentes de f, dadas por Dj fi, existam. Estas são, novamente, funções de A em R. Podemos então considerar as suas derivadas parciais que são as chamadas derivadas parciais de segunda ordem de fi. Similarmente definimos as derivadas de terceira ordem, e assim por diante. Se as derivadas parciais de fi até ordem r existem e são contínuas para i = 1,...,m, dizemos que f é de classe Cr e escrevemos f ∈ Cr(A,Rm). Dizemos ainda que f é de classe C∞ se as derivadas parciais de todas as ordens de todas as componentes de f existem. Notemos queC∞(A,Rm) = ∩r∈NCr(A,Rm).

20 CAPÍTULO 2. DIFERENCIABILIDADE

2.4 O Teorema de Clairaut-Schwarz

Se uma função f : A ⊂ Rn → Rm possui derivadas parciais até segunda ordem, não necessariamente temos que DiDj f = DjDi f.

onde g: R2 → R é uma função limitada. Então, para qualquer y ∈ R, o que nos dá ∂2 f

desde que os limites existam. Similarmente

Escolhendo, por exemplo,

obtemos

Segue que ∂2 f

O Teorema de Clairaut-Schwarz nos dá condições sob as quais temos a igualdade das derivadas parciais de segunda ordem mistas Dk,j f e Dj,k f.

Teorema 2.4.2 (Teorema de Clairaut-Schwarz) Seja A ⊂ Rn um aberto e f : A → R uma função de classe C1. Suponhamos que DkDj f e DjDk f, k 6= j, existem e são contínuas. Então, para cada x0 ∈ A,

Demonstração. Iniciamos com o caso n = 2. Queremos então demonstrar que D1D2 f(x0,y0) = D2D1 f(x0,y0),

(x0,y0)∈A fixado. Seja δ >0 tal que a δ–vizinhançade (x0,y0) esteja contida em A e consideremoss∈R pequeno de maneira que a expressão abaixo esteja bem definida:

Q(s) é chamado de quociente de diferença de segunda ordem. Definamos para cada x ∈ R de maneira que (x,y0+s), (x,y0) ∈ A. Observe que o domínio de g é um aberto em R que contém o intervalo fechado [x0,x0 +s]. Além disso,

2.4. O TEOREMADECLAIRAUT-SCHWARZ 21

Assim, g é de classe C1, pois f1 é contínua, e tabém

Aplicando o Teorema do Valor Médio à g vemos que existe ξ ∈ (x0,x0 +s) tal que

Observe que ξ depende de s. Seja agora h(y) = f1(ξ,s), para cada y ∈ R de maneira que (ξ,y) ∈ A. Novamente, o domínio de h é aberto e contém o intervalo [y0,y0 +s]. Além disso, e h é de classe C1. Temos então

Aplicando novamente o Teorema do Valor Médio obtemos que para algum η ∈ (y0,y0 +s), dependendo de s. Repetindo este processo trocando-se o papel de x e y enocntramos que

Portanto, no limite lim demonstrando o teorema no caso n = 2. Suponhamos agora que n > 2 e que, sem perda de generalidade, i < j. Dado x0 = (x10,...,xn0) ∈ A, definamos

que está bem definida em algum aberto de R2 contendo (x)i0,xj 0). Aplicando a primeira parte da demonstração à φ encontramos

Observe que o Teorema 2.4.2 implica que, se f é de classe C3, então f123 = f132 = f112 e assim por diante. Terceira aula ↓

2 CAPÍTULO 2. DIFERENCIABILIDADE

2.5 A Regra da Cadeia

Para funções f e g tais que a composta h = f ◦g pode ser calculada, a regra da cadeia nos diz como calcular a derivada total de h em termos da derivada total de f e de g.

Teorema 2.5.1 Sejam A ⊂ Rn e B ⊂ Rm abertos. Consideremos as funções f : A → Rm e g: B → Rp tais que f(A) ⊂ B e com f(x0) = y0. Se f é diferenciável em x0 e g é diferenciável em y0, então a composta g ◦ f é diferenciável em x0 e, além disso, D(g◦ f)(x0) = Dg(y0)·Df(x0), onde o ponto “·” indica o produto das matrizes jacobianas de g e f respectivamente.

Demonstração. Pela continuidade de g em y0, podemos tomar ε > 0 tal que g está definida no conjunto Cε(y0).

Similarmente, escolhemos δ > 0 tal que f esteja definida em Cδ(x0) e ainda, f(x) ∈ Cε(y0), para qualquer x ∈ Cδ(x0). Segue que a composta g◦ f está definida em Cδ(x0).

f g c yx

Tomemos H ∈ Rn tal que 0 < |H| < δ. Assim,

onde lim

Analogamente, a diferenciabilidade de g em y0 implica que onde lim

onde

A demonstração estará completa se tivermos que

Notemos que z → 0 quando H → 0. Logo, Ef(H) → 0 e Eg(z) → 0 quando H → 0. Vamos então mostrar que o quociente |z|

(Parte 1 de 4)

Comentários