Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Introdução analise em Rn, Notas de estudo de Engenharia de Telecomunicações

- - -

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 26/03/2008

rafael-santos-13
rafael-santos-13 🇧🇷

1 documento

Pré-visualização parcial do texto

Baixe Introdução analise em Rn e outras Notas de estudo em PDF para Engenharia de Telecomunicações, somente na Docsity! Introdução à Análise em Rn J. Campos Ferreira 3 de Junho de 2004 Introdução Uma grande parte deste trabalho é o resultado de uma revisão do texto intitulado Introdução à Análise em Rn, que redigi há mais de vinte anos para os alunos que então frequentavam no Instituto Superior Técnico a disciplina de Análise Matemática II. Decidi-me a efectuar essa revisão — e até a acrescentar diversos complementos cuja redacção está em curso — porque alguns colegas e amigos me asseguraram que o trabalho poderia ter ainda hoje alguma utilidade, como texto de apoio a uma parte das suas aulas da referida disciplina. Gostaria de deixar aqui expresso o meu reconhecimento aos Professores Fran- cisco Teixeira, João Palhoto de Matos e Pedro Girão e ao Engenheiro Paulo Abreu pelas suas valiosas contribuições para a concretização deste projecto. Lisboa, Novembro de 2002 Jaime Campos Ferreira 5 6 Caṕıtulo 1 Generalidades e primeiros exemplos 1.1 Introdução Foi estudada anteriormente a noção geral de função. De forma intuitiva, pode pensar-se que uma função f associa a cada elemento x de um dado conjunto A, chamado domı́nio de f , um e um só elemento f(x) de um conjunto B; o subcon- junto de B formado por todos os valores f(x) é, como sabemos, o contradomı́nio de f . No caso geral, A e B podem ser conjuntos com elementos de natureza qualquer. No entanto, quase todo o nosso trabalho anterior incidiu sobre um caso particular, aliás muito importante: o de tanto A como B serem subconjuntos do conjunto R, dos números reais (dizia-se então, como vimos, que as funções consideradas eram funções reais de (uma) variável real). Vamos iniciar agora uma generalização desse estudo, de enorme interesse em toda a espécie de aplicações: estudaremos funções reais de m variáveis reais, (com m inteiro positivo), isto é, funções cujo contradomı́nio é ainda um subconjunto de R mas cujo domı́nio é uma parte do conjunto Rm = R × R × · · · × R (produto cartesiano de m factores todos iguais a R). As funções deste tipo são também designadas por funções reais de variável vectorial (expressão relacionada com a designação de vectores, dada correntemente aos elementos de Rm). Mais geral- mente ainda, vários aspectos do nosso estudo incidirão sobre funções vectoriais de variável vectorial (funções com domı́nio A ⊂ Rm e contradomı́nio B ⊂ Rn , com m e n inteiros positivos). Neste quadro geral, estudaremos várias noções fundamentais — como as de limite e continuidade — e abordaremos o estudo do cálculo diferencial, bem como algumas das suas aplicações mais importantes. Recordemos que, antes de iniciarmos o estudo das funções reais de uma variável real, tivemos necessidade de organizar convenientemente os nossos conhecimentos sobre o próprio conjunto R; da mesma forma, teremos agora de começar por estruturar de forma adequada o conjunto Rm, para que possamos assentar numa base sólida o estudo que vamos empreender. Esse trabalho será feito no Caṕıtulo 2, dedicando-se os restantes parágrafos deste caṕıtulo à consideração de exemplos e 7 Caṕıtulo 1. Generalidades e primeiros exemplos bissectrizes dos quadrantes pares e dos quadrantes ı́mpares, e que não con- tém o eixo das abcissas (os lados dos ângulos referidos pertencem ainda ao domı́nio, mas não o seu vértice comum). 4. Convém observar que, tal como no caso das funções de uma só variável, para definir uma função de duas variáveis reais não é necessário dar uma expressão anaĺıtica. Assim, por exemplo, definir-se-ia também uma função de duas variáveis reais por meio de qualquer dos enunciados seguintes: (a) Seja f a função definida em R2 e tal que f(x, y) = 0 se x e y são números inteiros f(x, y) = 1 se x ou y não são inteiros. Ter-se-ia, por exemplo: f(1,−5) = 0, f(2, 1/3) = f(π, √ 2) = 1, etc. (b) Seja g a função cujo domı́nio é o ćırculo definido pela desigualdade x2 + y2 ≤ 4 e tal que g(x, y) = √ 1− x2 − y2 se x2 + y2 < 1 e g(x, y) = 0 se 1 ≤ x2 + y2 ≤ 4. Adiante faremos mais algumas referências às funções mencionadas neste exemplo, a propósito da noção de gráfico de uma função de duas variáveis reais, considerada no parágrafo seguinte. 1.3 Gráficos e linhas de ńıvel Consideremos no «espaço ordinário» um referencial cartesiano ortonormado. Por um processo bem conhecido, cada ponto P do espaço determina então um terno ordenado de números reais (x, y, z), designados respectivamente por abcissa, or- denada e cota do ponto P ; reciprocamente, cada terno ordenado de números reais — isto é, cada elemento de R3 — determina um ponto do espaço ordinário. Assim, fixado um referencial, fica estabelecida uma bijecção entre o conjunto R3 e o espaço ordinário, considerado como conjunto de pontos. Nestas condições, sendo z = f(x, y) uma função de duas variáveis reais, de- finida num conjunto A ⊂ R2, chama-se gráfico da função f no referencial con- siderado o conjunto de todos os pontos (x, y, z) cujas coordenadas verificam a condição z = f(x, y) (poderia também dizer-se que o gráfico de f é o conjunto de todos os pontos da forma ( x, y, f(x, y) ) , com (x, y) ∈ A). 10 1.3. Gráficos e linhas de ńıvel PSfrag replacements z y x P (x, y, z) Figura 1.3 Trata-se, como é evidente, de uma generalização natural da noção de gráfico bem conhecida para as funções de uma variável real. No caso destas funções, os gráficos eram geralmente «linhas» (pelo menos se as funções consideradas tivessem «regularidade» suficiente). Para funções de duas variáveis os gráficos serão, na generalidade dos casos que nos interessará considerar, «superf́ıcies», contidas no espaço ordinário. Na Fig. 1.4 tenta-se dar uma ideia do gráfico da função z = x2+y2, considerada em 1.2, no exemplo 1. A superf́ıcie em causa é um parabolóide de revolução, que pode obter-se fazendo rodar em torno do eixo dos z a parábola situada no plano dos yz e cuja equação neste plano é z = y2. PSfrag replacements z y x z = x 2 + y 2 Figura 1.4 Na Fig. 1.5 esboça-se o gráfico da função g, do exemplo 4. b) de 1.2. Trata-se de uma superf́ıcie em forma de «chapéu», cuja «aba» é a coroa circu- PSfrag replacements z y x Figura 1.5 11 Caṕıtulo 1. Generalidades e primeiros exemplos lar situada no plano xy e definida pela condição: 1 ≤ x2 + y2 ≤ 4, isto é, a coroa limitada pelas circunferências de centro na origem e raios iguais a 1 e 2, (observe-se que nos pontos desta coroa circular, a função z = g(x, y) assume sempre o valor 0, o que significa que toda esta parte do gráfico está situada no plano xy). A parte restante do gráfico é um hemisfério, intersecção da superf́ıcie esférica de equação x2 + y2 + z2 = 1 com o «semi-espaço superior», isto é, com o conjunto dos pontos de cota positiva. Por último, consideremos a função f , definida no exemplo 4. a). O conjunto de pontos que constitui o seu gráfico não é propriamente uma superf́ıcie: o gráfico é formado por todos os pontos de um plano paralelo ao plano xy e situado uma unidade acima deste (plano cuja equação é z = 1), com excepção dos que têm por abcissa e por ordenada números inteiros, cada um dos quais é «substitúıdo» pela sua projecção ortogonal sobre o plano xy. Notaremos agora que, embora seja bastante natural, a representação gráfica das funções de duas variáveis reais que temos estado a considerar tem o inconveni- ente de exigir o recurso a modelos tridimensionais que, quando representados em perspectiva numa folha de papel se tornam bastante menos sugestivos e mais dif́ı- ceis de interpretar (como o provam algumas das figuras insertas neste parágrafo). Por vezes, pode obter-se uma representação plana mais esclarecedora a respeito do gráfico de uma função de duas variáveis recorrendo às chamadas «linhas de ńıvel», usadas correntemente nas cartas topográficas para indicar a altitude dos terrenos figurados. A ideia de uma tal representação é muito simples; sugeri-la-emos através de um exemplo, o da função z = x2 + y2, cujo gráfico esboçámos na Fig. 1.4. Se intersectarmos esse gráfico com planos paralelos ao plano xy e de cotas po- sitivas (isto é, com planos de equação z = c, com c constante positiva), obteremos circunferências de raio tanto maior quanto maior for a cota do plano secante. x y z = 0 z = 1 1 z = 2 √ 2 z = 3 √ 3 z = 4 2 Figura 1.6 12 1.4. Exemplos de funções para representar as variáveis x, y, z e u). Em tais casos pode ser útil recorrer à representação de «funções parciais», obtidas por fixação de algumas das variáveis. Assim por exemplo, para estudar a função z = x2 + y2 + t2 pode observar-se que, para t = 0, a função parcial correspondente, z = x2 + y2 , tem por gráfico o parabolóide representado na Fig. 1.4; para t = 1, o gráfico da função parcial z = x2 + y2 + 1 é também um parabolóide, obtido do anterior por translação de uma unidade na direcção e sentido do eixo dos z, etc.. Deve, no entanto, observar-se que, embora a representação geométrica se torne menos cómoda e também menos útil no caso das funções de m variáveis reais, com m > 2, o estudo da teoria destas funções por via anaĺıtica se reduz quase sempre a uma generalização simples e directa da teoria correspondente para as funções de duas variáveis; em contrapartida, como teremos oportunidade de ver na sequência, a passagem de uma a duas variáveis «independentes» introduz, de facto, novas situações e algumas dificuldades em vários aspectos da teoria. 15 Caṕıtulo 1. Generalidades e primeiros exemplos 16 Caṕıtulo 2 Estruturação algébrica e topológica de Rm. Sucessões 2.1 O espaço vectorial Rm; produto interno, norma e distância Sendo m um número inteiro positivo, os elementos do conjunto Rm são, como sabemos, todas as sequências1 (ou sucessões finitas) de m números reais, repre- sentáveis na forma: x = (x1, x2, . . . , xm), com x1, x2, . . . , xm ∈ R. Como resulta da própria definição de sequência, se x = (x1, x2, . . . , xm) e y = (y1, y2, . . . , ym) são dois elementos de Rm, a igualdade x = y é verificada sse o forem conjuntamente as m igualdades: x1 = y1, x2 = y2, . . . , xm = ym. Assim, cada elemento x = (x1, x2, . . . , xm) ∈ Rm determina, de forma uńıvoca, cada uma das suas coordenadas, x1, x2, . . . , xm (designadas, respectivamente, por 1a, 2a, . . . , macoordenada de x). Nestas condições, fixado m ∈ N1, para cada inteiro positivo j ∈ {1, 2, . . . ,m}, convencionaremos chamar projecção de ordem j e designar por pj a aplicação de Rm em R que faz corresponder a cada x ∈ Rm a sua ja coordenada: p1(x) = x1, . . . , pm(x) = xm, se x = (x1, . . . , xm). Por exemplo, no caso m = 3 (e portanto com x ∈ R3) os números reais p1(x), p2(x) e p3(x) corresponderiam respectivamente à abcissa, à ordenada e à cota do ponto do «espaço ordinário» identificado com o elemento x (cf. 1.3). Convém-nos agora introduzir no conjunto Rm uma operação binária — cha- mada adição — definida pela forma seguinte: sendo x = (x1, x2, . . . , xm) e 1Recorde-se que, sendo A um conjunto qualquer, uma sequência de m elementos de A é qualquer aplicação do conjunto dos m primeiros inteiros positivos, {1, 2, . . . ,m}, no conjunto A; a sequência que transforma cada inteiro positivo j (com 1 ≤ j ≤ m) no elemento aj de A é usualmente representada por (a1, a2, . . . , am). 17 Caṕıtulo 2. Estruturação de Rm. Sucessões implique α1 = β1, α2 = β2, . . ., αk = βk) diz-se que os vectores u1,u2, . . . ,uk constituem uma base do espaço vectorial considerado. Usando esta terminologia, corrente em Álgebra Linear, poderia dizer-se que os vectores e1, e2, . . . ,em constituem uma base do espaço vectorial Rm (será útil, como exerćıcio, justificar cuidadosamente esta afirmação). Deve observar-se que o espaço Rm tem infinitas outras bases; aquela a que nos referimos especialmente costuma ser designada por base canónica de Rm. Introduziremos agora a segunda das operações de «multiplicação» a que an- teriormente fizemos referência. Sendo x,y ∈ Rm, x = (x1, x2, . . . , xm) e y = (y1, y2, . . . , ym), chama-se produto interno de x e y ao número real x · y = x1y1 + x2y2 + · · ·+ xmym. Assim, por exemplo, ter-se-á, para i, j ∈ {1, 2, . . . ,m}. ei · ej = { 1 se i = j 0 se i 6= j. Verificam-se sem qualquer dificuldade as seguintes propriedades do conceito de produto interno: para qualquer α ∈ R e quaisquer x,y, z ∈ Rm, P1) x · y = y · x P2) (x + y) · z = x · z + y · z e x · (y + z) = x · y + x · z P3) (αx) · y = α(x · y) = x · (αy) P4) 0 · 0 = 0 e, para qualquer x 6= 0, x · x > 0. A noção de produto interno será usada frequentemente na sequência deste curso; neste momento, convém-nos utilizá-la para introduzir um outro conceito, fundamental em tudo o que segue: a norma de um vector de Rm, generalização da noção de módulo de um número real (ou da de módulo — ou comprimento — de um vector, no sentido considerado na Geometria). Sendo x ∈ Rm, chamaremos norma de x e designaremos pelo śımbolo ‖x‖ , o número real: ‖x‖ = √ x · x (observe-se que, segundo P4, se tem x · x ≥ 0, para qualquer x ∈ Rm). No caso particular de x ser um vector de R2 ou R3 — x = (x1, x2) ou x = (x1, x2, x3) — interpretável, no plano ou no espaço ordinário, como um vector ~OP — a norma de x, dada por: ‖x‖ = √ x · x = {√ x21 + x 2 2 se m = 2√ x21 + x 2 2 + x 2 3 se m = 3, 20 2.1. Produto interno, norma e distância coincidirá com o módulo do vector ~OP (ou com a distância do ponto P à origem). Se m = 1, o vector x = (x1) pode identificar-se com o número real x1 e a sua norma, √ x21, coincide com o módulo do número real x1. Para números reais, sabemos bem que são verificadas as propriedades seguin- tes: M1) |x| ≥ 0 (com |x| = 0 sse x = 0) M2) |xy| = |x||y| M3) |x+ y| ≤ |x|+ |y|. Convém-nos agora ver em que medida estas propriedades são generalizáveis (através do conceito de norma) ao caso dos espaços Rm. A extensão da primeira é trivial; com efeito, se x = (x1, . . . , xm) ∈ Rm, tem-se, evidentemente: N1) ‖x‖ = √ x21 + x 2 2 + · · ·+ x2m > 0, se x 6= 0 e ‖0‖ = 0. Para tentar generalizar M2), há que considerar separadamente o produto por escalares e o produto interno. No primeiro caso, deduz-se imediatamente: ‖αx‖ = ‖α(x1, . . . , xm)‖ = ‖(αx1, . . . , αxm)‖ = √ α2x21 + · · ·+ α2x2m = |α| √ x21 + · · ·+ x2m ou N2) ‖αx‖ = |α|‖x‖. No segundo, obtém-se uma relação de grande utilidade, chamada desigualdade de Cauchy-Schwarz : |x · y| ≤ ‖x‖‖y‖, ∀x,y ∈ Rm. Esta relação pode justificar-se pela forma seguinte: sendo x e y dois vectores quaisquer de Rm, observe-se em primeiro lugar que, para qualquer α ∈ R, se tem (de acordo com a definição de norma): (x + αy) · (x + αy) = ‖x + αy‖2 ≥ 0. Por outro lado, das propriedades indicadas do produto interno logo resulta: (x + αy) · (x + αy) = x · (x + αy) + αy · (x + αy) = x · x + αx · y + αy · x + α2y · y = ‖x‖2 + 2(x · y)α+ α2‖y‖2, o que permite deduzir que, para qualquer α ∈ R, ‖y‖2α2 + 2(x · y)α+ ‖x‖2 ≥ 0. 21 Caṕıtulo 2. Estruturação de Rm. Sucessões A expressão que figura no 1o membro desta desigualdade é um trinómio do 2o grau em α (com coeficientes dependentes dos vectores dados, x e y); como é sabido, para que o trinómio aα2 + bα + c assuma valores não negativos qualquer que seja o valor real atribúıdo a α, é necessário que o seu discriminante não seja positivo (b2−4ac ≤ 0).3 Pode portanto concluir-se que se verifica necessariamente a relação: |x · y|2 − ‖x‖2‖y‖2 ≤ 0, donde imediatamente se deduz a desigualdade de Cauchy-Schwarz. No caso particular em que x e y são vectores não nulos do espaço R2 ou R3, interpretáveis como vectores no plano ou no espaço, pode verificar-se que é válida a relação4: x · y = ‖x‖‖y‖ cos θ, onde θ designa o ângulo dos dois vectores (Figura 2.1). Este facto sugere que se procure definir mais geralmente ângulo de dois vectores não nulos do espaço Rm, x e y, como sendo o número real: θ = arccos x · y ‖x‖‖y‖ . Contudo, não seria leǵıtimo adoptar esta definição se não estivesse assegu- rado que (para x,y 6= 0) a expressão x · y ‖x‖‖y‖ assume apenas valores do intervalo [−1, 1]; esta garantia resulta imediata- mente da desigualdade de Cauchy-Schwarz. 0 x Py Q θ Figura 2.1 É útil mencionar que, quando o produto interno de x e y é nulo (o que se passa se algum desses vectores é igual a 0, ou se o seu ângulo é 3Convém notar que a afirmação é correcta, mesmo na hipótese de ser nulo o coeficiente de α2. 4Com referencial ortonormado; não sendo o referencial ortonormado, a relação mantém-se, mas o produto interno de x e y não pode ser definido pela fórmula que indicámos. 22 2.1. Produto interno, norma e distância cujos «vectores» são funções cont́ınuas, funções diferenciáveis, funções inte- gráveis, etc.) podem introduzir-se de maneira natural noções de norma ou de distância, a partir das quais são generalizáveis em grande parte a esses espaços os conceitos e os resultados mais significativos que aqui estudare- mos apenas para os espaços Rm. Nomeadamente, no quadro bastante geral dos espaços normados, pode estruturar-se um cálculo diferencial análogo ao que vamos estudar neste curso e que o contém como caso muito particular. E o mais interessante é que, longe de constituirem meras especulações de interesse puramente teórico, essas generalizações da teoria das funções de variável real — que constituem um dos objectos de um ramo da Matemá- tica chamado Análise funcional — são suscept́ıveis de aplicações de grande alcance na F́ısica, na Engenharia e em diversos outros domı́nios da Ciência e da Técnica. Recorrendo à noção de norma (tal como no caso de R recorremos à de mó- dulo) ou, se preferirmos, à de distância, podemos agora introduzir em Rm vários conceitos fundamentais, que darão uma base sólida para o nosso estudo do cálculo diferencial em Rm. Esse trabalho será feito, em grande parte, nos parágrafos se- guintes deste caṕıtulo, reservando-se a parte restante do presente parágrafo apenas à generalização a Rm da noção de vizinhança de um número real. Recordemos que, em R, designámos por vizinhança  de um ponto a (a ∈ R,  > 0) o conjunto de todos os reais x tais que |x− a| < . Numa ordem de ideias semelhante, sendo agora a = (a1, a2, . . . , am) ∈ Rm e  um número real positivo, chamaremos bola (ou bola aberta) de centro a e raio  ao conjunto de todos os x ∈ Rm tais que ‖x − a‖ < ; para designar este conjunto usaremos o śımbolo B(a). Eventualmente faremos também referência à bola fechada de centro a e raio , conjunto de todos os pontos x de Rm tais que ‖x− a‖ ≤ . Para m = 1 (e a ∈ R, portanto) B(a) é precisamente a vizinhança  de a já conhecida, representável na recta por um segmento (privado dos extremos) com centro no ponto a e comprimento 2; para n = 2 [ou n = 3] e a = (a1, a2) [ou a = (a1, a2, a3)], a imagem geométrica de B(a) é o circulo «aberto» [ou a esfera «aberta»] de centro a e raio , isto é o conjunto de todos os pontos do plano [ou do espaço] cuja distância ao ponto a é menor do que . Com a ∈ Rm e sendo  e ′ dois reais positivos tais que  < ′, tem-se, como é evidente, B(a) ⊂ B′(a). É também fácil verificar que qualquer bola de Rm é um conjunto infinito e ainda que a intersecção de todas as bolas centradas no ponto a é o conjunto formado apenas por este ponto, {a} (o qual, porém, não é uma bola). Observemos finalmente que, sendo a, b ∈ Rm e a 6= b, é sempre posśıvel determinar uma bola centrada em a, B(a), e outra bola centrada em b, Bδ(b), que sejam disjuntas (bastará escolher os reais positivos δ e  por forma que δ +  ≤ ‖b− a‖). Na estruturação de alguns conceitos fundamentais da Análise em Rm — por exemplo, o de limite — as «bolas» acabadas de definir desempenharão natural- mente o papel que coube às «vizinhanças», no caso de R. Vê-lo-emos já no pará- grafo seguinte, no que respeita à noção de limite de uma sucessão, e no próximo 25 Caṕıtulo 2. Estruturação de Rm. Sucessões caṕıtulo, ao estudarmos limites e continuidade para funções mais gerais. Além disso, no parágrafo final deste caṕıtulo, a noção de bola será também utilizada para a definição de diversos conceitos de natureza «topológica», indispensáveis no estudo do cálculo infinitesimal para funções de mais de uma variável real. Convém no entanto deixar aqui registado que, no quadro dos espaços métricos, o termo vizinhança é usado numa acepção muito mais geral do que aquela a que acabamos de referir-nos. Concretamente, sendo E um espaço métrico e a um elemento de E, chama-se vizinhança de a a qual- quer conjunto V ⊂ E que contenha alguma bola de centro a; assim, V é vizinhança de a sse existe  > 0 tal que B(a) ⊂ V (B(a) é , por definição o conjunto de todos os elementos x ∈ E tais que d(x,a) < , sendo d a função distância considerada no espaço métrico E). Neste texto, porém, só bastante mais adiante teremos necessidade de utilizar esta noção mais geral de vizinhança, e mesmo assim apenas no quadro do espaço Rm. 2.2 Sucessões em Rm Comecemos por recordar que, sendo A um conjunto qualquer, se chama sucessão em A (ou sucessão de termos em A) a qualquer aplicação do conjunto N1, dos inteiros positivos, no conjunto A. Se u1 u2 . . . un . . . é uma sucessão em Rm, e se, para cada inteiro positivo j ≤ m, designarmos por unj a ja coordenada de un (isto é, se pusermos pj(un) = unj), ter-se-á: u1 = (u11, u12, . . . , u1m) u2 = (u21, u22, . . . , u2m) · · · un = (un1, un2, . . . , unm) · · · Assim, cada sucessão em Rm determina m sucessões de termos reais, a que cha- maremos sucessões coordenadas da sucessão dada; mais precisamente, a sucessão numérica: u1j u2j . . . unj . . . é a sucessão coordenada de ordem j da sucessão un considerada (1 ≤ j ≤ m).5 Por exemplo, para a sucessão em R2 vn = ( 1 n , n ) 5Já sabemos que só como «abuso de notação» pode aceitar-se o uso do śımbolo un — que designa o termo de ordem n da sucessão, isto é, o valor por ela assumido no ponto n — para designar a própria sucessão. 26 2.2. Sucessões em Rm as sucessões coordenadas são vn1 = 1 n e vn2 = n. Estendem-se naturalmente às sucessões em Rm as operações algébricas defini- das no parágrafo 2.1. Assim, sendo un e vn sucessões em Rm e α ∈ R, a soma de un e vn e o produto de α por un são, respectivamente, as sucessões em Rm: u1 + v1 u2 + v2 . . . un + vn . . . e αu1 αu2 . . . αun . . . e o produto interno de un e vn é a sucessão de termos reais: u1 · v1 u2 · v2 . . . un · vn . . . Introduziremos agora a seguinte definição, que generaliza de forma inteira- mente natural uma outra bem conhecida do estudo das sucessões reais: Seja un uma sucessão em Rm e u um vector de Rm; diz se que un tende ou converge para u — e escreve-se un → u — sse, qualquer que seja a bola centrada em u, B(u), existe um inteiro positivo p tal que un ∈ B(u) para todo o n > p. Reconhece-se sem dificuldade que esta definição poderia também ser formu- lada, equivalentemente, de qualquer dos modos seguintes: • un converge para u sse, para todo o  > 0 existe p tal que n > p ⇒ ‖un − u‖ < ; ou: • un converge para u sse a sucessão real ‖un − u‖ converge para 0. Por exemplo, a sucessão em R3: un = ( n− 1 n , 0, 1 3n ) converge para o vector e1 = (1, 0, 0). Para o reconhecer, basta notar que: ‖un − e1‖ = √ 1 n2 + 1 32n é um infinitésimo. Naturalmente, diz-se que uma sucessão em Rm, un, é convergente sse existe u ∈ Rm tal que un → u. Antes de prosseguir, convém fazer uma observação simples, que nos facilitará a obtenção de resultados posteriores. 27 Caṕıtulo 2. Estruturação de Rm. Sucessões Supondo un = (un1, . . . , unm) e j ∈ {1, . . . ,m}, da primeira das desigualdades: |unj| ≤ ‖un‖ ≤ |un1|+ · · ·+ |unm| infere-se que, se un é limitada, qualquer das suas sucessões coordenadas é uma sucessão limitada (em R); da segunda resulta que, sendo todas as sucessões coor- denadas limitadas, un é limitada. Portanto: Teorema 2.2. Para que uma sucessão em Rn seja limitada é necessário e sufici- ente que o seja cada uma das suas sucessões coordenadas. Por exemplo, em R3, é limitada a sucessão: un = ( log n n , ( 1 + 1 n )n , (−1)n ) e não o é vn = ( e−n, 2,−n ) . Sabemos bem que, em R, as sucessões convergentes são limitadas. Seja agora un uma sucessão convergente em Rm. Pelo Teorema 2.1, todas as sucessões co- ordenadas de un são sucessões (reais) convergentes, e portanto limitadas; daqui, pelo Teorema 2.2, pode concluir-se que un é limitada. Assim, também em Rm, as sucessões convergentes são necessariamente limitadas. Um outro resultado importante que nos será necessário na sequência (em par- ticular, no estudo de propriedades fundamentais das funções cont́ınuas) é o que se exprime no seguinte: Teorema 2.3 (Bolzano--Weierstrass). Qualquer sucessão limitada (em Rm) tem subsucessões convergentes. Demonstração. Para maior simplicidade e clareza, faremos a demonstração para o caso de sucessões em R2, sendo óbvio que a mesma ideia essencial permite demonstrar a proposição no caso geral (mesmo assim, poderá ser útil ler, antes da demonstração, o exemplo que se lhe segue). Sendo un = (un1, un2) uma sucessão limitada, serão também limitadas as su- cessões reais un1 e un2 (Teorema 2.2). Nestas condições, o teorema de Bolzano- -Weierstrass (estudado já para o caso de sucessões reais) permite extrair de un1 uma subsucessão convergente, up11 up21 . . . upn1 . . . Consideremos a subsucessão de un: (up11, up12) (up21, up22) . . . (upn1, upn2) . . . , para a qual a la sucessão coordenada é convergente e a 2a é limitada (por ser subsucessão de un2). Novo recurso ao teorema de Bolzano--Weierstrass (caso 30 2.2. Sucessões em Rm real) permite extrair desta última sucessão numérica limitada uma subsucessão convergente: uq12 uq22 . . . uqn2 . . . Nestas condições, mostra o Teorema 2.1 que a subsucessão de un: (uq11, uq12) (uq21, uq22) . . . (uqn1, uqn2) . . . cujas sucessões coordenadas são ambas convergentes (a 2a por construção, a 1a por ser subsucessão de uma sucessão convergente) é necessariamente convergente, o que termina a demonstração. Exemplo: Para cada n ∈ N1, designemos por rn o resto da divisão inteira de n por 3 (r1 = 1, r2 = 2, r3 = 0, etc.) e consideremos a sucessão limitada (em R2): un = ( rn, (−1)n + 1 n ) . Para obter uma subsucessão convergente de un, pode começar-se por deter- minar uma subsucessão convergente de rn, por exemplo, r3n, que tem todos os termos nulos; ter-se-á então: u3n = ( 0, (−1)3n + 1 3n ) . A 2a sucessão coordenada de u3n não é convergente, mas pode extrair-se dela uma subsucessão convergente, por exemplo considerando apenas os valores de n para os quais o expoente de (−1)3n é par (e portanto múltiplo de 6, visto que já o era de 3). Obtém-se assim a subsucessão u6n de un: u6n = ( 0, 1 + 1 6n ) , que é evidentemente convergente. Trataremos agora de definir o conceito de sucessão de Cauchy, no quadro das sucessões de termos em Rm. Naturalmente, diremos que uma tal sucessão, un, é uma sucessão de Cauchy (ou uma sucessão fundamental) sse, qualquer que seja  > 0 existe p tal que, sempre que os inteiros positivos r e s sejam maiores do que p, se tenha: ‖ur − us‖ < . Supondo un = (un1, . . . , unm), poderemos deduzir (de modo idêntico ao que usámos já por duas vezes) das desigualdades: |urj − usj| ≤ ‖ur − us‖ ≤ |ur1 − us1|+ · · ·+ |urm − usm|, 31 Caṕıtulo 2. Estruturação de Rm. Sucessões que a sucessão un é fundamental sse o forem todas as suas sucessões coordenadas. Finalmente, tendo em conta, além deste resultado e do Teorema 2.1, o facto bem conhecido de que uma sucessão de termos reais é convergente sse é fundamental, conclui-se imediatamente que, para que uma sucessão em Rm seja convergente é necessário e suficiente que seja fundamental. Finalizaremos este parágrafo com uma breve referência ao conceito de série de termos em Rm. Diremos naturalmente que a série ∞∑ n=1 un = u1 + u2 + · · ·+ un + · · · (com un ∈ Rm qualquer que seja n) é convergente sse o for a sucessão sn = u1 + u2 + · · · + un; em caso de convergência, chamaremos soma da série ao limite de sn. Diremos ainda que a série ∑ un é absolutamente convergente sse for convergente a série de termos reais ∑ ‖un‖. Pondo, para cada j ∈ {1, 2, . . . ,m}, pj(un) = unj (isto é, designando por unj a sucessão coordenada de ordem j da sucessão un), reconhece-se imediatamente que ∑ un é convergente e tem por soma s = (s1, s2, . . . , sm) sse cada uma das séries ∑ unj converge e tem por soma sj ; e também que∑ un é absolutamente convergente sse o forem todas as séries ∑ unj . Assim, o estudo de uma série de termos em Rm reduz-se trivialmente ao de séries de termos reais, sendo imediata a extensão ao novo quadro de resultados obtidos em estudos anteriores. Eis alguns exemplos, cuja justificação (a partir de resultados conhecidos relativos a séries de termos reais) constituirá um simples exerćıcio: • Se a série (de termos em Rm) ∑ un é convergente, un converge para 0. • ∑ un é convergente sse, qualquer que seja  > 0 existe p tal que, sempre que s > r ≥ p, se tenha ‖ur + ur+1 + · · ·+ us‖ < . • É convergente qualquer série de termos em Rm que convirja absoluta- mente. • A série ∑ un é absolutamente convergente se existe uma série conver- gente de termos reais, ∑ an, tal que (a partir de alguma ordem) se tenha ‖un‖ ≤ an. 2.3 Noções topológicas em Rm No estudo de diversos temas subsequentes — limites, continuidade, cálculo dife- rencial para funções de mais de uma variável real — intervirão significativamente certas caracteŕısticas dos subconjuntos de Rm em que as funções consideradas se suporão definidas (recordemos por exemplo, que, para funções cont́ınuas definidas 32 2.3. Noções topológicas em Rm é usualmente designada pelo śımbolo X̄: X̄ = intX ∪ frontX, e coincide, portanto, com o complementar do exterior de X. Aos elementos de X̄ chama-se pontos aderentes ao conjunto X, sendo fácil reconhecer que, para que a ∈ Rm seja aderente ao conjunto X é necessário e suficiente que qualquer bola centrada em a tenha pelo menos um ponto comum com o conjunto X (B(a) ∩X 6= ∅, para todo o  > 0). Uma outra caracterização dos pontos aderentes é facultada no seguinte: Teorema 2.4. Seja X ⊂ Rm e a ∈ Rm; a é aderente a X sse existe uma sucessão un de termos em X que converge para a. Demonstração. Se existe uma sucessão em X convergente para a, é óbvio que qualquer bola centrada em a contém pelo menos um ponto de X, isto é, que a ∈ X̄. Em sentido inverso, se a ∈ X̄, para todo o  > 0 tem-se B(a) ∩X 6= ∅; escolhendo arbitrariamente um ponto un em B 1 n (a)∩X, para n = 1, 2, . . . , obtém- se uma sucessão em X que converge para a, visto que para todo o n se tem ‖un − a‖ < 1/n. A aderência de um conjunto X foi definida como reunião de dois con- juntos disjuntos: o interior de X e a fronteira de X. Há uma outra maneira, também significativa, de decompor X̄ como reunião de dois conjuntos dis- juntos: um deles é o conjunto dos pontos de acumulação do conjunto X — ou derivado de X, designado por X ′ — o outro o conjunto dos seus pontos isolados. Antes de dar as definições formais, recordemos o exemplo do subconjunto L = [0, 1[ ∪ {2}, em R, cuja aderência é o conjunto L̄ = [0, 1] ∪ {2}, e observemos o seguinte: para o ponto 2, existe uma bola centrada neste ponto na qual ele é o único elemento do conjunto L (é o que se passa em qualquer «bola» ]2−, 2+[, desde que seja 0 <  ≤ 1); para qualquer outro ponto a ∈ L, verifica-se que, para todo o  > 0, há elementos do conjunto L distintos de a, em ]a− , a+ [. De acordo com as definições subsequentes, poderemos dizer que o ponto 2 é um ponto isolado de L e que todos os pontos de [0, 1] são pontos de acumulação do mesmo conjunto. Em geral, sendo X ⊂ Rm e a ∈ X̄, diremos que a é um ponto isolado do conjunto X sse existe  > 0 tal que B(a) não contém qualquer elemento de X distinto de a (é fácil ver que, nesta hipótese, se tem necessariamente a ∈ X pois, de contrário não seria a ∈ X̄); e diremos que a é ponto de acumulação de X no caso oposto, isto é, se qualquer bola centrada em a tem pelo menos um ponto de X distinto de a (claro que, neste caso, pode ser a ∈ X ou a /∈ X). O conjunto dos pontos de acumulação de X é, por definição, o deri- vado X ′, do conjunto X. Reconhece-se facilmente que, para que a ∈ X ′, é 35 Caṕıtulo 2. Estruturação de Rm. Sucessões necessário e suficiente que qualquer bola centrada em a contenha infinitos elementos do conjunto X (se nalguma de tais bolas houvesse apenas um nú- mero finito de elementos de X : x1,x2, . . . ,xk, designando por  o mı́nimo das distâncias ao ponto a de cada um desses elementos — com exclusão do próprio ponto a, se fosse um deles — logo se vê que B(a) não conteria qualquer ponto de X distinto de a). Os pontos de acumulação de um conjunto podem caracterizar-se de modo análogo ao expresso no Teorema 2.4 para os pontos aderentes; enun- ciaremos essa caracterização no seguinte teorema, cuja demonstração, intei- ramente análoga à do Teorema 2.4, poderá ficar como exerćıcio: Teorema 2.4’. Seja X ⊂ Rm e a ∈ Rm; a é ponto de acumulação de X sse existe uma sucessão em X, de termos distintos de a, que converge para a. É fácil verificar que, em Rm, qualquer ponto interior de um conjunto é ponto de acumulação do mesmo conjunto (para o reconhecer, basta recordar que qualquer bola é um conjunto infinito): intX ⊂ X ′, para todo o X ⊂ Rm; dáı resulta imediatamente (dado que a reunião de X ′ com o conjunto dos pontos isolados de X coincide com a reunião do interior com a fronteira do mesmo conjunto) que qualquer ponto isolado de X pertence à fronteira de X. É óbvio que qualquer ponto interior a um conjunto X ⊂ Rm pertence necessa- riamente ao conjunto X e também que qualquer ponto do conjunto X não pode ser exterior a X, pertencendo, portanto, a X̄. Assim, qualquer que seja X ⊂ Rm, verificam-se necessariamente as relações: intX ⊂ X ⊂ X̄. Pode, em particular, suceder que um conjunto X coincida com o seu interior (isto é, que nenhum dos seus pontos fronteiros lhe pertença: frontX ⊂ C(X)); ou que coincida com a sua aderência (o que se passa se pertencerem a X todos os seus pontos fronteiros: frontX ⊂ X). No primeiro caso, diz-se que X é um conjunto aberto, no segundo que é um conjunto fechado. Os conjuntos abertos e os conjuntos fechados são, portanto, respectivamente caracterizados pelas igualdades: intX = X e X̄ = X. As noções de conjunto aberto e conjunto fechado têm grande interesse, como veremos na sequência. É fácil ver que, em Rm, qualquer bola aberta é um conjunto aberto e qualquer bola fechada é um conjunto fechado. Para verificar que B(a) é um conjunto aberto (qualquer que seja o ponto a ∈ Rm e o número positivo ) basta reconhecer que, se b for um ponto arbitrário de B(a), existe uma bola centrada em b, Bδ(b), contida em B(a); ora para que tal se verifique basta escolher δ por forma que se tenha 0 < δ ≤  − ‖b − a‖ (o 36 2.3. Noções topológicas em Rm que é posśıvel visto que, por ser b ∈ B(a), se tem ‖b − a‖ < ). Na realidade, escolhido δ desta forma, ter-se-á, para qualquer x ∈ Bδ(b), ‖x− a‖ = ‖(x− b) + (b− a)‖ ≤ ‖x− b‖+ ‖b− a‖ < δ + ‖b− a‖ ≤ , o que mostra que x ∈ B(a) e portanto que Bδ(b) ⊂ B(a). Por outro lado, para reconhecer que a bola fechada de centro a e raio  — que, de momento, designaremos por B∗ (a) — é um conjunto fechado, será suficiente verificar que qualquer ponto c que não pertença a essa bola não lhe pode ser aderente (e ser-lhe-á portanto exterior). Ora se c /∈ B∗ (a), isto é se ‖c− a‖ > , escolhido λ tal que 0 < λ < ‖c− a‖ − , ter-se-á B∗ (a) ∩ Bλ(c) = ∅ visto que, se existisse um ponto x ∈ B∗ (a) ∩Bλ(c) deveria ter-se: ‖c− a‖ ≤ ‖c− x‖+ ‖x− a‖ < λ+  < ‖c− a‖ o que é absurdo. Pode assim concluir-se que c é exterior a B∗ (a) e portanto que este conjunto é fechado. Exprimem-se no teorema seguinte algumas propriedades importantes da noção de conjunto aberto. Teorema 2.5. i) A reunião de qualquer famı́lia (finita ou infinita) de conjuntos abertos é um conjunto aberto. ii) A intersecção de qualquer famı́lia finita de conjuntos abertos é um conjunto aberto. Demonstração. i) Seja {Ai}i∈I uma famı́lia qualquer de conjuntos abertos, A =⋃ i∈I Ai a sua reunião. Por definição de reunião, se x é um ponto qualquer de A poderá escolher-se um ı́ndice j ∈ I tal que x ∈ Aj; como Aj é aberto, por hipótese, existirá  > 0 tal que B(x) ⊂ Aj. Segue-se que B(x) ⊂ A (visto que Aj ⊂ A) o que mostra que x é interior a A, e portanto que A é aberto. ii) Seja {A1, A2, . . . , An} uma famı́lia finita de conjuntos abertos e seja agora A = A1∩A2∩. . .∩An. Se for A = ∅ é claro que A será aberto (visto que int ∅ = ∅). De contrário, sendo x um ponto qualquer do conjunto A (que pertencerá portanto a cada um dos conjuntos abertos A1, . . . , An) existirão necessariamente números positivos 1, . . . , n tais que B1(x) ⊂ A1, . . . , Bn(x) ⊂ An. Se for então  = min{1, . . . , n} ter-se-á também B(x) ⊂ A1, . . . , B(x) ⊂ An e portanto B(x) ⊂ A1 ∩ . . . ∩ An = A, o que prova que A é aberto. 37 Caṕıtulo 2. Estruturação de Rm. Sucessões Suponha-se agora que X não é limitado ou não é fechado (podendo evidente- mente não ser uma coisa nem outra). Se X não for limitado para todo o n ∈ N1 poderá escolher-se un ∈ X tal que ‖un‖ > n; obter-se-á assim uma sucessão que não terá qualquer subsucessão limitada nem, portanto, qualquer subsucessão con- vergente. Se X não for fechado, escolhido um ponto a ∈ X̄ \ X, existirá (pelo Teorema 2.4) uma sucessão un de termos em X convergente para a. Tal sucessão não poderá ter qualquer subsucessão convergente para um ponto de X (visto que todas as suas subsucessões convergem para a /∈ X). Na sequência, diremos que um conjunto X ⊂ Rm é compacto sse for limitado e fechado. Diz-se por vezes que um conjunto X é sequencialmente compacto sse é verificada a propriedade seguinte: qualquer sucessão de termos em X tem uma subsucessão que converge para um ponto de X. Assim, poderia exprimir-se o enunciado do precedente Teorema 2.9 dizendo que, em Rm um conjunto é compacto sse for sequencialmente compacto. Teremos oportunidade de ver posteriormente que algumas das proprie- dades mais importantes das funções cont́ınuas num conjunto compacto de R — tais como a continuidade uniforme (teorema de Heine--Cantor), a existência de máximo e mı́nimo (teorema de Weierstrass) — se generali- zam facilmente ao caso de funções reais, cont́ınuas num conjunto compacto de Rm (naturalmente, haverá que definir de forma adequada a noção de continuidade para tais funções). Uma outra propriedade importante — que nos parece útil referir, em- bora não nos vá ser necessária na sequência — é a seguinte: qualquer conjunto compacto e infinito tem pelo menos um ponto de acumulação (decerto pertencente ao conjunto, por este ser fechado). Mais geralmente, pode provar-se que qualquer conjunto infinito e limitado tem pelo menos um ponto de acumulação (pertencente ou não ao conjunto). Este resultado, que pode deduzir-se sem dificuldade do Teorema 2.3, é também correntemente designado por «teorema de Bolzano--Weierstrass». Para finalizar este parágrafo, introduziremos outra noção topológica impor- tante (que, em particular, nos permitirá generalizar para funções cont́ınuas de mais de uma variável real o «teorema do valor intermédio»); trata-se da noção de conjunto conexo. A ideia intuitiva de conjunto conexo é a de conjunto formado por «uma só peça» (e não por diversas «peças separadas»). Por exemplo, po- derá ver-se que (em R) o intervalo [0, 1] é um conjunto conexo, mas já não o é o seu complementar. No plano, um ćırculo ou uma circunferência são conjuntos conexos, tal como o complementar de um ćırculo; não é conexo o complemen- tar de uma circunferência, formado por «duas peças», «separadas» pela própria circunferência. Antes de darmos uma definição precisa de conjunto conexo, convém introduzir a seguinte: sendo A e B dois subconjuntos não vazios de Rm, diremos que A e B são separados sse cada um destes conjuntos não contém qualquer ponto que seja 40 2.3. Noções topológicas em Rm aderente ao outro; noutros termos: os conjuntos A e B (tais que A 6= ∅ e B 6= ∅) são separados sse forem verificadas as duas igualdades: A ∩ B̄ = ∅, B ∩ Ā = ∅. É óbvio que dois conjuntos separados são necessariamente disjuntos (de B ⊂ B̄ resulta A∩B ⊂ A∩ B̄ = ∅). Mas é fácil ver que a rećıproca é falsa. Por exemplo, em R, os conjuntos disjuntos ]−1, 0[ e [0, 1] não são separados (o ponto 0, aderente ao primeiro, pertence ao segundo); em R2, o gráfico da função sen 1/x e o conjunto formado apenas pelo ponto (0, a) são disjuntos (qualquer que seja a ∈ R), mas só são separados se for |a| > 1. Seja agora X um subconjunto de Rm. Diz-se que X é um conjunto desconexo sse existirem dois conjuntos separados A e B tais que X = A ∪B. Na hipótese contrária, isto é, no caso de não existirem dois conjuntos separados A e B verificando a igualdade precedente, diz-se que X é um conjunto conexo. São exemplos triviais de conjuntos conexos, em Rm, o vazio e qualquer conjunto formado por um só ponto; não é conexo qualquer conjunto finito X, com mais de um ponto (se A for uma parte própria de X — isto é, uma parte de X não vazia e distinta de X — e B = X \A o complementar de A em X, vê-se imediatamente que A e B são conjuntos separados). No caso de R (m = 1), o conjunto dos números racionais, Q, é um conjunto desconexo: com efeito, sendo a um irracional qualquer, tem-se: Q = (Q ∩ ]−∞, a[) ∪ (Q ∩ ]a, +∞[) e é fácil ver que os conjuntos Q ∩ ]−∞, a[ e Q ∩ ]a, +∞[ são separados. É útil observar que esta mesma ideia permite reconhecer que, em R, qualquer conjunto conexo X verifica necessariamente a condição seguinte: se pertencerem ao conjunto X dois números reais a e b — com a < b — pertencerão também a esse conjunto todos os reais compreendidos entre a e b, isto é, ter-se-á: [a, b] ⊂ X (tal como no exemplo precedente, basta observar que, se algum ponto c de ]a, b[ não pertencesse a X, este conjunto seria a reunião dos conjuntos separados X ∩ ]−∞, c[ e X ∩ ]c, +∞[). Ora é fácil mostrar (e poderá ficar como exerćıcio) que os únicos subconjuntos de R que verificam a condição indicada são os intervalos. Pode assim concluir-se que, em R, qualquer conjunto conexo é um intervalo. Em sentido inverso — e embora não nos seja indispensável na sequência — provaremos agora que qualquer intervalo de R é um conjunto conexo, o que nos permite enunciar o 41 Caṕıtulo 2. Estruturação de Rm. Sucessões Teorema 2.10. Em R, os conjuntos conexos são precisamente os intervalos. Demonstração. Atendendo ao que vimos anteriormente, a demonstração poderá considerar-se terminada se mostrarmos que, sendo I um intervalo qualquer de R, a hipótese de existirem conjuntos separados A e B tais que I = A ∪B conduz necessariamente a uma contradição. Admitamos então essa hipótese e escolhamos arbitrariamente um ponto x ∈ A e um ponto z ∈ B; como A e B são disjuntos, ter-se-á necessariamente x < z ou x > z. Vamos supor que é x < z (de contrário, bastaria trocar as designações dos conjuntos A e B). Como I é um intervalo, ter-se-á [x, z] ⊂ I, pertencendo então cada ponto do intervalo [x, z] a A ou a B (e apenas a um destes conjuntos). Designemos agora por y o supremo do conjunto [x, z] ∩ A. É óbvio que y ∈ [x, z] (devendo portanto ter-se y ∈ A ou y ∈ B). Observando que, como facilmente se reconhece, o supremo de um conjunto é sempre um ponto aderente a esse conjunto, pode inferir-se que y é aderente a [x, z] ∩ A, e portanto também a A (visto que [x, z] ∩ A é um subconjunto de A). Mas, devendo ter-se Ā ∩ B = ∅, o facto de ser y ∈ Ā mostra que y /∈ B e que, portanto, y ∈ A. Pode então deduzir-se que y 6= z (visto que z ∈ B) e também que o intervalo ]y, z] não contém qualquer elemento do conjunto A (de contrário não seria y o supremo de [x, z]∩A), devendo portanto ter-se ]y, z] ⊂ B. Nestas condições, porém, y seria aderente ao conjunto B e ter-se-ia A ∩ B̄ 6= ∅, em contradição com a hipótese de A e B serem conjuntos separados. 42 3.1. Continuidade Antes de passarmos ao estudo da continuidade no quadro mais geral das fun- ções vectoriais convém fazer algumas observações. Em primeiro lugar, consideremos um conjunto qualquer D (na sequência ter- se-á quase sempre D ⊂ Rn mas por agora não há necessidade de supô-lo) e uma função f definida em D e com valores em Rm. Para cada x ∈ D o vector f(x) ∈ Rm terá m coordenadas (variáveis, em geral, quando x variar em D) que designaremos por f1(x), f2(x), . . . , fm(x). Assim, a função vectorial f determina m funções escalares definidas em D, f1, f2, . . . , fm, às quais chamaremos natural- mente funções coordenadas de f . No caso particular de D ser um subconjunto de Rn, cada vector x ∈ D é, por sua vez, uma sequência x = (x1, . . . , xn), e uma igualdade da forma: y = f(x), com x ∈ D e y = (y1, . . . , ym) ∈ Rm, poderá ser traduzida por um sistema de m igualdades: y1 = f1(x1, . . . , xn) y2 = f2(x1, . . . , xn) · · · ym = fm(x1, . . . , xn). É desta forma (em termos de coordenadas), que muitas vezes são explicitadas as funções vectoriais utilizadas nas aplicações. Um exemplo particularmente importante neste contexto é o das aplica- ções lineares de Rn em Rm. Recorde-se que uma aplicação f : Rn → Rm se diz linear sse, quaisquer que sejam os vectores u,v ∈ Rn e o escalar α, se tem: f(u + v) = f(u) + f(v) e f(αu) = αf(u). Convencionemos designar por e1, . . . , en os vectores da base canónica de Rn, por e′1, . . . , e′m os vectores da base canónica de Rm e ainda — sendo f : Rn → Rm uma aplicação linear — por aij a coordenada de ordem i do vector f(ej) (para i ∈ {1, 2, . . . ,m} e j ∈ {1, 2, . . . , n}). Dado um vector qualquer x = (x1, . . . , xn) de Rn e sendo y = (y1, . . . , ym) o valor de f em x, deduz-se imediatamente da definição de aplicação linear que deverá ter-se: y = f(x) = f  n∑ j=1 xjej  = n∑ j=1 f (xjej) = n∑ j=1 xjf (ej) , donde, atendendo a que f(ej) = m∑ i=1 aije ′ i 45 Caṕıtulo 3. Continuidade e limite resulta: y = n∑ j=1 m∑ i=1 xjaije ′ i = m∑ i=1  n∑ j=1 aijxj  e′i. Como, por outro lado, se verifica também a igualdade: y = m∑ i=1 yie ′ i, a unicidade da expressão de um vector qualquer de Rm como combinação linear dos vectores de uma base (mencionada em 2.1, quando recordámos a definição de base de um espaço vectorial real) permite deduzir que deverá ter-se, para i = 1, 2, . . . ,m: yi = n∑ j=1 aijxj . Assim, no caso de f : Rn → Rm ser uma aplicação linear, à igualdade y = f(x) corresponde (adoptadas as notações acima descritas) o sistema de equações lineares: y1 = a11x1 + a12x2 + · · ·+ a1nxn · · · ym = am1x1 + am2x2 + · · ·+ amnxn. Outra representação posśıvel é, como é sabido, a igualdade matricial: y1 y2 . . . ym  =  a11 a12 · · · a1n a21 a22 · · · a2n . . . . . . . . . . . . . . . . . . . . am1 am2 · · · amn   x1 x2 . . . xn  , que, como facilmente se reconhece, permite estabelecer uma correspondên- cia bijectiva entre as matrizes do tipo m × n de elementos reais e as apli- cações lineares de Rn em Rm (convirá reter que os elementos da coluna de ordem j da matriz correspondente à aplicação f são, ordenadamente, as coordenadas na base canónica de Rm do vector f(ej), para j = 1, . . . , n). Outro exemplo com interesse, a que nos referiremos na sequência, este de uma aplicação de Rn em si mesmo (com n > 1), é o da função — que designaremos por µ — determinada pelo sistema: y1 = x1 cosx2 · · · cosxn−1 cosxn y2 = x1 cosx2 · · · cosxn−1 senxn y3 = x1 cosx2 · · · senxn−1 · · · yn−1 = x1 cosx2 senx3 yn = x1 senx2. 46 3.1. Continuidade Como casos particulares (n = 2 e n = 3) obtêm-se as fórmulas usuais de mudança de coordenadas cartesianas em coordenadas polares, no plano, ou em coordenadas esféricas, no espaço, as quais, em notações mais correntes, podem escrever-se (ver Figura 3.2):{ x = r cos θ y = r sen θ ou  x = r cos θ cosϕ y = r cos θ senϕ z = r sen θ. r P x y θ r P z x y ϕ θ Figura 3.2 Não seria talvez necessário dizer que as operações algébricas introduzidas em Rm no parágrafo 2.1 se podem estender, de maneira óbvia, às funções vectoriais. Assim, por exemplo, sendo D um conjunto qualquer, f e g duas funções definidas em D e com valores em Rm e α um número real, a soma de f e g e o produto de α por f são as funções (designadas respectivamente por f + g e αf) definidas em D e tais que, para cada x ∈ D: (f + g)(x) = f(x) + g(x) (αf)(x) = αf(x). Verifica-se sem dificuldade que o conjunto de todas as funções definidas em D e com valores em Rm munido destas duas operações, é um espaço vectorial real. Pode também definir-se o produto αf no caso mais geral de α ser, não já um escalar, mas uma função escalar definida em D, pondo: (αf)(x) = α(x)f(x), (x ∈ D). De modo análogo se definem as funções escalares f · g e ‖f‖. A definição de continuidade para funções vectoriais é uma extensão imediata da que estudámos no ińıcio deste parágrafo. Seja de novo D um subconjunto de 47 Caṕıtulo 3. Continuidade e limite Pondo  = 1/k poderá portanto escolher-se (para cada k ∈ N1) um ponto xk ∈ D por forma que sejam conjuntamente verificadas as desigualdades: ‖xk − a‖ < 1/k e ‖f(xk)− f(a)‖ ≥ δ. Obter-se-á assim uma sucessão de termos em D, convergente para a (como resulta da primeira dessas desigualdades) e tal que f(xk) não converge para f(a) (como mostra a segunda), o que termina a demonstração. De forma sugestiva, embora um pouco imprecisa, pode dizer-se que a conti- nuidade de f no ponto a equivale à possibilidade de permutar os śımbolos «f» e «lim»: lim f(xk) = f(lim xk), quando aplicados sucessivamente a qualquer sucessão em D convergente para a. Tendo em conta o precedente Teorema 3.1 e algumas propriedades da noção de limite de uma sucessão mencionadas em 2.2, obtêm-se sem qualquer dificuldade os resultados seguintes (em cujos enunciados se supõe a ∈ D ⊂ Rn; f, g : D → Rm e α : D → R). • Se f é constante em D, é cont́ınua em qualquer ponto de D. • Se f e g são cont́ınuas no ponto a, também o são f + g, f − g, f · g e ‖f‖ (como caso particular — para m = 1 — resulta que se as funções reais f e g são cont́ınuas no ponto a ∈ D, são também cont́ınuos no mesmo ponto o seu produto usual, fg, e a função |f |). • Se α e f são cont́ınuas no ponto a, αf também o é; se, além disso, for α(a) 6= 0, o cociente f/α = 1/αf — função definida nos pontos x ∈ D tais que α(x) 6= 0 — é cont́ınuo no ponto a (em particular, o cociente de duas funções reais definidas em D e cont́ınuas no ponto a é uma função cont́ınua no mesmo ponto, desde que nele se não anule a função que figura em denominador). Sejam agora m, n e p três números inteiros positivos, D um subconjunto de Rn e E um subconjunto de Rp; sejam ainda g uma aplicação de D em Rp cujo contradomı́nio esteja contido em E e f uma aplicação de E em Rm. Nestas condições, a composta f ◦ g, definida por: (f ◦ g)(x) = f ( g(x) ) é uma aplicação de D em Rm, reconhecendo-se imediatamente (utilizando, por exemplo, o Teorema 3.1) que: • Se g é cont́ınua num ponto a ∈ D e f é cont́ınua no ponto g(a), então f ◦ g é cont́ınua no ponto a. 50 3.1. Continuidade Com estes resultados, fica muito facilitado o estudo da continuidade para a generalidade das funções de variável vectorial que surgem mais frequentemente nas aplicações. Consideremos em primeiro lugar o caso das funções reais (m = 1) e, para maior facilidade, suponhamos por agora que são apenas duas as variáveis independentes, que designaremos por x e y, em lugar de x1 e x2 (voltamos assim de momento às notações usadas de ińıcio, no parágrafo 1.2). É fácil ver que as funções p1 e p2 definidas em R2 pelas fórmulas: p1(x, y) = x e p2(x, y) = y são cont́ınuas em qualquer ponto (a, b) ∈ R2 (para p1, por exemplo, basta atender a que |p1(x, y)− p1(a, b)| = |x− a| ≤ √ (x− a)2 + (y − b)2 = ‖(x, y)− (a, b)‖, o que mostra que se terá |p1(x, y)− p1(a, b)| < δ sempre que (x, y) pertença à bola de centro (a, b) e raio  = δ). Deste facto resulta imediatamente, atendendo a propriedades da continuidade acabadas de referir, que a função f considerada no exemplo 1. de 1.2: f(x, y) = x2 + y2 ( (x, y) ∈ R2 ) é cont́ınua em qualquer ponto (a, b) ∈ R2 (basta notar que f = p1p1+p2p2 é a soma de produtos de funções cont́ınuas nesse ponto); mais geralmente, pode concluir- se de modo análogo que qualquer função polinomial P (x, y) — isto é, qualquer função que possa representar-se como soma de (um número finito de) «monómios» da forma geral cxrys, onde c é uma constante real e r e s inteiros não negativos — é cont́ınua em qualquer ponto de R2; e também que qualquer função racional de duas variáveis reais, representável como cociente de duas funções polinomiais: P (x, y) Q(x, y) (não sendo Q(x, y) o polinómio nulo) é cont́ınua em todos os pontos (x, y) ∈ R2 tais que Q(x, y) 6= 0, isto é, em todos os pontos do seu domı́nio. Por sua vez o resultado relativo à continuidade de uma função composta de funções cont́ınuas e alguns dos conhecimentos obtidos no estudo das funções reais de variável real permitem analisar facilmente, do ponto de vista da continuidade, muitas funções não racionais correntes nas aplicações. A t́ıtulo de exemplo, consideremos a função ϕ(x, y) = arctg x3 + y3 1− x2 (suposta definida no subconjunto D de R2 formado por todos os pontos (x, y) que verificam as condições x 6= 1 e x 6= −1). Como se tem ϕ = ψ ◦ θ, com: ψ(u) = arctg u (u ∈ R) 51 Caṕıtulo 3. Continuidade e limite e θ(x, y) = x3 + y3 1− x2 (x ∈ D), sendo θ cont́ınua em todos os pontos de D (por ser uma função racional) e ψ cont́ınua em cada ponto do contradomı́nio de θ (visto que é cont́ınua em R) pode concluir-se que ϕ é cont́ınua em todos os pontos do seu domı́nio. Claro que estas ideias se estendem de forma óbvia ao caso de funções reais de n variáveis reais x1, x2, . . . , xn (com n > 2). Por exemplo, a continuidade em qual- quer ponto a = (a1, . . . , an) ∈ Rn de uma função polinomial P (x) = P (x1, . . . , xn) — isto é, de uma função representável como soma de «monómios» do tipo cxr11 x r2 2 . . . x rn n — resulta imediatamente da continuidade (facilmente provada) das «projecções» pj: pj(x) = pj(x1, . . . , xn) = xj (j ∈ {1, . . . , n}) e dos resultados há pouco enunciados sobre a continuidade das funções constantes e das somas e produtos de funções cont́ınuas. De forma análoga se conclui a continuidade de uma função racional de n variáveis reais: P (x1, x2, . . . , xn) Q(x1, x2, . . . , xn) em todos os pontos x = (x1, . . . , xn) ∈ Rn tais que Q(x) 6= 0; e o teorema que relaciona a continuidade com a composição de funções permite uma vez mais alargar consideravelmente o quadro das funções cujo estudo, deste ponto de vista, pode efectuar-se com extrema simplicidade. Assim, por exemplo, reconhece-se imediatamente que a função de m variáveis reais mencionada como exemplo em 1.4: y = h(x1, . . . , xm) = log(x 2 1 + · · ·+ x2m), que é o resultado da composição de y = log u (cont́ınua para u > 0) com a função polinomial u = x21 + · · · + x2m (cont́ınua em todos os pontos de Rm) é cont́ınua em qualquer ponto de Rm distinto da origem, isto é, em todos os pontos do seu domı́nio. Passemos agora ao caso das funções vectoriais, o qual, como vamos ver, se reduz trivialmente ao das funções reais que acabamos de analisar; neste sentido, o resultado essencial é o que se exprime no seguinte: Teorema 3.2. Seja f : D → Rm, com D ⊂ Rn e a ∈ D; para que f seja cont́ınua no ponto a é necessário e suficiente que sejam cont́ınuas no mesmo ponto todas as suas funções coordenadas. Demonstração. Consideremos as relações já habituais (verificadas para todo o x ∈ D e para i ∈ {1, . . . ,m}): |fi(x)− fi(a)| ≤ ‖f(x)− f(a)‖ ≤ m∑ i=1 ∣∣fi(x)− fi(a)∣∣. 52 3.1. Continuidade ponto x0 que verifique a condição indicada diz-se um ponto de máximo (ou um maximizante) de f e o valor f(x0) é o máximo da função (em D), designado por maxD f ou maxx∈D f(x). Definem-se de forma análoga as noções de mı́nimo, ponto de mı́nimo, etc. Mais geralmente, sendo A um subconjunto qualquer do domı́nio D da função f , diz-se que f tem máximo em A sse f/A tem máximo (em A); e nessa hipótese chama-se máximo de f em A (maxA f ou maxx∈A f(x)) ao máximo da sua res- trição, maxA f/A. Como é óbvio, f tem máximo em A sse o conjunto f(A) tiver máximo, verificando-se então a igualdade: max x∈A f(x) = max f(A). Definem-se ainda, de forma óbvia, as noções de supremo e ı́nfimo de uma função real f num subconjunto A do seu domı́nio D (supA f , infA f , etc.) podendo, em particular, ser A = D. Para que existam conjuntamente o supremo e o ı́nfimo de f em A (suposto não vazio) é necessário e suficiente que f seja limitada em A e, em tal hipótese, f terá máximo em A sse existir um ponto x0 ∈ A tal que f(x0) = sup x∈A f(x), tendo-se então maxA f = supA f ; e analogamente para o mı́nimo e o ı́nfimo. Como simples consequência do Teorema 3.3, podemos agora enunciar: Teorema 3.4 (Weierstrass). Se D ⊂ Rn é um conjunto compacto não vazio, qualquer função real f , definida e cont́ınua em D, tem máximo e mı́nimo nesse conjunto. Demonstração. Nas condições da hipótese, decorre do teorema anterior que f(D) é um subconjunto compacto, não vazio, de R; por ser limitado e não vazio, f(D) terá supremo e ı́nfimo em R, os quais serão necessariamente pontos aderentes a f(D) — é evidente que lhe não podem ser exteriores — e portanto pertencerão a f(D), por este conjunto ser fechado. Conclui-se assim que f(D) tem máximo e mı́nimo, isto é, que f tem máximo e mı́nimo no conjunto D. Trataremos agora de generalizar uma outra noção de extrema importância, a de continuidade uniforme. Seja f : D → Rm, com D ⊂ Rn, e seja A um subcon- junto de D (podendo ser, em particular, A = D); diz-se que f é uniformemente cont́ınua no conjunto A sse para todo o δ > 0 existe  > 0 tal que, quaisquer que sejam os pontos x,x′ ∈ A verificando a condição ‖x − x′‖ < , se tiver ‖f(x)− f(x′)‖ < δ. Como exemplo com interesse, mencionaremos o de uma aplicação linear f : Rn → Rm. Para provar que uma tal aplicação é cont́ınua em qualquer ponto a ∈ Rn, deduzimos atrás a relação (válida para a,x ∈ Rn): ‖f(x)− f(a)‖ ≤Mn‖x− a‖, 55 Caṕıtulo 3. Continuidade e limite onde M designava um número positivo, independente de a e x. É fácil reconhecer agora, a partir desta mesma relação, que f é uniformemente cont́ınua em Rn: com efeito, dado δ > 0, bastará tomar um número positivo  < δ/Mn para que se tenha ‖f(x) − f(a)‖ < δ sempre que a e x sejam dois pontos de Rn tais que ‖x− a‖ < . Reconhece-se sem dificuldade que uma função uniformemente cont́ınua num conjunto é cont́ınua no mesmo conjunto, sendo a rećıproca falsa, em geral, como é sabido do estudo das funções de uma variável real. Verifica-se, no entanto, o seguinte resultado fundamental: Teorema 3.5 (Heine–Cantor). Seja D um subconjunto compacto de Rn. Qual- quer função f : D → Rm cont́ınua em D, é uniformemente cont́ınua no mesmo conjunto. Demonstração. Suponha-se que alguma função f , nas condições da hipótese, não era uniformemente cont́ınua em D. Existiria então um número positivo δ tal que, para cada  > 0 seria posśıvel determinar dois pontos x,x′ ∈ D por forma que fossem conjuntamente verificadas as desigualdades: ‖x− x′‖ <  e ‖f(x)− f(x′)‖ ≥ δ. Pondo  = 1/k (com k = 1, 2, . . .) poderia assim obter-se para cada k ∈ N1 um par de pontos xk,x ′ k ∈ D verificando as condições: ‖xk − x′k‖ < 1 k e ‖f(xk)− f(x′k)‖ ≥ δ. Da sucessão xk, de termos no conjunto compacto D, poderia extrair-se uma subsucessão xpk , convergente para um ponto x0 ∈ D. E, atendendo às relações: ‖x′pk − x0‖ = ‖(x ′ pk − xpk) + (xpk − x0)‖ ≤ ‖x′pk − xpk‖+ ‖xpk − x0‖ < 1 pk + ‖xpk − x0‖, logo se reconhece que também a sucessão x′pk seria convergente para x0. Ter-se-ia assim, dada a continuidade de f em D (e portanto em x0) lim k→∞ f(xpk) = f(x0) = lim k→∞ f(x′pk) e portanto também: lim k→∞ ( f(xpk)− f(x′pk) ) = 0, em contradição com o facto de dever ser verificada, para todo o k ∈ N1, a desi- gualdade: ‖f(xk)− f(x′k)‖ ≥ δ. Esta contradição permite dar por conclúıda a demonstração do teorema. 56 3.1. Continuidade A noção de continuidade uniforme e o precedente teorema de Heine--Cantor ser-nos-ão indispensáveis em diversas fases ulteriores do nosso curso. Um outro resultado com interesse na sequência é o que se exprime no Teorema 3.6, o qual constitui a generalização adequada de um resultado conhecido, relativo à conti- nuidade da função inversa de uma função cont́ınua que aplique injectivamente um intervalo I ⊂ R na recta real R. Teorema 3.6. Seja f : D → Rm uma função cont́ınua no conjunto compacto D ⊂ Rn e suponha-se que f aplica injectivamente D em Rm; então a função inversa g = f−1 : f(D) → Rn é cont́ınua em f(D). Demonstração. Tendo em conta o Teorema 3.1, bastará provar que, sendo y0 um ponto arbitrário de f(D) e yk uma sucessão qualquer de termos em f(D) convergente para y0, se tem necessariamente g(yk) → g(y0). Ponha-se x0 = g(y0) e, para todo o inteiro positivo k, xk = g(yk); xk será uma sucessão de termos em D, x0 um ponto de D e ter-se-á: yk = f(xk) → y0 = f(x0), interessando agora provar que xk → x0. Recorrendo directamente à definição de limite de uma sucessão logo se vê que, se xk não convergisse para x0, existiria  > 0 tal que, para uma infinidade de valores inteiros positivos de k, não seria verificada a condição ‖xk − x0‖ < ; ou, de outra forma: existiria uma subsucessão xpk de xk para a qual se teria ‖xpk − x0‖ ≥  para todo o k ∈ N1. Pelo Teorema 2.9, a sucessão xpk , de termos no conjunto compacto D, admitiria por sua vez uma subsucessão xqk (também subsucessão de xk) convergente para um ponto x ′ 0 ∈ D; mas, verificando- se necessariamente, para todo o inteiro positivo k, a condição: ‖xqk − x0‖ ≥ , o limite x′0 da sucessão xqk seria certamente distinto do ponto x0 e portanto — pondo y′0 = f(x ′ 0) — ter-se-ia também, dada a injectividade de f : y′0 = f(x ′ 0) 6= f(x0) = y0. Nestas condições, porém, a continuidade de f em x′0 e a convergência de xqk para x′0 implicariam que a sucessão yqk = f(xqk) convergisse para y ′ 0, o que é absurdo, porque yqk é uma subsucessão de yk e yk, por hipótese, converge para y0. Pode assim considerar-se terminada a demonstração. Cada um dos dois teoremas seguintes constitui, de certo ponto de vista, uma generalização natural do clássico teorema do valor intermédio, relativo a funções cont́ınuas num intervalo da recta R; porém, o Teorema 3.8 não é mais do que um simples corolário do: 57 Caṕıtulo 3. Continuidade e limite A condição referida no enunciado pode ser expressa, de forma mais sugestiva, dizendo que quaisquer pontos a, b ∈ X podem ser «unidos por uma curva contida em X». Para a demonstração observe-se que, se X não fosse conexo, existiriam conjuntos separados A∗ e B∗ tais que A∗ ∪ B∗ = X. Escolhidos arbitrariamente dois pontos a ∈ A∗ e b ∈ B∗, existiria também, por hipótese, uma função cont́ınua ϕ : [0, 1] → Rn tal que ϕ(0) = a, ϕ(1) = b e ϕ([0, 1]) ⊂ X. Nestas condições, pondo: A = ϕ([0, 1]) ∩ A∗ e B = ϕ([0, 1]) ∩B∗ ter-se-ia: ϕ([0, 1]) = A ∪B (visto que ϕ([0, 1]) ⊂ A∗ ∪ B∗ = X), sendo A e B conjuntos separados (para o reconhecer, basta observar que A e B são não vazios — porque a ∈ A e b ∈ B — e ter em conta as relações A ⊂ A∗, B ⊂ B∗ e o facto de A∗ e B∗ serem conjuntos separados). Assim, concluir-se ia que o conjunto ϕ([0, 1]) era desconexo o que é absurdo, porque o intervalo [0, 1] é conexo e a função ϕ é cont́ınua. Costuma-se chamar conjuntos conexos por arcos aos conjuntos X ⊂ Rn que verificam a condição mencionada no enunciado do Teorema 3.9 (isto é, tais que dois pontos quaisquer a, b ∈ X podem sempre ser unidos por uma curva contida em X). Nestes termos, o enunciado desse teorema poderia sintetizar-se dizendo que qualquer conjunto conexo por arcos é conexo. Observe-se, de passagem, que a rećıproca é falsa (por exemplo, pode provar-se que o subconjunto X de R2 formado pelo gráfico da função sen 1/x ampliado com a origem é conexo, mas que não existe qualquer curva contida em X unindo a origem a outro ponto qualquer do mesmo conjunto). Observaremos ainda que, na sua generalidade, os resultados obtidos neste parágrafo são válidos em espaços muito mais gerais do que os espaços Rn — por exemplo, em espaços métricos — sendo as demonstrações prati- camente idênticas às que aqui foram feitas (haverá contudo nalguns pontos necessidade de certas «adaptações»: assim, por exemplo, no caso dos Te- oremas 3.3, 3.4 e 3.5, haverá que ter em conta que, no quadro geral dos espaços métricos, a noção de conjunto compacto não equivale à de conjunto limitado e fechado). No entanto, pareceu prefeŕıvel — mesmo para quem tencione vir a de- senvolver bastante os seus estudos no domı́nio da Análise — que a primeira abordagem destas ideias (para além do estudo das funções reais de variável real) se processasse no quadro particularmente importante e sugestivo facul- tado pelos espaços Rn. Julga-se assim ter evitado um tratamento demasiado abstracto, cuja profundidade e alcance dificilmente poderiam ser apreen- didos neste momento, até por impossibilidade de motivação adequada; e pensa-se também que, ultrapassada esta fase, ficará bastante facilitado o acesso aos pontos de vista mais elevados que alguns leitores decerto deseja- rão vir a alcançar neste domı́nio. 60 3.2. Limite 3.2 Limite A noção de limite está muito intimamente relacionada com a de continuidade; em muitos textos, o estudo do conceito de limite precede o das funções cont́ınuas ou é feito a par e passo com o das primeiras propriedades destas funções. Julgou- se contudo prefeŕıvel estudar em primeiro lugar as propriedades essenciais das funções cont́ınuas, sem qualquer referência à noção de limite, que é talvez um pouco mais elaborada; o estudo dos limites ficará agora muito facilitado e surgirá de modo natural, imediatamente antes do caṕıtulo em que pela primeira vez eles irão ser necessários: a introdução ao cálculo diferencial em Rn. Para introduzir mais simplesmente a noção de limite, consideraremos em pri- meiro lugar o caso das funções reais; veremos depois que a extensão às funções vectoriais não oferece a menor dificuldade. Antes de dar as definições formais, faremos ainda algumas considerações pre- paratórias. Neste sentido, recorde-se que, sendo f uma função real definida num conjunto D ⊂ Rn e a um ponto de D, dizemos que f é cont́ınua no ponto a sse para todo o δ > 0 existe  > 0 tal que x ∈ B(a) ∩D =⇒ |f(x)− f(a)| < δ. De acordo com as definições que enunciaremos adiante, o facto de esta condição ser verificada poderá também traduzir-se dizendo que «f(x) tende para f(a) quando x tende para a» ou que «f(a) é o limite de f(x) quando x tende para a», e escrevendo3: lim x→a f(x) = f(a). Suponhamos agora que a é um ponto aderente ao domı́nio D da função f , não pertencente a esse domı́nio (neste caso, a será necessariamente ponto de acumulação de D). Não existe então valor da função f no ponto a e f não pode evidentemente ser cont́ınua nesse ponto; mas pode acontecer que exista um número b ∈ R com o qual — no lugar de f(a) — seja verificada a condição atrás indicada. Se existir de facto b ∈ R nessas condições — isto é, tal que, qualquer que seja δ > 0 exista  > 0 por forma que todo o x ∈ D que satisfaça a condição ‖x − a‖ <  verifique também |f(x) − b| < δ — diremos ainda que f(x) tende para b quando x tende para a e escreveremos: lim x→a f(x) = b. No caso que estamos a considerar (a ∈ D̄\D) é fácil ver que a existência de limite equivale à possibilidade de «prolongar por continuidade a função f ao ponto a», isto é, equivale à existência de uma função f̃ — chamada prolongamento por continuidade de f ao ponto a — definida em D ∪ {a}, cont́ınua em a e tal que 3Esta notação e também o artigo definido incluido na última das afirmações precedentes só ficarão inteiramente justificados quando se tiver reconhecido a unicidade do limite. 61 Caṕıtulo 3. Continuidade e limite f̃/D = f . Na realidade, se for limx→a f(x) = b ver-se-á sem dificuldade que a única função f que satisfaz as condições acabadas de indicar é a função f̃ : D∪{a} → R tal que: f̃(x) = { f(x) se x ∈ D b se x = a. A t́ıtulo de exemplo, consideremos a função definida pela fórmula: f(x, y) = x2 − y2√ x2 + y2 , no conjunto D = R2\{(0, 0)}. Resultados obtidos no parágrafo precedente permitem reconhecer imediata- mente que f é cont́ınua em todo o seu domı́nio; quando (x, y) tender para um ponto qualquer (a, b) ∈ D, a função tenderá portanto para um limite, igual ao seu valor no ponto considerado. Quanto ao ponto (0, 0), é claro que f não é cont́ınua nesse ponto, não existindo sequer o valor f(0, 0). Tem-se, contudo, como vamos ver (em notação de significado evidente): lim (x,y)→(0,0) f(x, y) = 0. Com efeito, sendo (x, y) 6= (0, 0), tem-se: |f(x, y)| = |x 2 − y2|√ x2 + y2 ≤ x 2 + y2√ x2 + y2 = √ x2 + y2 e portanto a condição |f(x, y)| < δ será verificada por todo o ponto (x, y) ∈ D tal que ‖(x, y)‖ = √ x2 + y2 < δ. Fica assim provado que f(x, y) tende para 0 quando (x, y) → (0, 0) e é claro que para prolongar por continuidade a função f à origem bastaria «atribuir-lhe» nesse ponto o valor 0 (esta frase é incorrecta: o prolongamento por continuidade é uma função distinta da função f , visto que não tem o mesmo domı́nio). Consideremos agora a função ϕ, definida no mesmo conjunto D do exemplo anterior, pela fórmula: ϕ(x, y) = x2 − y2 x2 + y2 Esta função também é cont́ınua em qualquer ponto do seu domı́nio e, para (α, β) 6= (0, 0), tem-se: lim (x,y)→(α,β) ϕ(x, y) = α2 − β2 α2 + β2 . Para averiguar da existência de limite na origem observemos primeiramente que, sendo x e y números reais diferentes de zero, se tem: ϕ(x, 0) = 1 e ϕ(0, y) = −1 62 3.2. Limite Consideremos agora o caso mais geral das funções vectoriais. Naturalmente, sendo f : D → Rm (com D ⊂ Rn), a um ponto aderente a D e sendo agora b = (b1, . . . , bm) um vector qualquer de Rm, diremos que f(x) tende para b quando x tende para a sse qualquer que seja δ > 0 existir  > 0 tal que, para todo o ponto x ∈ Rn que verifique as condições x ∈ D e ‖x − a‖ < , se tenha ‖f(x)− b‖ < δ. Prova-se sem qualquer dificuldade (e será consequência imediata de resultados posteriores) que, se f(x) tende para b e também para b′ quando x tende para a, então é necessariamente b = b′. Nesta hipótese, o (único) vector b que verifica esta condição é designado por limite de f(x) quando x tende para a ou limite de f no ponto a, podendo escrever-se: lim x→a f(x) = b ou lim (x1,...,xn)→(a1,...,an) f(x1, . . . , xn) = (b1, . . . , bm). ou ainda, mais simplesmente: lim a f = b. Vê-se também sem a menor dificuldade (tendo em conta as definições de con- tinuidade e de limite) que a existência do limite de f no ponto a equivale à existência de um prolongamento por continuidade de f ao ponto a, isto é, de uma função f̃ : D∪{a} → Rm cont́ınua no ponto a e tal que f̃/D = f . No caso em que a (sempre aderente a D) não pertence a D, esse prolongamento é definido por: f̃(x) = { f(x) se x ∈ D lim a f se x = a. No caso em que a ∈ D, tem-se evidentemente D∪{a} = D e o prolongamento f̃ coincide com a própria função f (a qual, por existir o limite, é então necessaria- mente cont́ınua no ponto a). Tanto num caso como no outro, é óbvio que (fixado o ponto a ∈ D) o prolongamento f̃ é univocamente determinado pela função f . Pode ver-se ainda que, se a ∈ Rn é um ponto exterior ao domı́nio D de f (caso exclúıdo na definição de limite) existem sempre infinitas funções f̃ : D ∪ {a} → Rm, cont́ınuas em a e tais que f̃/D = f : para obter uma tal função bastaria pôr: f̃(x) = { f(x) se x ∈ D c se x = a, onde c designa um vector arbitrário de Rm. Assim, para os pontos não aderentes ao domı́nio de f , haveria sem- pre possibilidade de «prolongar continuamente» a função, mas o prolonga- mento, não sendo univocamente determinado, ficaria totalmente desprovido 65 Caṕıtulo 3. Continuidade e limite de interesse. É por uma razão semelhante que, na definição de limite, ape- nas considerámos pontos aderentes ao domı́nio da função. Com a definição adoptada, o limite (quando existe) é único e a sua existéncia equivale à de um único prolongamento da função f definido em D ∪ {a} e cont́ınuo no ponto a. Registaremos agora algumas propriedades da noção de limite, em correspon- dência com propriedades da continuidade estudadas no parágrafo precedente; as demonstrações, que omitiremos, podem fazer-se de modo análogo ao adoptado no caso da continuidade, ou então reduzir-se a esse caso, como se sugere a propósito do seguinte: Teorema 3.1’. Seja f : D → Rm (D ⊂ Rn), a um ponto aderente a D e b um vector de Rm; para que se verifique a igualdade: lima f = b é necessário e suficiente que, sempre que xk seja uma sucessão em D convergente para a, a sucessão f(xk) convirja para b. A demonstração pode fazer-se de forma quase idêntica à do Teorema 3.1; mas pode também pensar-se que, para que a igualdade lima f = b seja verificada, é necessário e suficiente, no caso de ser a ∈ D, que f seja cont́ınua em a e se tenha f(a) = b; e no caso de ser a ∈ D̄\D, que seja cont́ınua no ponto a a função f̃ : D∪{a} → R, que prolonga f e assume no ponto a o valor b; assim, a questão do limite fica reduzida à da continuidade e o recurso ao Teorema 3.1 permite completar imediatamente a demonstração. Nas propriedades seguintes, que nos limitaremos a enunciar, deve supor-se que D ⊂ Rn, a ∈ D̄; f, g : D → Rm e α : D → R. • Se f é constante em D, existe lima f e é igual ao valor de f num ponto qualquer de D. • Se f e g têm limite no ponto a, também o têm as funções f + g, f − g, f · g e ‖f‖, verificando-se as igualdades: lim a (f + g) = lim a f + lim a g, lim a (f − g) = lim a f − lim a g, lim a (f · g) = lim a f · lim a g e lim a ‖f‖ = ‖ lim a f‖. • Se α e f têm limite no ponto a, αf também e tem-se: lim a (αf) = (lim a α)(lim a f); 66 3.2. Limite se for ainda lima α 6= 0, o cociente f/α terá limite quando x → a, verifi- cando-se a igualdade: lim a f α = lima f lima α . Também no caso do limite o estudo das funções vectoriais pode reduzir-se imediatamente ao das funções reais, nos termos do seguinte: Teorema 3.2’. Seja f : D → Rm (com D ⊂ Rn), a um ponto aderente a D, b = (b1, . . . , bm) um vector de Rm e designemos por fj a função coordenada de ordem j de f ; nestas condições, para que se verifique a igualdade lima f = b é necessário e suficiente que, para cada inteiro positivo j ≤ m, se tenha lima fj = bj. Tem também interesse o seguinte resultado, que relaciona da forma desejável a noção de limite com a composição de funções: Seja D ⊂ Rn, E ⊂ Rp, g : D → E e f : E → Rm; suponha-se ainda que a é um ponto aderente ao conjunto D. Nestas condições, vê-se imediatamente que, se se tiver lima g = b, b será necessariamente um ponto aderente ao conjunto E; e também (usando, por exemplo, o Teorema 3.1’) que, se existir ainda o limite de f no ponto b, existirá também o limite no ponto a da função composta f ◦ g : D → Rn, verificando-se a igualdade: lim a (f ◦ g) = lim b f. ou, com outra notação: lim x→a (f ◦ g)(x) = lim y→b f(y). Assim, por exemplo, das igualdades: lim (x,y)→(0,0) x2 − y2√ x2 + y2 = 0 e lim u→0 cosu = 1, poderá imediatamente deduzir-se que: lim (x,y)→(0,0) cos x2 − y2√ x2 + y2 = 1. Antes de indicarmos algumas outras aplicações do resultado anterior, convém introduzir uma definição: Nas hipóteses já habituais de D ser um subconjunto de Rn, a um ponto aderente a D e f uma aplicação de D em Rm, consideremos agora um subconjunto A de D ao qual o ponto a seja ainda aderente; a será portanto um ponto aderente ao domı́nio da função f/A, podendo existir ou não o lima f/A. Quando este limite 67 Caṕıtulo 3. Continuidade e limite existe sse o outro existir e que, na hipótese de existência, têm o mesmo valor). A utilização de técnicas deste tipo no caso de funções de n variáveis reais requer algumas ideias muito simples sobre Geometria Anaĺıtica em Rn, a que vamos fazer uma rápida referência. Sendo a = (a1, . . . , an) um ponto de Rn e v = (v1, . . . , vn) ∈ Rn um vector não nulo, a recta que passa por a e tem a direcção do vector v é, por definição, o conjunto de todos os pontos x = (x1, . . . , xn) ∈ Rn representáveis na forma: x = a + tv, com t ∈ R (na interpretação geométrica, válida para n ≤ 3, esta equação re- presenta de facto uma recta, satisfazendo as condições indicadas). A equação x = a + tv é chamada equação paramétrica da recta considerada, na forma vec- torial; e as equações correspondentes, em termos de coordenadas: x1 = a1 + tv1 · · · xn = an + tvn, constituem o sistema de equações paramétricas da mesma recta, na forma escalar (Figura 3.5). PSfrag replacements x2 x1 x3 a a− v a + v a + 2v v Figura 3.5 Se, em vez de supormos que o parâmetro t assume todos os valores reais, admitirmos que varia num intervalo limitado de R, I, ao conjunto de todos os pontos x = a + tv (t ∈ I) chamaremos um segmento de recta (se for I = [t1, t2], com t1 < t2, os pontos a + t1v e a + t2v serão os extremos do segmento). Analogamente, a semirecta (aberta) de origem no ponto a e com a direcção e o sentido do vector v será o conjunto definido pela equação x = a + tv, com t ∈ ]0, +∞[ (t ∈ [0, +∞[ para a semirecta fechada), etc. Na sequência, designaremos a semirecta definida pela equação: x = a + tv, 70 3.2. Limite com t > 0, pelo śımbolo Sa,v ou, quando o ponto a estiver claramente fixado, apenas por Sv. Consideremos agora uma função real f (o caso de uma função vectorial re- duzir-se-ia a este por passagem às funções coordenadas), a qual, por razões de comodidade, suporemos definida em todo o conjunto Rn, com eventual excepção de um dado ponto, a (no entanto, tornar-se-á evidente que não haveria qualquer alteração essencial ao que vai seguir-se se admit́ıssemos, mais geralmente, que f estava definida num conjunto D ⊂ Rn tal que, para algum  > 0, se verificasse a relação B(a)\{a} ⊂ D). Sendo v um vector não nulo, ao limite de f no ponto a relativo ao conjunto Sv costuma também chamar-se limite direccional de f no ponto a segundo o vector v (ou na direcção e sentido de v). Reconhece-se facilmente que este limite existe sse a função ϕv : ]0, +∞[ → R definida pela fórmula: ϕv(t) = f(a + tv) tiver limite quando t→ 0+, verificando-se nessa hipótese a igualdade: lim x→a x∈Sv f(x) = lim t→0+ ϕv(t). Assim, o cálculo de um limite direccional (ou a verificação da sua não existên- cia) reduz-se ao estudo de um problema de limites para uma função de uma só variável real. É claro que, se existir o limite de f no ponto considerado, existirá também — e com o mesmo valor — o limite direccional segundo qualquer vector v 6= 0; portanto, se for posśıvel encontrar dois vectores v1,v2 aos quais correspondam limites direccionais diferentes, poderá concluir-se que a função não tem limite no ponto considerado. Poderá também concluir-se, em sentido inverso, que se existirem os limites direccionais relativos a todos os vectores (não nulos) v ∈ Rn e se todos esses limites direccionais tiverem o mesmo valor, f tem limite no ponto considerado? Veremos facilmente que a resposta a esta questão deverá ser negativa, se no- tarmos que, no estudo de cada um dos limites direccionais, os únicos valores de f que se consideram são os que a função assume sobre uma determinada semirecta aberta com origem no ponto a; assim, se f estiver definida neste ponto, o valor f(a) será «ignorado» na pesquisa de todos os limites direccionais e é óbvio que estes limites poderão existir e ser todos iguais sem que f tenha limite no ponto a (é o que se passa, por exemplo, com a função f : Rn → R que toma o valor 1 em dado ponto a ∈ Rn e o valor 0 em todos os outros pontos). Porém, o que poderá ser um pouco surpreendente é que a existência e igualdade de todos os limites direccionais no ponto a nem sequer garante a existência de limite para a restrição de f a Rn\{a}, isto é, do lim x→a x∈Rn\{a} f(x) 71 Caṕıtulo 3. Continuidade e limite (o qual, na sequência, designaremos mais simplesmente pelo śımbolo lim x→a x6=a f(x)).4 Para o mostrar, recorreremos a um exemplo simples, relativo ao caso n = 2 (é fácil — e poderá ficar como exerćıcio — a adaptação desse exemplo por forma a provar que, também para n > 2, a existência e igualdade de todos os limites direccionais no ponto a não garante a existência de lim x→a x6=a f(x)). Seja f : R2 → R a função definida pela forma seguinte: f(x, y) = { 1 se x 6= 0 e y = x2 0 se x = 0 ou y 6= x2 Assim, f toma o valor 1 em todos os pontos da parábola de equação y = x2 com excepção da origem e o valor 0 em todos os outros pontos do plano. Vê-se imediatamente que a restrição de f a qualquer semirecta (aberta) com origem em (0, 0) assume o valor 0 em todos os pontos dessa semirecta excepto, quando muito, num ponto (aquele em que a semirecta em causa intersecta a parábola, nos casos em que tal intersecção não é vazia); e dáı logo se deduz que todos os limites direccionais de f no ponto (0, 0) são iguais a 0. No entanto, tanto a função como a sua restrição a R2\{(0, 0)} não podem ter o limite 0 — nem, evidentemente, qualquer outro — quando (x, y) tende para (0, 0): basta notar que, em qualquer bola centrada na origem, há infinitos pontos em que f assume o valor 1 (Figura 3.6). PSfrag replacements x y f = 0 f = 0 f = 1 f = 1 f = 0 Figura 3.6 O que o exemplo precedente nos permitiu reconhecer pode também ob- servar-se com funções definidas de forma «menos artificial»; para o verificar, 4Salvo no caso de ser n = 1 (isto é, de f ser uma função de uma variável real); em tal caso, vê-se facilmente que os limites direccionais se identificam com os limites laterais f(a+) = limx→a+ f(x) e f(a−) = limx→a− f(x) (mais precisamente, o limite segundo o vector ke1 coincide com f(a+) se k > 0 e com f(a−) se k < 0) e é sabido que a existéncia e igualdade dos dois limites laterais assegura a existência de lim x→a x 6=a f(x). 72 3.2. Limite Consideremos uma função g(u, v), definida no conjunto dos pontos (u, v) ∈ R2 tais que u > 0. Se, para cada v0 ∈ R, a função (de uma variável real) f(u, v0) tem limite (finito) quando u → 0+ — limite em ge- ral dependente de v0, que designaremos por h(v0) — diremos que, quando u→ 0+, a função g(u, v) converge pontualmente sobre R para a função h(v) e escreveremos: lim u→0+ g(u, v) = h(v) (v ∈ R). Por exemplo, para v ∈ R: lim u→0+ (u sen v + v cosu) = v e lim u→0+ e v−|v| u = H(v), onde H designa a função de Heaviside (H(v) = 1 se v ≥ 0, H(v) = 0 se v < 0); observe-se que, como mostra o último exemplo, uma função cont́ınua em todo o semiplano u > 0 pode convergir pontualmente, quando u → 0+, para uma função que não é cont́ınua. De acordo com a definição de convergência pontual, a expressão: lim u→0+ g(u, v) = h(v) (v ∈ R) significa que, dado arbitrariamente δ > 0, existe, para cada v0 ∈ R, um  > 0 tal que, para 0 < u < , se verifica a desigualdade |g(u, v0)− h(v0)| < δ ; claro que  depende não só de δ como do ponto v0 considerado6, não sendo geralmente posśıvel fixar, para cada δ > 0 um número  — independente de v0 — por forma que a desigualdade precedente seja verificada sempre que se tenha 0 < u <  (e qualquer que seja v0 ∈ R). Por exemplo, com g(u, v) = u(1 + v2), função que suporemos definida no semiplano u > 0, tem-se lim u→0+ g(u, v) = 0 (v ∈ R). Mas se fixarmos δ, por exemplo, no valor 1, não existirá  > 0 tal que, para 0 < u <  e v real arbitrário, se tenha |g(u, v)| < 1; para o reconhecer, basta notar que esta desigualdade equivale a: 0 < u < 1 1 + v2 e que o conjunto dos números da forma 1/(1 + v2), com v ∈ R, tem ı́nfimo nulo (ver Figura 3.8). 6Esta frase é pouco precisa: pode talvez sugerir que  ficaria univocamente determinado se se fixassem δ e v0, o que é obviamente falso. 75 Caṕıtulo 3. Continuidade e limite PSfrag replacements u v v1 v0 1 1 1 + v2 0 1 1 + v2 1 Figura 3.8 Assim, o facto de g(u, v) convergir pontualmente sobre R para a função h(v), quando u → 0+, não garante que seja verificada a condição seguinte: qualquer que seja δ > 0 existe uma faixa Σ (de largura «uniforme» , independente de v) tal que, para todo o ponto (u, v) ∈ Σ, se tenha |g(u, v)− h(v)| < δ. Precisamente quando esta última condição se verifica é que dizemos que g(u, v) converge uniformemente sobre R para a função h(v), quando u→ 0+ (e de forma análoga se define a convergência uniforme sobre um conjunto qualquer A ⊂ R). A noção de convergência uniforme é muito importante em Análise. Em diversas situações, com a convergência pontual (que decerto parece mais natural num primeiro contacto) verificam-se «anomalias» que não são pos- śıveis quando a convergência é uniforme: por exemplo, vimos há pouco que uma função cont́ınua pode convergir pontualmente para uma função não cont́ınua; com convergência uniforme, isso não é posśıvel (prová-lo seria neste momento um bom exerćıcio). Voltemos agora à questão que nos serviu de pretexto para introduzir estas ideias; seja f(x, y) uma função real definida em R2\{(0, 0)} e F (r, θ) = f(r cos θ, r sen θ). As conclusões que obtivemos podem agora sintetizar-se do modo seguinte: a condição lim(x,y)→(0,0) f(x, y) = b é verificada sse, quando r → 0+, F (r, θ) converge uniformemente sobre R para a (função) constante b. Por outro lado, é fácil ver que o facto de F (r, θ) convergir pontualmente sobre R, quando r → 0+, corresponde precisamente à existência de todos os limites direccionais de f(x, y) no ponto (0, 0); no entanto, mesmo que o limite (pontual) seja uma constante, b (caso em que os limites direccionais 76 3.2. Limite serão todos iguais a b) a função f só terá limite na origem se a convergência de F (r, θ) para b for uniforme. Assim, no caso já atrás considerado de ψ(x, y) = xy x2 + y2 , como a função ψ(r cos θ, r sen θ) = 1 2 sen 2θ, independente de r, converge pontualmente (e até uniformemente) sobre R para si própria quando r → 0+, existem todos os limites direccionais de ψ na origem; porém, não sendo estes limites todos iguais (visto que a função 1 2 sen 2θ não é constante), ψ não tem limite neste ponto, como já sab́ıamos. Como último exemplo, considere-se a função: f(x, y) = H (√ x2 + y2 − y√ x2 + y2 ) +H ( y√ x2 + y2 − √ x2 + y2 ) , onde H designa de novo a função de Heaviside. Passando a coordenadas polares obtém-se: F (r, θ) = H(r − sen θ) +H(sen θ − r), isto é, a função, definida no semiplano r > 0 e que assume o valor 1 em todos os pontos (r, θ) deste semiplano, com excepção dos que verificam a condição r = sen θ, nos quais toma o valor 2. Vê-se facilmente que: lim r→0+ F (r, θ) = 1 (θ ∈ R) sendo portanto iguais a 1 todos os limites direccionais de f na origem. Porém, como a convergência expressa na fórmula precedente não é uniforme sobre R (basta observar que, em qualquer faixa Σ há pontos (r, θ) com r = sen θ) pode concluir-se que f não tem limite no ponto (0, 0). Terminaremos este parágrafo com uma breve referência a algumas variantes da noção de limite não enquadradas no estudo anterior (mas tão naturais que quase podeŕıamos dispensar-nos de mencioná-las explicitamente) e com a introdução de uma notação que nos será útil na sequência. Sendo f uma função real definida num conjunto D ⊂ Rn e a um ponto aderente a D, diz-se que f(x) tende para +∞ quando x tende para a, e escreve-se: lim x→a f(x) = +∞, sse, para todo o k > 0 existe  > 0 tal que, para qualquer ponto x ∈ D que verifique a condição ‖x− a‖ <  se tenha f(x) > k.7 7Observe-se que, de acordo com esta definição, uma função real cujo domı́nio contenha o ponto a não poderá ter limite +∞ nesse ponto. 77 Caṕıtulo 3. Continuidade e limite Na realidade, existindo uma função f ∗ : D → Rm, infinitésima no ponto a e tal que f(x) = ϕ(x)f ∗(x) para x ∈ D, bastará pôr, por definição: f̄(x) = { ϕ(x) |ϕ(x)|f ∗(x) se x ∈ D\{a} 0 se x = a, para que se tenha f(x) = |ϕ(x)|f̄(x), sendo f̄ : D → Rm infinitésima no ponto a. É óbvio que a condição f = o(1), quando x → a, significa precisamente que f é infinitésima no ponto a (convirá talvez notar que, em geral, o facto de se ter f = o(ϕ) não assegura que f seja um infinitésimo: por exemplo, se for f(x) = 1 e ϕ(x) = 1/x para x ∈ R\{0} , com f(0) = ϕ(0) = 0, a condição f = o(ϕ) quando x → 0 será verificada). E é também evidente que, se ϕ for um infinitésimo no ponto a e se tiver f = o(ϕ), f será também infinitésima no mesmo ponto. Neste último caso, costuma-se dizer que f é um infinitésimo de ordem superior à de ϕ no ponto a; a ideia intuitiva é a de que, quando x → a, f(x) tende para 0 «mais rapidamente» do que ϕ(x) tende para 0. Um caso de especial importância é o de ϕ(x) ser uma função da forma: ϕ(x) = ‖x− a‖α, com α real positivo e x ∈ D ⊂ Rn. Para se exprimir que a condição: f(x) = o(‖x− a‖α) é verificada, diz-se que f é um infinitésimo de ordem superior a α, no ponto a. Interessar-nos-á muito especialmente no próximo caṕıtulo o caso particular dos infinitésimos de ordem superior a 1, que também se dizem infinitésimos de ordem superior à primeira e que são portanto as funções para as quais se tem: f(x) = o(‖x− a‖) (quando x → a) Como exemplo, mencione-se que a função sen2(x + y) é um infinitésimo de ordem superior à primeira (e também de ordem superior a α, para qualquer α ∈ ]0, 2[) quando (x, y) → (0, 0). Consideremos novamente um conjunto D ⊂ Rn, um ponto a ∈ D e duas funções f : D → Rm e ϕ : D → R, supondo ainda que ϕ(x) 6= 0 para todo o x ∈ D\{a}. No caso de existir  > 0 e uma função f ∗ : D → Rm, limitada em B(a), por forma que se verifique a igualdade: f(x) = ϕ(x)f ∗(x) em todo o ponto x ∈ D, diremos que f é dominada por ϕ no ponto a (ou quando x → a) e escreveremos: f = O(ϕ) (quando x → a), ou, se não houver risco de confusão, apenas f = O(ϕ). 80 3.2. Limite É claro que, se ϕ(a) 6= 0, dizer que f = O(ϕ) equivale a dizer que o cociente f(x)/ϕ(x) é limitado nalguma bola centrada no ponto a; se for ϕ(a) = 0, porém, a condição f = O(ϕ) será verificada sse esse cociente (definido em D\{a}) for limitado na intersecção do seu domı́nio com uma bola B(a) e se, além disso, for f(a) = 0. Assim, por exemplo, ter-se-á (com m = 1, n = 2 e sendo a a origem): x2 = y2 +O(x2 + y2). Outro exemplo, que será útil na sequência: sendo f : Rn → Rm uma apli- cação linear, verifica-se a relação f(x) = O(‖x‖); é o que imediatamente se reconhece tendo em conta que (como vimos na pág. 48 ao provar a continuidade das aplicações lineares) pode garantir-se a existência de uma constante C tal que ‖f(x)‖ ≤ C‖x‖, qualquer que seja x ∈ Rn. Indicaremos agora algumas propriedades das relações expressas pelos śımbolos «O» e «o», que utilizaremos eventualmente em caṕıtulos seguintes; as demons- trações, com base nas definições dos referidos śımbolos e em propriedades bem conhecidas das noções de limite e de função limitada, poderão ficar como exerćı- cios. Supondo verificadas as condições: D ⊂ Rn; a ∈ D; f, g : D → Rm; α, ϕ, ψ : D → R e ainda que os śımbolos o(ϕ), O(ϕ), o(ψ), etc., se referem todos ao mesmo ponto a, tem-se: • Se f = o(ϕ), então também f = O(ϕ). • Se f = o(ϕ) e g = o(ϕ), então f ± g = o(ϕ); se f = O(ϕ) e g = O(ϕ), f ± g = O(ϕ) (estas proposições exprimem-se por vezes, de forma algo imprecisa, escrevendo: o(ϕ)± o(ϕ) = o(ϕ), O(ϕ)±O(ϕ) = O(ϕ)). • Se f = o(ϕ) e α = O(ψ) (ou f = O(ϕ) e α = o(ψ)), então αf = o(ϕψ) (abreviadamente: O(ψ)o(ϕ) = o(ψ)O(ϕ) = o(ϕψ)). • Se f = o(ϕ) e g = O(ψ) (ou f = O(ϕ) e g = o(ψ)) então f ·g = o(ϕψ) ( o(ϕ) · O(ψ) ) = o(ϕψ), etc.) Vem aqui a propósito transcrever (do livro «Introdução à Análise Matemá- tica», do mesmo autor) os dois parágrafos seguintes (adaptados à situação pre- sente): As notações «O» e «o», devidas ao matemático alemão Landau, são usadas frequentemente em textos de Matemática e, em determinadas situações, a sua utilidade é manifesta. No entanto, do ponto de vista da coerência lógica, po- dem merecer algum reparo (por exemplo, contrariamente às regras usuais, das igualdades f = o(ϕ), g = o(ϕ) não pode deduzir-se f = g; e é óbvio que de o(ϕ) + o(ϕ) = o(ϕ) não decorre o(ϕ) = 0). Seria na realidade prefeŕıvel, em lugar de f = o(ϕ), escrever f ∈ o(ϕ), enca- rando o śımbolo o(ϕ) como representativo de um conjunto de funções definido de 81 Caṕıtulo 3. Continuidade e limite maneira conveniente. Não é isto, porém, o que se faz na generalidade dos textos e a verdade é que, do ponto de vista prático, o uso das notações de Landau é muitas vezes cómodo e não conduz a qualquer confusão nos casos habituais. 82 4.1. Introdução precedente, esta última afirmação significa que r1(x) = o(|x|); mas vimos também que esta condição equivale a r1(x) = o(x)). Poderia prosseguir-se nesta ordem de ideias,1 mas não é isso o que nos inte- ressa agora. Convém-nos antes salientar um aspecto, que talvez não pareça muito significativo à primeira vista, mas que acabará por revelar-se essencial. A obser- vação que queremos fazer é a seguinte: no caso de f ser diferenciável na origem, há um e um só número real m que verifica a condição f(x)− f(0) = mx+ o(x) (precisamente o número m = f ′(0)); no caso de f não ser diferenciável na origem, nenhum número verifica a condição referida. Para verificar estas afirmações basta notar que, se existe (pelo menos) um m ∈ R satisfazendo a condição em causa, se tem necessariamente, em qualquer ponto x do domı́nio de f distinto de 0: f(x)− f(0) x = m+ o(x) x , donde, atendendo a que o segundo membro tende para m quando x → 0, pode concluir-se que f é diferenciável na origem e que f ′(0) = m; e é óbvio que, reciprocamente, sendo f diferenciável na origem, o número m = f ′(0) satisfaz a condição em referência. Assim, dizer que f é diferenciável no ponto 0 equivale a afirmar a existência de um real m (que aliás será único) tal que o produto mx aproxima o acréscimo f(x) − f(0) com um erro que é um infinitésimo de ordem superior à primeira quando x→ 0. Para podermos dar a esta condição de diferenciabilidade a forma que nos interessará definitivamente, convém recordar (como aliás foi feito no parágrafo 3.1) que uma aplicação linear de Rq em Rp pode sempre repre- sentar-se por uma matriz de elementos reais do tipo p × q, sendo bijectiva a correspondência entre estas matrizes e aquelas aplicações. Daqui decorre imediatamente que as aplicações lineares de R em si mesmo (caso p = q = 1) se correspondem bijectivamente com as matrizes do tipo [m], com um só elemento real, isto é, com os próprios números reais. Na realidade, qualquer aplicação linear L : R → R é representável na forma: L(x) = mx (x ∈ R), em que m é um número real determinado univocamente pela aplicação L (m é precisamente o valor de L no ponto 1) e, em sentido inverso, a todo o número real m pode associar-se, por meio da fórmula precedente, uma única aplicação linear de R em si mesmo. 1Como é sabido, poderia em particular reconhecer-se que uma função n vezes diferenciável na origem é aproximável por um polinómio de grau ≤ n, o seu polinómio de Mac-Laurin, com um erro rn(x) = o(xn). 85 Caṕıtulo 4. Cálculo diferencial Tendo em conta o resultado expresso na nota anterior — segundo o qual as aplicações lineares de R em si mesmo podem praticamente «identificar-se» com os próprios números reais — podeŕıamos então dizer que, para que f seja diferenciável na origem, é necessário e suficiente que exista uma aplicação linear L0 : R → R tal que, em todo o ponto x do domı́nio de f , se verifique a igualdade: f(x)− f(0) = L0(x) + o(x). Considerando, em vez da origem, um ponto qualquer a ∈ R (e uma função f cujo domı́nio contivesse uma vizinhança do ponto a) obteŕıamos de forma análoga a conclusão seguinte: f é diferenciável no ponto a sse existe uma aplicação linear La : R → R tal que, em qualquer ponto x do domı́nio de f , se tenha: f(x)− f(a) = La(x− a) + o(x− a), ou, pondo x− a = h: f(a+ h)− f(a) = La(h) + o(h), (para todo o real h tal que a+ h pertença ao domı́nio de f). Por exemplo, para f(x) = x3 tem-se, em qualquer ponto a ∈ R: (a+ h)3 − a3 = 3a2h+ 3ah2 + h3, com h real arbitrário. Neste caso, a aplicação linear La é definida por La(h) = 3a 2h para todo o h ∈ R, sendo o termo de erro 3ah2 + h3, que é evidentemente o(h); o número real 3a2, que determina a aplicação linear La, é precisamente f ′(a). Pode assim dizer-se que as funções diferenciáveis no ponto a são precisamente aquelas cujo acréscimo, f(a + h) − f(a), pode ser aproximado por uma função linear de h, sendo o erro correspondente a essa aproximação um infinitésimo de ordem superior à primeira quando h → 0 (em termos mais intuitivos: a menos de um infinitésimo de ordem superior à primeira, o acréscimo da função é uma função linear do acréscimo da variável independente). Convirá reter esta conclusão porque, como veremos, ela será a base mais con- veniente para a generalização do conceito de derivada ao caso das funções, reais ou vectoriais, de variável vectorial. 4.2 Cálculo diferencial de primeira ordem: derivadas parciais, diferenciabilidade; teorema do valor médio Seja f(x, y) uma função real definida num conjunto D ⊂ R2 e (a, b) um ponto interior a D; procuraremos agora avaliar a «taxa de variação» de f(x, y) quando se atribuam «pequenos acréscimos» ao ponto (x, y), a partir da posição (a, b) (Figura 4.2). 86 4.2. Cálculo diferencial de primeira ordem PSfrag replacements xa y b D Figura 4.2 Convém observar já que, enquanto no caso das funções de uma variável os «acréscimos» posśıveis tinham todos a mesma direcção — a do eixo das abcissas — agora podemos considerar acréscimos (h, k) com qualquer das direcções do plano (deverá naturalmente exigir-se que o ponto (a + h, b + k) pertença ainda ao domı́nio de f , mas isso decerto se verificará se o módulo do vector (h, k) for suficientemente pequeno, visto que supusemos que o ponto (a, b) era interior a D); e será natural esperar que, em geral, a «taxa de variação» de f dependa da direcção considerada (assim, por exemplo, se f(x, y) designasse a temperatura no ponto (x, y), situado no chão de uma oficina com um forno em funcionamento e uma porta aberta para o exterior, era de esperar que a temperatura aumentasse rapidamente nas direcções que conduziam ao forno e diminuisse nas que levavam à sáıda). Para maior simplicidade, consideremos em primeiro lugar duas direcções «pri- vilegiadas»: as dos eixos coordenados. Se (h, k) tiver a direcção do eixo dos x — isto é, se for k = 0 e h 6= 0 — a «razão incremental» a considerar será: f(a+ h, b)− f(a, b) h Ao limite desta razão quando h → 0, se existir, chama-se derivada parcial da função f , no ponto (a, b), em ordem à primeira variável, usando-se para designá- la qualquer dos śımbolos: D1f(a, b), f ′1(a, b) ou, se estiver convencionado que a primeira variável é designada por x, Dxf(a, b), f ′x(a, b), ∂f/∂x(a, b); quando se tenha escrito z = f(x, y), poderá usar-se ainda o śımbolo ∂z/∂x(a, b) para designar a mesma derivada. Reconhece-se imediatamente que a derivada parcial ∂f/∂x(a, b), quando existe, coincide com a derivada (ordinária) no ponto a de uma função de uma única variável real: precisamente a «função parcial» ϕ que se obtém de f por fixação de y no valor b. Com efeito, pondo ϕ(x) = f(x, b), tem-se (desde que exista uma das 87 Caṕıtulo 4. Cálculo diferencial As derivadas parciais são casos particulares do conceito de derivada direcci- onal: ∂f/∂x(a, b) é evidentemente a derivada de f em (a, b) segundo o vector unitário e1 = (1, 0) e, analogamente, tem-se ∂f/∂y(a, b) = ∂f/∂e2(a, b) (admitida a existência de tais derivadas). Como exemplo, consideremos a função definida em R2 pela fórmula: z = x2y, um ponto qualquer (a, b) e um vector v = (α, β); ter-se-á: ∂z ∂v (a, b) = lim t→0 (a+ tα)2(b+ tβ)− a2b t = 2abα + a2β. Em particular, para v = e1 e v = e2, obtêm-se as derivadas parciais: ∂z ∂x (a, b) = 2ab, ∂z ∂y (a, b) = a2. Do facto de a derivação segundo um vector se poder reduzir à derivação ordiná- ria decorre facilmente a validade das regras de derivação usuais no novo caso. As- sim, por exemplo, sendo f, g funções reais definidas num conjunto D ⊂ R2, (a, b) ∈ intD e v ∈ R2, se existirem (finitas) as derivadas ∂f/∂v(a, b) e ∂g/∂v(a, b), exis- tirão também as derivadas das funções f + g, f − g e fg segundo o vector v, no ponto (a, b) e verificar-se-ão as igualdades: ∂(f ± g) ∂v (a, b) = ∂f ∂v (a, b)± ∂g ∂v (a, b), ∂(fg) ∂v (a, b) = ∂f ∂v (a, b)g(a, b) + f(a, b) ∂g ∂v (a, b); se, além disso, for g(x, y) 6= 0 em D — ou numa bola centrada em (a, b) — ter-se-á também: ∂ ( f g ) ∂v (a, b) = ∂f ∂v (a, b)g(a, b)− f(a, b) ∂g ∂v (a, b) [g(a, b)]2 , etc. Nas condições anteriormente fixadas sobre D, (a, b) e v, consideremos agora o conjunto de todas as funções f : D → R que admitem, no ponto (a, b), uma derivada (finita) segundo o vector v. É fácil ver que este con- junto, munido das operações usuais de adição de funções e de multiplicação de um número real por uma função, é um espaço vectorial real; além disso, mostram as relações (onde omitimos a indicação do ponto (a, b)): Dv(f + g) = Dv(f) +Dv(g) e Dv(cf) = cDv(f), válidas para quaisquer funções f, g do referido espaço e qualquer real c, que a aplicação (desse espaço vectorial em R) que faz corresponder a cada função f o número Dvf(a, b) é uma aplicação linear. 90 4.2. Cálculo diferencial de primeira ordem Por outro lado, tem também interesse ver como varia a derivada se, fixando a função f e o ponto (a, b), substituirmos o vector v = (α, β) por outro vector com a mesma direcção, cv (com c ∈ R \ {0}); ter-se-á, sempre que exista algum dos limites considerados: Dcvf(a, b) = lim t→0 f(a+ tcα, b+ tcβ)− f(a, b) t = c lim t→0 f(a+ tcα, b+ tcβ)− f(a, b) tc = cDvf(a, b). Este resultado poderia talvez sugerir a questão seguinte: será também verdade que, se existirem as derivadas de f segundo dois vectores quaisquer v1, e v2, existirá necessariamente a derivada Dv1+v2f (sempre no ponto (a, b), cuja indicação omitimos) verificando-se a relação: Dv1+v2f = Dv1f +Dv2f? Se tal conjectura fosse verdadeira, esta relação, em conjunto com a igualdade acima provada (apenas no caso c 6= 0, mas também obviamente válida se for c = 0), Dcvf = cDvf , traduziriam um «comportamento linear» da operação de derivação, já não a respeito das funções sobre as quais actua, mas relativamente aos vectores v ∈ R2 segundo os quais essa operação é efectuada. Veremos oportunamente que a resposta à questão anterior é afirmativa, quando se considerem apenas funções com um certo grau de «regularidade»; em geral, porém, essa resposta é negativa, como vamos ver. Para esse efeito, consideremos em primeiro lugar a função f : R2 → R definida pela forma seguinte: f(x, y) = { 0 se xy = 0√ x2 + y2 se xy 6= 0. Reconhece-se imediatamente que De1f(0, 0) = ∂f ∂x (0, 0) = 0 De2f(0, 0) = ∂f ∂y (0, 0) = 0 e, portanto, quaisquer que sejam c1, c2 ∈ R, Dc1e1f(0, 0) = 0 = Dc2e2f(0, 0). Porém, se for v = c1e1 +c2e2 um vector com direcção distinta das dos eixos coordenados (c1c2 6= 0) não existirá a derivada Dvf(0, 0), visto que não existe o limite quando t→ 0 da função: f(c1t, c2t)− f(0, 0) t = √ c21 + c 2 2 |t| t . 91 Caṕıtulo 4. Cálculo diferencial Mostra este exemplo que podem existir as derivadas de f segundo dois vectores e não existir a derivada segundo a sua soma; mas é fácil ver que, mesmo que esta última derivada também exista, poderá não ser igual à soma das duas primeiras. Para tal, basta considerar a função definida por: g(x, y) = { 0 se xy = 0 x+ y se xy 6= 0. e verificar, por exemplo, que De1+e2g(0, 0) = 2, enquanto De1g(0, 0) = De2g(0, 0) = 0. Contrariamente ao que talvez pudesse ser sugerido, a uma primeira vista, por certos resultados válidos no caso das funções de uma variável (no qual, por exemplo, o facto de uma função ter derivada finita num ponto garante a sua continuidade nesse ponto e até a possibilidade de uma «boa aproximação linear», no sentido indicado na parte final do parágrafo 4.1), para funções de duas variáveis reais a existência de derivadas parciais finitas num ponto não assegura sequer que a função nele seja cont́ınua; aliás, não seria dif́ıcil prevê-lo se se tivesse em conta que a existência ou não existência das derivadas ∂f/∂x(a, b) e ∂f/∂y(a, b), bem como os valores que elas eventualmente assumam, dependem apenas dos valores de f em pontos situados sobre as rectas de equações y = b e x = a, não sendo portanto afectados por uma alteração arbitrária da função nos pontos do seu domı́nio não pertencentes a qualquer dessas rectas (alteração que certamente poderia afectar a continuidade de f em (a, b)). Mais dif́ıcil, porém, seria imaginar que uma função de duas variáveis reais poderia ter derivada (finita), num dado ponto, segundo qualquer vector v ∈ R2 e não ser cont́ınua nesse ponto. No entanto, um exemplo a que já nos referimos no parágrafo 3.2, o da função f : R2 → R definida por: f(x, y) = { 1 se x 6= 0 e y = x2 0 se x = 0 ou y 6= x2, permite reconhecê-lo facilmente. Na verdade é óbvio que, para qualquer vector v ∈ R2 , se tem Dvf(0, 0) = 0 e já sabemos que f não é cont́ınua na origem. Recorde-se que, no caso das funções de uma variável, a noção de diferenciabili- dade foi definida pela forma seguinte: dizia-se que uma função era diferenciável no ponto a sse tivesse derivada finita nesse ponto; nestas condições, poderia ocorrer que, para funções de duas variáveis, se adoptasse um conceito «análogo», dizendo que f(x, y) era diferenciável no ponto (a, b) sse existissem (finitas) as derivadas parciais ∂f/∂x(a, b) e ∂f/∂y(a, b) ou, mais restritivamente, todas as derivadas ∂f/∂v(a, b), com v vector arbitrário de R2. As considerações anteriores, porém, revelam que uma tal noção de «diferenciabilidade» não possuiria pelo menos uma das propriedades essenciais verificadas no caso das funções de variável real (a de «diferenciabilidade implicar continuidade»); além disso, será fácil ver poste- riormente (o último exemplo indicado poderá servir ainda para esse efeito) que 92 4.2. Cálculo diferencial de primeira ordem Antes de passarmos ao caso das funções vectoriais, vejamos um exemplo: a função f(x, y, z) = x2 − z2 + 2x− y + 3, para (x, y, z) ∈ R3, é diferenciável no ponto (0, 0, 0). Basta observar que se tem, para x, y, z ∈ R: f(x, y, z) = 3 + 2x− y + o (√ x2 + y2 + z2 ) ou f(x, y, z) = f(0, 0, 0) + Lo[(x, y, z)] + o (√ x2 + y2 + z2 ) , designando por Lo a aplicação linear de R3 em R correspondente à matriz [2 −1 0]. A extensão do conceito de diferenciabilidade às funções vectoriais é agora ime- diata. Sendo f : D → Rm, com D ⊂ Rn e a ∈ intD, diremos que f é diferenciável no ponto a sse existir uma aplicação linear La : Rn → Rm tal que, em todo o ponto h tal que a + h ∈ D, se tenha: f(a + h) = f(a) + La(h) + o ( ‖h‖ ) ; ou, de modo equivalente, sse existir uma matriz de elementos reais, Ma = α11 α12 · · · α1n. . . . . . . . . . . . . . . . . . . . αm1 αm2 · · · αmn  e uma função ϕ : D → Rm, infinitésima no ponto a, tais que se verifique, em todo o ponto x ∈ D, a igualdade: f(x) = f(a) +Ma(x− a) + ‖x− a‖ϕ(x), (com a interpretação óbvia dos vectores f(x), f(a), ϕ(x) e (x−a) como matrizes coluna). Em termos de coordenadas, esta igualdade traduzir-se-á pelo sistema de m equações: fi(x1, . . . , xn) = fi(a1, . . . , an) + αi1(x1 − a1) + · · · · · ·+ αin(xn − an) + ‖x− a‖ϕi(x1, . . . , xn) (i = 1, . . . ,m). Tendo em conta que ϕ : D → Rm é infinitésima quando x → a sse cada uma das suas funções coordenadas ϕi o for, pode então concluir-se imediatamente que: Teorema 4.1. Seja f : D → Rm (com D ⊂ Rn) e a ∈ intD; para que f seja diferenciável no ponto a é necessário e suficiente que cada uma das suas funções coordenadas seja diferenciável no mesmo ponto. 95 Caṕıtulo 4. Cálculo diferencial O esforço feito para obtermos uma boa definição de diferenciabilidade irá agora ser compensado com um série de propriedades enunciadas nos teoremas seguintes, que inclui praticamente todas as que podeŕıamos considerar desejáveis: Teorema 4.2. Se f é diferenciável no ponto a: 1. f é cont́ınua em a, 2. para todo o vector v ∈ Rn, existe a derivada Dvf(a). Demonstração. 1. Sendo f diferenciável no ponto a, ter-se-á para todo o x ∈ D: f(x) = f(a) + La(x)− La(a) + ‖x− a‖ϕ(x) (sendo La uma aplicação linear de Rn em Rm e ϕ : D → Rm um infinitésimo quando x → a); e é claro que cada um dos termos do 2o membro é uma função cont́ınua no ponto a (o primeiro e o terceiro por serem constantes; o segundo, porque, como vimos oportunamente, uma aplicação linear é cont́ı- nua em qualquer ponto; e o último por ser o produto de uma função escalar cont́ınua em todo o seu domı́nio pelo infinitésimo ϕ, obviamente cont́ınuo no ponto a). 2. Seja v um vector qualquer de Rn; substituindo, na última igualdade anterior, x por a + tv (o que é leǵıtimo, pelo menos para valores suficientemente pequenos de |t|, por a ser interior ao domı́nio D das funções f e ϕ) obtém- se: f(a + tv) = f(a) + tLa(v) + |t|‖v‖ϕ(a + tv) ou, supondo agora também t 6= 0: f(a + tv)− f(a) t = La(v) + ‖v‖ |t| t ϕ(a + tv) Quando t→ 0, a segunda parcela do 2o membro (produto da função escalar limitada ‖v‖ |t| t por ϕ(a+tv), que tende evidentemente para 0 quando t→ 0) é infinitésima e a primeira é constante; existe portanto Dvf(a) e verifica-se a igualdade: Dvf(a) = La(v). Corolário. Sendo f : D → Rm (D ⊂ Rn) uma função diferenciável no ponto a, existe uma única aplicação linear La tal que: f(x) = f(a) + La(x− a) + o (‖x− a‖) , 96 4.2. Cálculo diferencial de primeira ordem para todo o x no domı́nio de f , e a matriz correspondente a La é a matriz: Ma =  ∂f1 ∂x1 (a) · · · ∂f1 ∂xn (a) . . . . . . . . . . . . . . . . . . . . ∂fm ∂x1 (a) · · · ∂fm ∂xn (a)  (onde fi é a i a função coordenada de f). Demonstração. Atendendo à igualdade final da demonstração do Teorema 4.2: La(v) = Dvf(a) e ao facto de a derivada de f segundo um vector v ser única (quando existe), logo se reconhece que, nas condições da hipótese, fica univocamente determinado o valor da aplicação La em cada vector v ∈ Rn, o que prova a unicidade de La. Por outro lado (sendo e1, . . . , en os vectores da base canónica de Rn) os elementos da coluna de ordem j da matriz Ma devem ser as coordenadas, na base canónica de Rm, do vector La(ej) = Dejf(a) = ∂f/∂xj(a); e já sabemos que essas coordenadas são precisamente as derivadas parciais, ∂fi/∂xj(a) (i = 1, . . . ,m) das funções coordenadas de f . Registaremos agora algumas definições importantes: Quando f é diferenciável no ponto a, chama-se derivada de f no ponto a, e designa-se por f ′(a), a (única) aplicação linear La que verifica a condição expressa no enunciado do corolário anterior; tem-se, portanto, em qualquer ponto x do domı́nio de f : f(x) = f(a) + f ′(a)(x− a) + o (‖x− a‖) . À matriz Ma, correspondente à aplicação f ′(a), chama-se matriz jacobiana de f no ponto a. Sendo h um vector arbitrário de Rn, ao valor da aplicação f ′(a) no ponto h, f ′(a)(h), costuma-se chamar diferencial da função f no ponto a relativo ao vector h, por vezes designado por dfa(h); porém, tendo em conta as igualdades: dfa(h) = f ′(a)(h) = La(h) = Dhf(a), logo se vê que o diferencial de f relativo a um vector qualquer h não é mais do que a derivada da função f segundo esse mesmo vector. Antes de prosseguirmos na descrição de propriedades importantes da noção de diferenciabilidade, convirá talvez destacar alguns aspectos e casos particulares significativos que decorrem das ideias já expostas e ver alguns exemplos. Em primeiro lugar recorde-se que, numa observação anterior, vimos que era posśıvel em geral existirem as derivadas Dv1f(a) e Dv2f(a) sem existir, ou exis- tindo com valor diferente da soma daquelas, a derivada Dv1+v2f(a). Tal não 97
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved