Skip to content

Instantly share code, notes, and snippets.

@VincentTam
Last active November 2, 2025 20:01
Show Gist options
  • Select an option

  • Save VincentTam/53dbad0a637753e4f601637a93a2a38f to your computer and use it in GitHub Desktop.

Select an option

Save VincentTam/53dbad0a637753e4f601637a93a2a38f to your computer and use it in GitHub Desktop.
vin's discord math notes chap. 2

這個數列一直上升,其實很合乎直覺,因為複利過程中,將一週期的本利和更新作下一週期的本金,可以賺更多。n 越大,代表更新本利和次數更多,自然賺更多。 思考:這個(本利和)數列若可以上升至「無限大」(想要多大,就有多大。比如想要存款一億元,就真的有個 n 值,使數列中有一項不少於一億),那會發生甚麼事? 答:||那還工作幹嘛?存錢進銀行,然後設定 n「無限大」,讓自己躺着賺,想有多少錢花,就有多少錢花——但世上的貨幣是有限的,那麼貨幣供應會短缺。|| 為何上述事情不會發生? 答:||從上面實驗觀測,當 n 「很大」時,該數列「接近」一個約為「2.71828」的數字。|| 上面的解答只為給大家一個直覺,並非正式答案,而是背後正式數學內容的一個引子。

接下來假設大家已熟悉要用上

  • 等差級數及等比級數(求和、公差/比、項數、通項式)
  • 二項式定理(最基礎版本,指數為自然數)

等差數列

高斯 (Gauss) 經典童年故事:老師要他們算 1 + 2 + 3 + ⋯ + 100,他用 5 秒算完,觀察 1 + 100 = 2 + 99 = 3 + 98 = ⋯ 99 + 2 = 100 + 1 更一般表達形式為 首項 + 末項 = (首項 + 公差) + (末項 - 公差) = ⋯ (末項 - 公差) + (首項 + 公差) = 末項 + 首項 留意上面每行相等,所以有 (首項 + 末項) 上面行數為 (末項 - 首項) / 公差 + 1 為何要 "+1"? 1, 2, …, 首項, 首項 + 1, …, 末項 - 1, 末項 __-) 1, 2, …, 首項 __ 首項 + 1, …, 末項 - 1, 末項 從 {首項 + 1, …, 末項 - 1, 末項} 中取出 {首項 + 公差, …, 末項},{後者} 為 {前者} 的 1 / 公差,因為 {前者} 的公差個連續數中({首項 + 1, 首項 + 2, …, 首項 + 公差 - 1, 首項 + 公差}),只取 {首項 + 公差},當中有 [(末項 - 首項) / 公差] 項。 上述數行過程中漏數首行 "首項 + 末項",所以要加 1。 最後因於原等差數列中每一項出現兩次,所以要除以 2。 等差數列和 = (首項 + 末項) [(末項 - 首項) / 公差 + 1] / 2

等比數列

最簡單情形:1, r, r², r³, …, rⁿ 求和 Sₙ₊₁ = 1 + r + r² ⋯ + rⁿ 時將和乘以 r,發現一堆重覆的項。 Sₙ₊₁ = 1 + r + r² + r³ + ⋯ + rⁿ -) r Sₙ₊₁ = r + r² + r³ + ⋯ + rⁿ + rⁿ⁺¹ (1 - r) Sₙ₊₁ = 1 - rⁿ⁺¹ 這裏我們在 "S" 右下加下標 "ₙ₊₁",寫成 "Sₙ₊₁",因為

  • "S" 表示英語 "和" ("sum")
  • 下標 "₊₁" 表示 "(從 1 開始)加到第 n+1 項"
  • 下標出現 "₊₁",可從起始項理解:S₁ = 1, S₂ = 1 + r。留意 r 的最大次方比下標少 1 ℹ️ 碰到不懂的規律,可先試着從最簡單的案例理解。 留意上面粗體公式中,上下標皆為 n + 1,可以 n 替換。 Sₙ = (1 - rⁿ) / (1 - r), ⚠️ r ≠ 1 ⚠️ 每當出現分數時,要思考分母何時為 0,以避免分母為 0。 遇上首項 a (≠ 1) 時, 抽出首項 "a (1, r, r², r³, …, rⁿ)",再把括號內的數加起來。 不難發現上面粗體公式 變成 Sₙ = a(1 - rⁿ) / (1 - r), ⚠️ r ≠ 1

上式給出 xⁿ - 1 的因式分解,留意上式分子為 1 減去變量 rn 次方,代入 a = 1,r = x 並扭轉(分子及分母)正負,即為 xⁿ - 1。兩邊乘以分母 x - 1,即有 (x - 1)(xⁿ⁻¹ + xⁿ⁻² + ⋯ + x + 1) = xⁿ - 1。 💡 留意__等式兩邊__次數相等。

  • 左邊次數為 1 + (n - 1) = n
    • 因式 x -1 次數 1
    • 因式 xⁿ⁻¹ + xⁿ⁻² + ⋯ + x + 1 次數 n - 1
  • 右邊次數為 n 💡套用等比數列求和公式算 a + ar + ar² + ⋯ + arⁿ⁻¹ 時,可先察看兩邊次數是否相等,才繼續計算。 使用上面方法,可處理一些簡單的因式分解。 x² - 1 = (x - 1) (x + 1) x⁴ - 1 = (x² - 1) (x² + 1) = (x - 1)(x + 1)(x² + 1) x⁸ - 1 = (x⁴ - 1) (x⁴ + 1) = ⋯ = (x - 1)(x + 1)(x² + 1)(x⁴ + 1)        ₙ 練習:試分解x² - 1 ℹ️ 其實 x⁸ - 1 尚未完全分解,因為 x⁴ + 1 還可繼續分解成 (x² + √2 x + 1) (x² - √2 x + 1),但這太複雜 ||要用上三角函數和複數||,在後面章節再談。

那麼 xⁿ + 1 怎樣因式分解?留意若 n 為奇數的話,把 "-x" 代入 xⁿ - 1 的因式分解,即有 ||-xⁿ - 1 = (-x - 1) (xⁿ⁻¹ - xⁿ⁻² + ⋯ - x + 1)|| xⁿ + 1 = (x + 1) (xⁿ⁻¹ - xⁿ⁻² + ⋯ - x + 1)。 留意__上面等式右邊較長的因數__ 正負號交替。 最簡單的例子:x³ + 1 = (x + 1) (x² - x + 1) x⁵ + 1 = (x + 1) (x⁴ - x³ + x² - x + 1) 若 n 為雙數怎辦? 練習:試分解 x⁶ + 1 ||= (x²)³ + 1 = ⋯||。 最後只剩下 n 為 2 的次方 (n = 2)無法以__上面公式__解決。

練習:若上面__兩條因式分解公式__中,把 xⁿ ± 1 改成 aⁿ ± bⁿ,那麼相應的公式會怎樣?

  1. 代入 x = 1.5 = 3/2,寫成分數形式。
  2. 弄走兩邊分母 ||兩邊乘以 2||。
  3. 分別以 ab 替換分子和分母。

兩項式初探

我高中的教科書為求教學方便,只用數學歸納法證明,雖然邏輯正確,但把背後的組合學意義都隱藏起來,實在可惜。

取個簡單例子:(a + b)³,寫成

a  a  a
b  b  b

從每直行中任選 {a, b} 內一數,算它們的積,如全選 a 就有積 a³, 選 (a, b, a), (b, a, a) 或 (a, a, b) 則有積 a²b。 每一個積都是 (a + b)³ 展開後的一項。 留意 (_, _, _) 中,a 的個數代表積中 a 的次方。當所有 a 定好後,在空格填入 b——當所有 a 填好後,_ 空格也好,b 也好,只不過是個字符,不會影響數數過程。 要知道 a²b 在 (a + b)³ 展開後出現多少次,只需數 (_, _, _) 中可以放兩個 a 的可能方法,換句話說,就是從位址集 {1, 2, 3} 中選取兩個位址,如 {1,2} 代表 (a, a, b);{2,3} 代表 (b, a, a)。

將以上特例一般化:展開 (a + b) 時,考慮如何從位址集 {1, 2, …, n} 中取 k 個位址,放入 ka 進 (_, _, …, _)。 由此,我們需要工具計算從 n 相異物取 k 件的所有組合數。

組合學基礎重溫

為免偏離主題,下面只會覆蓋了解二項式 (a + b) 結構所需的組合學工具:排列數和組合數。

排列

{A, B, C} 有 3! 種排列方法,第 1 位有 3 個選擇;第 2 位有 3 - 1 = 2 個選擇;第 3 位有 3 - 2 = 1 個選擇。留意上面每分句中,兩個數字相加為 3 + 1 = 4。 如此類推,則 n 相異物件有 n! = n (n - 1) (n - 2) ⋯ 2 ⋅ 1 種排列方法。 ℹ️ '⋅' 表示乘法。個人建議除非是小學基礎算術或有特別定義的積(如向量積 (vector product) 和直積 (direct product)),否則避免在有變量時使用 '×' 表示乘法,以免(在考試時因緊張)和 '𝑥' 混淆,要使用 '⋅' 或 '()' 代替。

若只需從 n 相異物件中取 0 ≤ kn 個排列,那怎麼辦?

  • k = n 的情形已做完。
  • k = 0 的情形只有 1 個:甚麼都不取。
  • 其餘情形重覆上面 "第 i 位有 n + 1 - i 個選擇",i = 1, 2, …, k,所以有 n (n - 1) (n - 2) ⋯ (n + 1 - k) 種排列法。 以上數字標記為 P 或 Pₖⁿ。為方便電腦顯示,下面將使用 P
  1. 任意排列 n 相異物。
            a₁, a₂, …,                                    , aₙ
|←-------------------- n 相異物任意排列 ---------------------------→|

n! 種可能。

  1. 另一方法
  2. 先從 n 相異物中選 k 件任意排列,有 P 種可能。
  3. 再排列剩下的 n - k 件物件,有 (n - k)! 種可能。
            a₁, a₂, …, aₖ,                      aₖ₊₁,aₖ₊₂, …, aₙ
|←--- n 相異物中選 k 件任一排列 ----→|←--- 剩下 n - k 件任意排列 ----→|

共有 P ⋅ (n - k)! 種可能。

  1. 兩種方法皆能構成 n 相異物的任意排列,所以可能數應一樣。取等式 P ⋅ (n - k)! = n!,則 Pn! / (n - k)!
  2. 建立文字化理解:嘗試在上面右邊加入「忽略」兩字。不管右邊 n - k 件物件如何排列,都看成 1 種情況:甚麼都沒有。一邊望着上圖,一邊將文字「忽略」和算式中的除號「/」掛勾。

組合

n 相異物件中取出 0 ≤ kn 個,不考慮它們的排列。 例如從 {1, 2, 3, 4} 中取出組合 {1,2},(1, 2) (先取 1 後取 2) 和 (2, 1) (先取 2 後取 1) 一樣。 回想上節談過「忽略」和「除號」的連繫,所以「忽略 k 個被選物的排列」轉化為算式中的「除以 k!」。 C = P / k! = n! / [k! (n - k)!] 種可能組合。

二項式定理基本版

(a + b) 展開後其中一項 aᵏ bⁿ 的係數,代表從位址集 {1, 2, …, n} 中取 k 個位址的組合數,即 C。(像本章開首般為 (a + b) 畫一幅圖,會有助理解。)由於 a 的次方 k 取值可由 0 至 n,所以有

           n
(a + b)ⁿ = ∑ ₙCₖ aᵏbⁿ⁻ᵏ 。
          k=0

由於 (1 + 1/n) 是二項式的 n 次方,要了解它的特性(如剛才展示的上下限),需要用上二項式定理。上面不等式最具技巧的一步在於藍色分母從 n! 變成 2⁻¹。 小問題:為何上標有 "-1"? 重點在於 n! = 1 ⋅ 2 ⋅ 3 ⋯ (n - 1) n 中,當 n! 變成 (n + 1)! 時,額外乘上的數字 n + 1 是隨 n 而增長,但 2 變成 2⁺¹ 時,額外乘上的數字永遠是 2,所以當 n「足夠大」(n > 3)時,n! > 2。 取倒數後不等式反轉,於是出現 1/n! < 1/2,然後就可以運用等比數列和公式,為 (1 + 1/n) 給出上限。

上面實驗發現 n 越大,(1 + 1/n) 也越大。即若 m < n,(1 + 1/m) < (1 + 1/n)。這種數列我們叫__嚴格遞增數列__。(「嚴格遞增」比「單調遞增」「嚴格」,只接受「>」,不接受「=」。) 練習:試證 (1 + 1/n) < (1 + 1/(n + 1))⁺¹ 提示:

  1. 如上面般展開 (1 + 1/n),分離最簡單兩項。
  2. 其餘 n - 1 項中,調整分子分母配對,先把 1 / k! 放在左邊。
  3. 留意 (n - 1) / n = 1 - 1 / n < 1 - 1 / (n + 1) = n / (n + 1),如此類推。

數列 ( (1 + 1/n) ) 只升不降,但又小於 3。

  • 3 大於或等於此數列中所有項,我們稱 3 為此數列的__上界__ (upper bound)。
  • 與之相對應的就是__下界__ (lower bound)。2 小於或等於此數列中所有項,我們稱 2 為此數列的__下界__。 從實驗觀察中,我們發現此數列「最後接近 2.71828」。我們自然會問:「2.9 能否成為此數列的上界?2.8 呢?2.75 呢?」 若我們改良有關 n! 的不等式成「若 n ≥ 4,n! > 2」,再重覆上面用等比數列算 ( (1 + 1/n) ) 上界的方法,即有較少的上界 2 + 1/2 + 1/6 + (1/16) (2) = 2 + 19/24 = 2.791̇6666... 那麼這些 ( (1 + 1/n) ) 的上界(即大於此數列的所有項的數字,例如 2.7917, 2.8, 2.9, 3)中,有沒有一個最小的? 答案是肯定的,因為數學上有條叫上確界公理 (least-upper bound axiom)

上圖擷自維基,能給大家一個圖像直覺。只要右邊有一綠點在所有藍點的右邊,那麼即存在最左的一點(紅點示),使得這一點在所有藍點的右邊。

  • 綠點:集合 M 的上界
  • 藍點:集合 M 元素
  • 紅點:集合 M 的上確界,一般標記為「sup M

留意:

  • 上確界公理只說有紅點,但沒有說過怎樣算出紅點位置。
  • 紅點位置上可能但不一定有藍點——這就是「上確界」(紅點, sup M)和「最大值」(最右的藍點, max M)的分別。後者不一定能找到,本章主角本利和數列即為一例,見下面解釋。

紅點有三個特質:

  1. 所有藍點都在 紅點的左邊 或 紅點上。
  2. 從紅點向左畫一(任意長)橫線段,設線段上必有一藍點。
  3. 從紅點向右畫一橫線。所有綠點都在 紅點的右邊 或 紅點上。 用文字理解以上特質:
  4. 上確界是上界。
  5. 比上確界小的數就不是上界。
  6. 上確界是最小的上界。 練習:用變量和不等式寫出上確界的特質。
  • 我們的本利和數列 ( (1 + 1/n) ) 各項就如上圖中的藍點,只前進不後退。
  • 2.7917, 2.8, 2.9, 3 就如上圖中的綠點,在藍點的右邊。
  • 由上確界公理,可構建一紅點,代表此數列的上確界,標記為「sup {(1 + 1/n) | n ∈ ℕ}」或簡單一些「sup (1 + 1/n)」。
  • 紅點上不可能有藍點,因為此數列是嚴格遞增,即每一藍點的右邊都有另一藍點。若紅點上有藍點,藍點右邊有另一藍點,則紅點右邊有藍點,違反上面特質 1。 ℹ️ 自然數集 ℕ 是否包括 0,視乎課題和作者選擇。本章 ℕ 包括 0,因為主角是數列:數列可一個個地數,而我們日常生活數數是由 1 開始數的。

觀察:當數列 (aₙ) 單調遞增且有上界時,先取 L = sup aₙ(∈ ℝ,獨立於 n),再任取一正數 ε > 0(代表數列中任意一項和 L 的絕對誤差)。按特質 2,總有一指標 N ∈ ℕ,使得 $$L - \epsilon &lt; a_N \le L。$$

由於 (aₙ) 單調遞增且 L 是上界 $$L - \epsilon &lt; \underbrace{a_N &lt; a_{N+1} &lt; a_{N+2} &lt; \dots}_{\textrm{數列 } \left(a_n\right)_n \textrm{ 的「尾巴」}} \le L$$

注意這裏我們先固定正數 ε > 0 的值,再按 ε 的值取 N ∈ ℕ(「尾巴頭」),所以有些書會寫 N = N (ε) ,代表 Nε 而變。 由於絕對誤差 ε 的選取可以是__任意小__(想取有多小就有多小,例如 ε = 10⁻⁵, 10⁻⁸, …),所以單調遞增數列 (aₙ) 「任意接近」它的上確界 L = sup aₙ。 只要將數列正負號倒轉,即有單調遞減數列「任意接近」它的下確界。 我們即將引入符號,表達一數列「任意接近」一個數字。

數列極限 ε-N 定義

由於我們想引入定義,而定義越廣,能套用的機會就越大,所以引入符號前,再觀察上面不等式,看看有甚麼條件能放鬆。 很多時實例會幫助思考抽象條件:以 ( (-1)/n ) 為例 (-1, 1/2, -1/3, 1/4, …),它的「尾巴」很可任意小。 || 對任意小的 ε > 0, 0 - ε < (-1) / n < 0 + ε ⟺ |1 / n| < ε || || ⟺ n > 1 / ε ⟸ (N = ⌈1 / ε⌉ 及 nN) ||

  1. 數列 (aₙ) 不需要單調遞增/單調遞減。
  2. L ∈ ℝ 不需要是上界/下界。
  3. 留意上面隱藏文字中的單向箭咀 '⟸' 上面不等式可改寫做 $$L - \epsilon &lt; \underbrace{a_N &lt; a_{N+1} &lt; a_{N+2} &lt; \dots}_{\textrm{數列 } \left(a_n\right)_n \textrm{ 的「尾巴」}} &lt; L + \epsilon$$

先用個較接近人類語言的方式寫極限定義:

能找出固定的實數 L ∈ ℝ(獨立於下面的 ε > 0)。 對於任意小的絕對誤差 ε > 0,都能找到一個「尾巴頭」N = N(ε) ∈ ℕ,使得整條「尾巴」都被包含在「Lε-鄰域」(L - ε, L + ε) 內。 此時定義 L 為數列 (aₙ) 的極限

有文字理解不夠,最終要用符號正式寫一次。 引入兩個邏輯符號 '∀'(對於所有)和 '∃'(存在)。

  • 能找出……L ∈ ℝ:∃ L ∈ ℝ
  • 對於……ε > 0:∀ ε > 0
  • 都能找到……N = N(ε) ∈ ℕ:∃ N ∈ ℕ
  • 整條「尾巴」:{aₙ | nN}
  • 整條「尾巴」都被包含在……(L - ε, L + ε):∀ nN, | aₙ - L | < ε

把上面右邊的符號一口氣寫完

L ∈ ℝ : ∀ ε > 0 : ∃ N ∈ ℕ : ∀ nN, | aₙ - L | < εL 滿足以上條件,則稱__L 為數列 (aₙ) 的極限__。 可記作「當 n → +∞,aₙL」或 $L = \lim_{n \to +\infty} a_n$

上面用符號記 (aₙ) 的極限 L 時,使用了等號 '='。若極限非唯一,將會得出「L = lim aₙ = L'」,這和「LL'」衝突,所以我們需要證明極限值唯一,使用等號 '=' 標示極限值方有意義。

  (𝑎ₙ)ₙ 的 𝑁-尾巴  (𝑎ₙ)ₙ 的 𝑁′-尾巴
           │              │
           ↓              ↓
──(─────┼─────)───────(─────┼─────)──→
 𝐿−𝜀    𝐿    𝐿+𝜀     𝐿′−𝜀   𝐿′   𝐿′+𝜀

   𝐿 的 𝜀-鄰域          𝐿′ 的 𝜀-鄰域

證明技巧很經典,有兩個極限 LL′,即運用極限定義得出 (aₙ) 的兩條「尾巴」({aₙ | nN} 和 {aₙ | nN′})。注意兩條「尾巴」必定是一個包含住另一個,所以只需取較短的一條,以同時滿足兩個「鄰域條件」。 | L - L′ | ≤ | L - aₙ | + | aₙ - L′ | ≤ 2ε 留意上面不等式中 LL′ 獨立於 ε,而 ε > 0 任意小。 圖像直覺:LL′ 的距離有 2ε,然後 ε 不停縮小。 我們的目標是 L = L′,由於已知條件已用盡,LL′ 獨立於 ε,所以用反證法:設 LL′,則 | L - L′ | > 0。取 ε = | L - L′ | / 3,則上面不等式變成 | L - L′ | ≤ 2 | L - L′ | / 3,此不等式顯然錯誤,所以假設 LL′ 錯誤。 剛才我們證明一條引理。

a ≥ 0,且對任意 c > 0,ac。證明 a = 0。 本科基礎分析碰到這引理時,老師說「這個日後好駛好用。」

極限的四則運算很直覺,它們的證明能練習極限定義,上網也能查到,在此不敍。 練習:對於任意實數 r,等比數列 (rⁿ) 的極限存在嗎? 提示:針對 | r | 的大小分開幾種情形,使用二項式定理:

  1. | r | = 0 或 1
  2. 0 < | r | < 1 || 1 / (1 + c) ≤ 1 / (1 + nc) ,取 n → +∞ ||
  3. | r | > 1 || (1 + c) ≥ 1 + nc,取 n → +∞ ||

數列的單調收斂定理

上面已證明過本章主角 ( (1 + 1/n) ) 是個嚴格遞增數列,即其中一種單調數列。 上兩節末帶出有上界的單調遞增數列「任意接近」上確界。在上節引入「極限」的定義後,我們終於可以準確且精簡地描述這一現象。這個結果就是數列的 單調收斂定理 (Monotone Convergence Theorem (for sequences))。

設 (aₙ) 是有(上界及下)界的單調數列,則它的極限存在。 至此,我們只要運用這條定理,即知極限 lim (1 + 1/n) 存在,且為此數列的上確界。 在數學中,我們叫這個極限做尤拉數(Euler's number),標記為 𝑒,約值為 2.71828。

用無窮級數構造尤拉數

設有數列 (aₙ),對於每一項 aₙ,取首 n 項之和 sₙ = a₁ + a₂ + ⋯ + aₙ,生成另一數列 (sₙ)。我們稱 (sₙ) 為 (aₙ)級數(series)。 若 (sₙ) 的極限存在,則可以簡化

$$\textrm{「} \lim_{n\to+\infty} \sum_{k=1}^n a_n \textrm{」作「} \sum_{k=1}^{+\infty} a_n \textrm{」。}$$

練習:延續上兩節的練習,求等比數列 (rⁿ) 的無窮級數。 留意上面為本章主角 ( (1 + 1/n) ) 求上界時,用二項式展開 (1 + 1/n),順手發現一條不等式(方框示)

對於所有 $n \in \Bbb{N}$

$$\boxed{\sum_{k=0}^n \frac{1}{k!} = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \cdots + \frac{1}{n!} < 3}$$

由於級數

$$\left( \sum_{k=0}^{n} \frac{1}{k!} \right)_n$$

嚴格遞增,運用單調收斂定理,可知它的極限

$$\sum_{k=0}^{+\infty} \frac{1}{k!}$$

存在。

,w sum 1/k!, k=0 to 20

由於 n! 飆升極快,為節省電腦運算時間,實驗就止停下。 上面使用 n = 20 估算無窮級數的誤差不大於

1/21! + 1/22! + ⋯ = (1/21!) (1 + 1/22 + ⋯) < (1/21!) (1 + 1/2 + ⋯) = 2/21! ─── (*)

這是個很微小的數字,比 10⁻¹⁵ 還要少。

(*) 極度粗略且不貼近真正的估算誤差,但足以說明此級數收歛之快。 留意上面的數字「極度接近」尤拉數 𝑒 = lim (1 + 1/n)

如何在直覺上說服自己,覺得這很合理?比對 本利和展開式 及 ( 1/n! ) 的級數 的第 k 項:

$$ \begin{align} &\quad \left( \sum_{k=0}^n \frac{1}{k!} \right) - \left(1 + \frac1n \right)^n \\ &= \sum_{k=2}^n \left(1 - \frac{\color{red!50}n \cdot \dots \cdot (n + 1 - k)} {\underbrace{n \cdot \dots \cdot n}_{n^k}} \right) , \frac{1}{\color{blue!50}k!} \\ &= \sum_{k=2}^n \left(1 - \left(1 - \frac1n\right)\left(1 - \frac2n\right) \dots \left(1 - \frac{k-1}{n}\right) \right) , \frac{1}{\color{blue!50}k!} \end{align} $$

k 遠小於 n,且 n「足夠大」,則括弧內的 1 - 1/n, 1 - 2/n, …, 1 - (k - 1)/n「足夠接近」1,整個大括弧「足夠接近」0。 若 k「足夠大」,1 / k!「暴跌至」0,而左邊大括弧是個介乎 0 到 1 之間的數字。 要處理大括弧內的積,其中一種思路就是化積為和。

練習:設 $n \in \bN$,對所有 $k \in {1, \dots, n}$,$x_k \in [0,1]$。證明 $$1 - \sum_{k=1}^n x_k \le \prod_{k=1}^n (1 - x_k)$$

上述不等式很粗略,因為左邊有可能為負數,但右邊永遠在 0 和 1 之間。 思考一下以上不等式的意義:代入 xₖ = cₖ ε > 0,其中 ε > 0 表示「遠比 cₖ 們小的誤差」。這時 不等式左邊 代表 不等式右邊積 的__一階估計__(first-order approximation),即只保留該積中 ε 次數 ≤ 1 的項。 為甚麼做一階估計?為甚麼 ε 次數 ≥ 2 的東西,我們想忽略?試想像 ε = 0.1,即麼 ε² = 0.01。0.1 cm 長的東西或能用間尺手畫,但 0.01 cm 長的東西已經不能用手畫。做點科學實驗,加入若干 ml 的液體,或是做烘焙磅重時,試試感受一下分配材料重量時的精確度。

現在試用文字理解上面不等式: 假設起始值 1 (例如有 1 份身家)。

  1. 大兒子分走現有身家的 x₁:起始值 1 乘以 1 - x₁,代表起始值 1 減去 x
  2. 二兒子分走剩餘身家的 x₂:
  • 不等式右邊:現值 1 - x₁ 乘以 1 - x₂,代表現值 1 - x₁ 減去當中的 x₂(即__減去 (1 - x₁) x₂__ < x₂)。
  • 不等式左邊:從 1 - x直接減去 x,減得比不等式右邊多。
  1. 三兒子分走剩餘身家的 x₃:
  • 不等式右邊:現值 (1 - x₁) (1 - x₂) 乘以 1 - x₃,代表現值 (1 - x₁) (1 - x₂) 減去當中的 x₃(即__減去 (1 - x₁) (1 - x₂) x₃__ < x₃)。
  • 不等式左邊:從 1 - x₁ - x直接減去 x,減得比不等式右邊多。 若且唯若 {xₖ | k = 1, …, n} 中最多只有一個非零元素,等式成立。(有兩個兒子拿走非零身家後,不等式左邊小於不等式右邊。) 用數學歸納法證明以上不等式,看不清現實意義,但仍有練習價值,值得一做。

以上不等式中取 xₖ₋₁ = (k - 1) / n,則上面兩極限差中的大括弧內小於 x₁ + x₂ + ⋯ + xₖ₋₁ = k(k - 1) / (2 n),此分數中的

  • 1/(2n) 調往 '∑' 外。
  • 分子 k(k - 1) 和 1 / k! 約簡成 1 / (k - 2)!。接着 '∑' 範圍改成 k = 0, …, n - 2,右邊改成 1 / k!。從上面方框框起的不等式,可知此和有上界(3) 取 n → +∞ 以完成目標。

$$ \begin{align} &\quad \left( \sum_{k=0}^n \frac{1}{k!} \right) - \left(1 + \frac1n \right)^n \\ &= \sum_{k=2}^n \left(1 - \frac{\color{red!50}n \cdot \dots \cdot (n + 1 - k)} {\underbrace{n \cdot \dots \cdot n}_{n^k}} \right) , \frac{1}{\color{blue!50}k!} \\ &= \sum_{k=2}^n \left(1 - \left(1 - \frac1n\right)\left(1 - \frac2n\right) \dots \left(1 - \frac{k-1}{n}\right) \right) , \frac{1}{\color{blue!50}k!} \\ &< \sum_{k=2}^n \frac{k(k-1)}{2n} , \frac{1}{\color{blue!50}k!} \\ &= \frac{1}{2n} \sum_{k=2}^n \frac{1}{(k-2)!} \\ &= \frac{1}{2n} \sum_{k=0}^{n-2} \frac{1}{k!} \\ &< \frac{1}{2n} , (3) \tag{$\fbox{方框不等式}$} \\ &\xrightarrow[n\to+\infty]{} 0 \end{align} $$

用極限四則運算得出理想結論。 $$e = \lim_{n\to+\infty} \left(1 + \frac1n\right)^n = \sum_{k=0}^{+\infty} \frac{1}{k!}$$

複利率和指數定律

上面為把尤拉數介紹得更簡單,把本利和假設為 r = 100% = 1 ——這顯然不設實際,因為在不少地區,放高利貸(年利率超過一定百分比,例如 60%)不合法。這時本利和數列變成 ( (1 + r/n) )。 運用同樣方法,用二項式定理展開它。

\definecolor{r}{RGB}{200,150,150} \definecolor{b}{RGB}{150,150,200} \begin{CJK}{UTF8}{bkai} $$\begin{aligned} &\quad 1 + n\left(\frac{r}{n}\right) + \frac{\color{r}n(n-1)}{\color{b}2!}\left(\frac{r}{n}\right)^2 + \frac{\color{r}n(n-1)(n-2)}{\color{b}3!}\left(\frac{r}{n}\right)^3 + \cdots \ &\quad+ \frac{\color{r}n(n-1)(n-2) \cdots 2 \cdot 1}{\color{b}n!}\left(\frac{r}{n}\right)^n \ &= 1 + r + \frac{r^2}{\color{b}2} , \underbrace{\frac{\color{r}n(n-1)}{n^2}}{<1} + \frac{r^3}{\color{b}3\cdot 2} , \underbrace{\frac{\color{r}n(n-1)(n-2)}{n^3}}{<1} + \cdots \ &\quad+ \frac{r^n}{\color{b}n \cdot (n-1) \cdots 3 \cdot 2 \cdot 1} , \underbrace{\frac{\color{r}n(n-1)(n-2) \cdots 2}{n^n}}{<1} \ &= 1 + r + \boxed{\frac{r^2}{\color{b}2} + \frac{r^3}{\color{b}3\cdot2} + \cdots + \frac{r^n}{\color{b}n(n-1)\cdots3\cdot2}} \ &< 1 + r + \frac{r^2}{\color{b}2} + \frac{r^3}{\color{b}2\cdot2} + \cdots + \frac{r^n}{\color{b}\underbrace{2\cdot2\cdots2}{=2^{n-1}}} \ &= 1 + r + \frac{r^2}{2} , \frac{1-(r/2)^{n-1}}{1-r/2} \ &< 1 + r + \frac{r^2}{2} , \frac{2}{2-r} \end{aligned}$$ 從以上展開式,易見當 $n&gt;1$, $1 + r &lt; \qty(1+\frac{r}{n})^n &lt; 2 + \frac{r^2}{2} , \frac{2}{2-r}$. \end{CJK}

一如上面順手發現的級數不等式,我們也發現這個級數是收斂的。關於二項式極限和無窮級數極限等價,證明也是同一道理,只不過將右邊分數 1 / k! 中的分子改成 rᵏ,留作練習。 可惜上述論證只對 0 < r < 2 有效。那麼對其他的 r,可以怎樣調整上面的內容?分作以下兩種情形討論:

  1. r ≥ 2:仍舊留意 n! 飆升遠比 Mⁿ 快,此處 M 為一固定的(底)數。按 r 的值選取適當的 M,使得 r / M < 1,於是我們可以用等比數列和給上界,再用單調收歛定理構建極限。留意 M 的選取不受 n 影響,還有首兩項 1 + r 仍為本利和 (1 + r/n) 下界及線性近似(linear approximation)。
  2. r < 0:(r / n)k為奇數時變負數,所以不能直接用 " (紅色分母/ nᵏ) < 1 " 使該分數消失。
  • 留意當 n 「足夠大」,「負利率本利和」(1 + r/n) 仍為正數。
    • 「負利率本利和」以引號括起,因為負利率 r < 0 不符現實,但理論上有價值,在下一節能幫助我們理解一般形式的指數定律和對數——一般課程中無法仔細討論的課題。
    • 由於我們已經引入了 "∀"(對於所有) 和 "∃"(存在)兩個符號,所以可以定義何為「足夠大」: 「當 n 足夠大,命題 P(n)成立」即「這裏存在 N ∈ ℕ,使得對於所有 nN,命題 P(n) 成立」。一條__命題__就是一句__可以被__(已知公設、公理、定義和已被證明的定理)證明為對或錯的句子。比如剛才的 "n! ≥ 2" 就是一條關於變量 n 的命題,可以記為 P(n)。那麼除了 1, 2 和 3 外,n 可取值其他的非負整數,使得 P(n) 成立。
    • 此處需要用上「足夠大」的概念,是因為當 n 是「不夠大」(n < -r)的奇數時,「負利率本利和」(1 + r/n) 變成負數。由於我們在考慮「負利率本利和」數列的極限(換句話說,給定一個任意小的鄰域,看看能否把此數列的「尾巴」裝進這個鄰域。),所以我們不管它的前 10 項、前 100 項、前一億項,只管數列的某條「尾巴」(選定一 N ∈ ℕ,然後有「N-尾巴」{ aₙ | nN })。一旦取 N = ⌈ -r ⌉,那麼隨着 n (≥ N) 增大,1 + r/n 中的 r/n 會越來越接近 0。
    • 「負利率本利和」(1 + r/n) 展開後,每一包含 r 的奇數次方的項前,有一個 r 偶數次項, 該兩項係數比例 = 後項 (2k + 1 次) / 前項 (2k 次) = [ (n - 2k) / (2k + 1) ] (r / n)。 即使 n 足夠大,只要 -r > 2k + 1,起始時 r / (2k + 1) < -1 無法控制,唯有改變策略。
    • ( (1 + r/n) ) 有嚴格遞增的尾巴。當中使用了伯努利不等式的最基本情形 "∀ x ≥ -1, ∀ n ≥ 1, (1 + x) ≥ 1 + nx"。 練習:用數學歸納法證明伯努利不等式的最基本情形。 又使用單調收歛定理構建極限。

\begin{CJK}{UTF8}{bkai} 難處:用伯努利不等式拆括弧做線性近似時,看似只能縮小分子,無法單獨對分母套用此不等式。\ 解法:把分子分母融合,砌出 $(1 + 1/?)^{\textrm{同一次方}}$ 後再套用此不等式。 \begin{align} &\quad \frac{\left(1-\frac r{n+1}\right)^{n+1}}{\left(1-\frac rn\right)^n} \tag{假設 $n &gt; r$} \ &=\left(\frac {n(n+1-r)}{(n+1)(n-r)}\right)^{n+1}\left(1-\frac rn\right)\ &=\left(1+\frac r{(n+1)(n-r)}\right)^{n+1}\left(1-\frac rn\right) \tag{伯努利不等式} \ &>\left(1+\frac r{n-r}\right)\left(1-\frac rn\right) \tag{$r > 0, n > r$}\ &=1 \end{align} (答案來自 Math.SE robjohn) \end{CJK}

可是,「負利率」 r < 0 對應的無窮級數

,,\sum_{k=0}^{+\infty} \frac{r^k}{k!}

中有負數,不能直接施展上面的不等式技巧。為了將他們全變做正數,我們需要借助一種叫「絕對收斂」的技巧。

絕對收斂與柯西數列

\begin{CJK}{UTF8}{bkai} \begin{Lemma}[絕對收斂 $\implies$ 收斂] 若 $\sum_{n=0}^{+\infty} |a_n|$ 存在(即數列 $(a_n)n$ \textbf{絕對收斂}),則 $\sum{n=0}^{+\infty} a_n$ 存在。 \end{Lemma} \end{CJK}

有了這一招,則上面無窮級數中的分子可變成正數 |r|,然後重覆套用二項式和級數比較,即可證明對所有 r ∈ ℝ

,,\lim_{n\to+\infty} \left(1 + \frac{r}{n}\right)^n = \sum_{k=0}^{+\infty} \frac{r^k}{k!}

我們暫且標記這極限為 "exp(r)","exp" 取自英文 "exponential",中文叫「指數函數」,因為對於每一個實數 r ,這極限都有唯一的極限值。下一節會介紹另一個常用標記。 了解了「絕對收斂」如何幫助我們達成本節目標後,我們繼續此引理。 記起我們上面求用 n = 20 估算 ( 1 / n! ) 的無窮級數時的誤差: 1/21! + 1/22! + ⋯ = (1/21!) (1 + 1/22 + ⋯) < (1/21!) (1 + 1/2 + ⋯) 右邊看似做等比數列的無窮級數,心中卻想着有限項的和,然後丟掉分子中的 "- (1/2)"。 其實留這條「尾巴」的首 10 項已夠,再多無實際意義。 我們把級數 (sₙ) 看做一數列,那麼這「尾巴」的首 10 項和是 a₂₁ + a₂₂ + ⋯ + a₃₀ = s₃₀ - s₂₀。 我們剛才估算「誤差」 s₃₀ - s₂₀ (< 10⁻¹⁵)時,完全沒想過 (sₙ) 的極限值(𝑒 ≈ 2.71828)。 這提示了我們,其實不一定要知道數列的極限值,也有可能知道數列是否收斂。 極限值(例如 𝑒)是個「外在的條件」,因為在極限的定義中,極限值 L ∈ ℝ 的存在完全獨立於數列 (aₙ)。(我們不能從本利和 (1 + 1/n) 中觀察出 𝑒 來。)若然找不出數字 L,就無法使用定義證明極限。 「尾巴長度」| aₙ - aₘ | 明顯是個「內在的條件」。試用文字加圖像回想極限定義,就是將一條尾巴塞進一個「(L 的)ε-鄰域」,那麼「尾巴長度」也應任意小。

對於任意 ε > 0,存在 N ∈ ℕ,使得對於所有 m, nN,| aₙ - aₘ | < ε。 ∀ ε > 0 : ∃ N ∈ ℕ : ∀ m, nN, | aₙ - aₘ | < ε 我們稱這種數列 (aₙ)柯西數列(Cauchy sequence)。 如果先有 L(數列 (aₙ) 收斂),那麼剛才引入柯西數列前的那段字已經勾勒出為何 (aₙ) 柯西。 剛才關於估算「誤差」的討論引發我們去想,究竟反過來,柯西的「任意短尾巴」能否令「尾巴不要亂跑,固定在一 ε-鄰域」?換句話說,(aₙ) 柯西是否代表它收斂? 若然答案是肯定的,那麼「柯西」和「收斂」等價,上面的「絕對收斂 ⟹ 收斂」即可透過「柯西」得證,證明要用絕對值的三角不等式 | a + b | ≤ | a | + | b |,又留作練習。

\begin{CJK}{UTF8}{bkai} 「柯西 $\implies$ 收斂」關鍵在於找出一個子數列(subsequence)$(a_{n_k})_k$($(n_k)_k$ 是一數列,按此數列選 $(a_n)_n$ 的項),使用此子數列的極限為 $L$。之後運用「柯西的任意短尾巴」就能搞定,詳細步驟在任何基礎分析書或講義能找到。子數列極限 $L$ 可用以下三種方法構建,按難易度排列: \end{CJK}

  1. 任何數列 (aₙ) 有單調子數列。又知柯西數列 (aₙ) 有界,所以運用單調收斂定理造出此子數列的極限 L——這是波爾查諾-魏爾施特拉斯定理(Bolzano-Weierstrass Theorem)一維情況證明的大概。
  2. 俄羅斯娃娃一個套一個:
  • 最外層的娃娃裝住整個數列 (aₙ)。這個娃娃 [a, b] 裏面有另一個大小是一半的娃娃 [a, (a + b) / 2) 或 [(a + b) / 2, b]。
  • 由於數列有無窮多個,所以兩個子區間中有最少一個會包含無窮多個 (aₙ),選一個子區間做「裏面的娃娃」,大小是「外面的娃娃」的一半。
  • 重覆這個過程,得出一串一個套一個的俄羅斯娃娃。子區間兩邊端點皆為單調數列,又用單調收斂定理造出極限,再用「裏面的娃娃」可任意小得證——這是區間套定理(Nested Intervals Theorem)證明的大概。
  1. 區間套定理的進階變種版:見 Math.SE。利用柯西數列 (aₙ) 有界,構建以下三條數列:
  • 「尾巴下確界」:ℓ = inf { aₖ | kn } 單調遞減
  • 「尾巴上確界」:uₙ = sup { aₖ | kn } 單調遞增
  • 「尾巴長度」:cₙ = sup { aᵢ - aⱼ | i, jn } 任意小
  • 從文字直覺得知 cₙ = uₙ - ℓ
    • 又用單調收斂定理得知前兩數列的極限存在
      • 前者叫數列 (aₙ) 的「下極限」(limit inferior,記作 liminf aₙ
      • 後者叫數列 (aₙ) 的「上極限」(limit superior,記作 limsup aₙ
    • 「柯西的尾巴長度 cₙ 任意小」
    • 最後用極限四則運算得知前兩數列的極限值一樣

上面第三種方法用上以下經典結果: 用 liminf 和 limsup 可給出和上幾節「極限的 ε-N 定義」等價的定義。

若且唯若 lim aₙ = L ∈ ℝ,liminf aₙ = limsup aₙ = L ∈ ℝ。 為何要引入這個 liminf 和 limsup 定義?下舉一些它的優缺點。 ❌ liminf 和 limsup 很難用於實際極限值計算(取個較複雜的多項式試試)。這是因為上下界和數列的項很多時候都是用不等式連繫起來,對一些不等式做四則運算(例如從 "acbd" 推出 "a + bc + d")肯定沒有對等式容易。 ✅ 數列 (aₙ) 的 liminf 和 limsup 永遠存在,通常是個「內在的條件」,不用像 ε-N 定義般要先自行決定極限值。可是,很多高中課本和習題中的極限值可以用簡單公式(如極限的四則運算)算出,所以 ε-N 定義中的「外在條件」 L 未必如想像中那麼難求出。 ✅ 我們不能用 ε-N 直接定義何為「趨向正無限大(lim aₙ = +∞)」,因為我們不能寫 "| aₙ - (+∞) | < ε",因為我們只知道實數的四則運算,沒法清楚定義 "(+∞) - (+∞)" ||ℕ \ {偶數} vs ℕ \ {正整數} 皆為兩個(有)無限(多元素的)集合,但前者是無限集合,後者是有限集合||。只能

  • 透過 "倒數的極限為 0 且「最終是正數(當 n 足夠大時,aₙ > 0)」" (lim 1 / aₙ = 0 及 ∃ N ∈ ℕ : ∀ nN, aₙ > 0)間接定義 "lim aₙ = +∞",或
  • 乾脆將 ε-N 定義中的任意小量 "ε > 0" 用任意大量 "M > 0" 代替,語句最右邊的不等式改成 aₙ > M。 以上兩者都不及一句「liminf aₙ = limsup aₙ = +∞」來得簡潔。 "數列 (aₙ) 的 liminf 和 limsup 相等" 和 "數列 (aₙ) 的極限存在" 兩者容易掛勾,由於 liminf 和 limsup 出現在基礎分析中,所以不少數學分析書有採用這個定義,能包含 "L = ±∞" 的情形。 對於其他非數學主修的人來說,他們學微積分的目的主要為應用當中的計算技巧,解決他們領域的問題(求速度、體積、重量等),所以學習內容以計算為主。上面已舉例說明我們不能對 "±∞" 像普通實數般做四則運算,所以高中微積分課本會把 "L = ±∞" 的情形當作 "極限不存在"。 數學是科學家和工程師之間的共同語言,所以就看語境和對象的習慣,決定 "極限存在" 是否包含 "趨向無限大"。

回顧一下我們所做過的事:

  1. 用複利率構建尤拉數 𝑒
  • 從年利率 r = 100% = 1 的情況,通過兩項式定理及等比級數找出 ( (1 + 1/n) ) 上界。
  • 展示此本利和數列是嚴格遞增。
  • 實驗觀測此數列「接近」一約為 2.71828 的數,藉此引入「極限」和「上確界」。
  • 運用單調收斂定理造出它的極限 𝑒,並解釋它的存在在貨幣系統中的意義。
  • 聚焦剛才上界推導過程中順手發現的一條不等式。
    • 引入「(無窮)級數」概念,上面順手發現的不等式有 (1 / n!) 的級數。
    • 再用簡單的等比級數的不等式,以 此級數首 20 項的和 估計 (1 / n!) 的無窮級數,並粗略估算剛才近似值的誤差極小 (< 10⁻¹⁵)。由此可知此級數收斂極快。
  • 解釋為何本利和數列極限 ( (1 + 1/n) ) 和 (1 / n!) 的無窮級數等值,同為 𝑒。
  1. 用任意「實數複利率 r」構建指數函數 exp(r),嘗試重覆上節技巧,再引出一些技術問題。
  • 先為「本利和數列」( (1 + r/n) ) 找上界。
    • r > 0 的情形和上面形式相似,原理相同,並順手發現對應的無窮級數為 (rⁿ / n!),並提及「本利和數列」和對應的無窮級數等值。
    • 處理較複雜情形 r < 0:
      • 從網上借來的不等式(和伯努利不等式)推出 ( (1 + r/n) ) 「最終會」嚴格遞增,又運用單調收斂定理造出它的極限。
      • 對應的無窮級數 (rⁿ / n!) 出現負數項,引入「絕對收斂」的技巧,化負為正,以套用上點結果,於是有兩個指數函數 exp: ℝ → (0, +∞) 的等價定義。
        • 解釋「絕對收斂」的技巧:回望剛才估算 (1 / n!) 的無窮級數的過程,引入「柯西數列」的概念。
        • 給出三個證明「柯西數列」和「數列有極限」等價的方法,三者觸碰到不同的基礎分析經典結果,都用上單調收斂定理。
        • 比對兩種極限定義的優缺點。

為甚麼 "exp" 叫 「指數函數」?它和指數有甚麼關係? 試想像以年利率 r₁ 複利一年後,本利和為 (1 + r₁/n)。 之後發現一個更吸引的存款計劃,以更高的年利率為 r₂ 複利一年,本利和為 (1 + r₁/n) (1 + r₂/n) = [ (1 + r₁/n) (1 + r₂/n) ] "≈" [ 1 + (r₁ + r₂)/n ]? (線性估計方括號內的量) 兩邊取極限,按指數函數定義得 exp(r₁) exp(r₂) "≈" exp(r₁ + r₂)。我用引號包起 "≈",因為這只是我的直覺,沒有嚴謹論證。 上面用了「線性估計」,因為當 n 「很大」(如 n = 10¹⁵)時,1 / n 「很小」(如 n = 10⁻¹⁵),而 1 / n² 更是「微不足道」(如 n = 10⁻³⁰)。 當然,上面只是用直覺猜答案——這在數學和物理中,是一種重要技能。細心思考這個事實「如果命題能被證明,那麼它是對的」。反過來說,如果命題(一開始)是錯的,那麼我們不可能證明它。花時間嘗試找個不存在的證明,猶如刻舟求劍,只會徒勞無功。 另一項重要技能就是先從一些簡單的特例入手。我們不是在考試,可以借助電腦代替一些人手計算。

我們已引入了「極限」和「絕對收斂」的概念,所以我們可以精準地寫出本節的一個重要目標: exp(r₁ + r₂) = exp(r₁) exp(r₂) 或 lim [1 + (r₁ + r₂)/n] = [lim (1 + r₁/n)] [lim (1 + r₂/n)]。

https://media.discordapp.net/attachments/1087424098562494505/1166836145204776980/701077747887243354.png?ex=69086817&is=69071697&hm=af7e137cd215260a8ec4c61fedc814a333341a84761a8a4406a03ceec7b2aa83&=&format=webp&quality=lossless&width=1793&height=741 https://media.discordapp.net/attachments/1087424098562494505/1166836195217645590/701077747887243354.png?ex=69086823&is=690716a3&hm=f3a316c539401d2892104d1007b3d52a70ecd789db1d453562a3bb8c3bcea41d&=&format=webp&quality=lossless&width=655&height=893

(3) → (4) 解釋

  1. rr₂ 可能 < 0,所以加上絕對值以保證不等式成立。
  2. r₁ + r₂ 可能 < 0,所以回想構建 exp("負利率" r) 的過程中,我們用上「當 n 足夠大(n > r),『負利率本利和』數列嚴格遞增」。exp(r) 即為此數列的上確界及極限。 為確保分母 n + r₁ + r₂ 為正數,取 n > r₁ + r₂。取 (4) 式從 k = 1 到 k = n 的和。

https://media.discordapp.net/attachments/1087424098562494505/1166836340936147005/701077747887243354.png?ex=69086846&is=690716c6&hm=ec88e744b967cb5d84808fdfda9aa8bed7e8040793fa5b44b05bbe317cf6adcd&=&format=webp&quality=lossless&width=1173&height=801

此處用上兩個基本事實

  1. lim |aₙ| = 0 ⟺ lim aₙ = 0
  2. aₙbₙ 且兩數列的極限存在,則 lim aₙ ≤ lim bₙ

指數函數及對數的基礎性質

指數函數的另一種寫法

為甚麼 exp 叫指數函數?留意對於整數次方及固定底數,我們有 aᵐ = aᵐaⁿ,結構和__上面目標公式__一樣,左右各有 "+" 和 "⋅",所以 exp(r) 有個更簡短的寫法 "𝑒ʳ"。用這種寫法,__上面目標公式__變成 𝑒 = 𝑒 ⋅ 𝑒。到底哪種寫法更好?其實兩者都行,不過符號和字母組合有限。在別的課題中(如平面幾何),小楷的 e 或會被用作線段長度。又或者 "𝑒ʳ" 中的 r 太小,寫在黑板上,課室後排看不清。這時用 "exp(r)" 則更清晰,避免誤會。"𝑒²" 比 "exp(2)" 更能令初學者想起 "𝑒² = 𝑒 ⋅ 𝑒",便於學習。兩種寫法都要懂,但可按個人習慣選擇寫法。

有了這種新寫法,加上 𝑒 是 > 1 的常數,於是有 ⋯ < 𝑒⁻² < 𝑒⁻¹ < 1 < 𝑒 < 𝑒² < ⋯,用文字精簡地說,就是「指數函數在 ℤ 上嚴格遞增」。上幾節我們努力從「實利率本利和」極限構建指數函數,而這函數的定義域是 ℝ。若把 (k, 𝑒), k = -5, -4, …, 5, 畫出,然後連起來,很自然地會想到下分節目標。

指數函數嚴格遞增

x < y ⟺ 𝑒ˣ < 𝑒ʸ 等價於 h > 0 ⟹ 𝑒ʰ > 1 (為甚麼?|| 用反證法並思考 h 前隱藏的 '∀',即明白為何雙頭箭咀會變成單頭箭咀。 ||) 從一開始為本利和數列找上界時 ( (1 + r/n) ),該二項式展開後首兩項即 1 + r,而其餘項均為正數,很自然有 (1 + r/n) > 1 + r,加上指數函數是從此嚴格遞增數列的上確界而來,很自然又有 exp(r) > (1 + r/n)。兩者結合,即「當 r > 0,exp(r) > 1 + r」。至此,本分節目標已達成。 但這無阻我們問「當 r < 0,"exp(r) > 1 + r" 仍然成立?」當 r ≤ -1,答案太明顯,接下來集中討論 -1 < r < 0 的情形:數式仍和 r > 0 時一樣,不同的是背後的理由:

  • "exp(r) > (1 + r/n)" 是 n 足夠大(n > -r)的情形。
  • "(1 + r/n) > 1 + r" 則由於伯努利不等式。 於是,我們有

對於所有 x ∈ ℝ,𝑒ˣ ≥ 1 + x,若且唯若x = 0,等式成立。 用圖像理解此不等式:代表指數函數的曲線在直線 y = x + 1 之上,且它們只交於一點 (0,1)。

https://media.discordapp.net/attachments/1087424098562494505/1166836580741283900/701077747887243354.png?ex=6908687f&is=690716ff&hm=169fdbe26caae0a47e63de3890bba3b33d9a69296f6adc251526335c2d2d7080&=&format=webp&quality=lossless&width=800&height=763 https://media.discordapp.net/attachments/1087424098562494505/1166836581257203772/701077747887243354.png?ex=6908687f&is=690716ff&hm=234ed6a9d4ee5a739cd355ae1721e36ab7c1bee971100c7a0e7acecdf7b9d8e8&=&format=webp&quality=lossless&width=738&height=763

放大它們的相交點 (0, 1) 附近的圖像,肉眼所見,它們好像在「0 的 0.01 鄰域」(-0.01, 0.01) 重畳在一起。可是,上面不等式很實切地告訴我們,相交點只有一個。由此可知,繪圖工具有它的局限,雖用代算式補完我們的理解。代數算式有時會太抽象,讓我們不知如何繼續。此時,我們需要圖像或文字直覺。此三種理解概念的方法各有長短,因應概念不同,某方法會比另一方法更合適。不管要理解的概念如何,盡量嘗試用齊三種方法。

連續複利公式

返回最初的複利率公式:本利和 A = P (1 + r/n)ⁿᵗ 上式右邊取極限 n → +∞,得出__連續複利公式: A = P𝑒ʳᵗ__ 問題:剛才我們一直思考的是,固定「實年利率」 r ∈ ℝ 及年期 t = 1,求最後本利和是本金的多少倍 (A / P)。換角度思考,若我們固定 A / P,以及 rt 兩者之一,如何找出另一變量的數值?這帶出下分節目標——從函數值(A / P)反過來求指數函數中自變數(rt)的值。

對數:指數函數的逆函數

上節已證明指數函數是嚴格遞增的,所以它是單射函數(或稱一對一函數:對於函數 f 值域上的任意 xy,若 f(x) = f(y),則 x = y)。 可是,指數函數曲線中會否有些「空洞」,使曲線斷開? 例如 f(x) = |x| / xx ≠ 0 未能定義,值域 {-1, 1} 出現空隙,使得 "f(x) = 0.5" 無解。 連引導我們思考何謂「連續」。還記得我有位老師說,用有限步驟思考無限,是件很偉大的事。

𝑓(𝑢ₙ) ─────○

          •────── 𝑓(𝑣ₙ)
     ─────┼──────⟶ 𝑥
          𝑥₀

見上圖,設兩數列 (uₙ) 和 (vₙ) 分別從左右兩方向趨向 x₀。( f(uₙ) ) 和 ( f(vₙ) ) 皆為常數數列,但它們的極限值不同。

  • 左邊的虛點 "○" 代表函數 f 不在該點取值,但有 lim f(uₙ) = f(u₁)。
  • 右邊的實點 "•" 代表函數 f 在該點取值(f(x₀) = f(v₁)),且有 lim f(vₙ) = f(v₁)。 由此,我們得出用數列定義函數極限及連續的定義。

https://media.discordapp.net/attachments/1087424098562494505/1166837034791477302/701077747887243354.png?ex=690868eb&is=6907176b&hm=6b34703a7bbd9de3dbaced672ae429c88b2f46c0f5304fcdd724799616a567a8&=&format=webp&quality=lossless&width=1793&height=666

上面用數列的極限來定義函數的極限,雖然嚴謹,但實際操作困難。 我們的目標是證明指數函數在整個定義域(ℝ)上是連續的,且在對應域((0, +∞))內找不到「空隙」。 按數列的極限定義寫「| exp(xₙ) - exp(x₀) | = exp(x₀) | exp(xₙ - x₀) - 1 |」也可,但下標 其實不變。使用函數極限的 ε-δ 定義則可省卻 ""。

https://media.discordapp.net/attachments/1087424098562494505/1166837125711409253/701077747887243354.png?ex=69086901&is=69071781&hm=b6ed268fdee968835c1c1d10a20957d70028c537a2e33f833339f7a9a5077772&=&format=webp&quality=lossless&width=1140&height=893

https://media.discordapp.net/attachments/1087424098562494505/1166837208339198003/image.png?ex=69086915&is=69071795&hm=71dc7fc2a2acfd0fb33a20691ec89500fd958957ec122b922d5326d08fd668cc&=&format=webp&quality=lossless&width=866&height=893

要證明__指數函數在任意 x₀ ∈ ℝ 連續__,取 h = x - x₀。只需證明當 h → 0 時,𝑒ʰ → 1 即可。使用無窮級數定義後,先把 |h| 抽出 "∑" 符號,接下用些簡單不等式,應等得到理想結果。

介值定理(Intermediate value theorem)真正把「連續」中「沒有空隙」的特性呈現出來。

連續函數 f : [a, b] ⟶ ℝ 滿足 f(a) < f(b)。對於任何 uf(a) < f(b),存在一點 c ∈ (a, b),使得 f(c) = u。 (當 f(a) > f(b) 時,取 "-f" 以得出同樣結果。) 將此定理應用在指數函數上,即可證明它是滿射函數。(函數 f : 定義域 ⟶ 對應域 滿足 "對應域的任一元素 = f(定義域的某一元素)") 既是單射,又是滿射,即是雙射,那麼逆函數便存在。

介值定理圖解(擷自維基百科)

  1. 俄羅斯娃娃一個套一個:起始區間為 [a, b],考慮 f(左端點)、f(中點) 和 f(右端點)。
  • f(中點) = u 證畢
  • f(中點) < u < f(右端點):新左端點 ��← 中點,右端點不變
  • f(左端點) < u < f(中點):新右端點 ��← 中點,左端點不變
  • 反覆以上過程,定義域中的子區間長度每次迭代減半……用區間套定理知子區間們的左端點和右端點各組成一個數列,都趨向 (a, b) 中的同一點。運用函數連續性的數列定義,比對左端點和右端點的函數值極限,以及給定的 u,最後用夾臍定理得證。
  1. 最後水中一刻:考慮「潛水時間」集合 {x ∈ [a, b] | f(x) ≤ u}。a 屬於此集合,所以它非空。取「最後水中一刻」 c 為「潛水時間」的上確界。運用文字直覺:在「最後上水一刻」,人剛好在水平面(f(c) = u)。
  • 以下兩種情況均使用一連續函數基本性質:局部保號性:(若連續函數 f : (a, b) ⟶ ℝ 的定義域中有一點 c 滿足 f(c) > 0,則存在 δ > 0,使得對於所有 x ∈ (c - δ, c + δ),f(x) > 0。)

  • f(c) > u(水平面上):

    • 局部保號性:有一時段 (c - δ, c + δ) 在水平面上
    • c = 「最後水中一刻」:c 前的任意短時段 (c - δ′,c] 中,總有一瞬間在水中。
    • 此兩者矛盾。
  • f(c) < u(水平面下):局部保號性:有一時段 (c - δ, c + δ) 在水平面下,則 c + δ / 2 > c 仍在水中,則 c 不是「最後水中一刻」,矛盾。

  • 前者用上區間套定理,邏輯上較曲折,但證明過程中給出一個算法,可按此估算 c 點數值。我覺得這證明較形象化和接近直覺。

  • 後者主要依賴上確界公理及連續函數的 ε-δ 定義,邏輯上較直接,從定義可以直接證明,不需要用上經典定理,但初學者較難想出。我是在基礎分析的導修課上學得的,在中文維基「介值定理」條目也找得到。

剛剛的介值定理說明,對於任意的正整數 mn,整個閉區間 [𝑒⁻, 𝑒] 都被包含在指數函數 exp 的值域。 由於 𝑒 > 1,所以當 n → +∞,𝑒 → +∞;當 n → -∞,𝑒 → 0,對於任意的正實數 b,總能找到適當的正整數 mn,使得 𝑒⁻ < b < 𝑒,所以按介值定理,存在一實數 a ∈ (-m, n),使得 𝑒 = b。因此,指數函數 exp : ℝ ⟶ (0, +∞) 是滿射函數。

至此,我們可以把__自然對數函數 ln : (0, +∞) ⟶ ℝ 定義為指數函數的反函數__。 要找出定義 的方法,可試想將 a 變成 𝑒ʳ||(取r = ln(a))||,則 變成 𝑒ʳˣ。思考整數時的情形,不難想出「對任意實數 x,定義 (𝑒ʳ)ˣ 為 𝑒ʳˣ」。把 a 放回去這句,即是

對於任意正數 a 及任意實數 x,定義 為 exp(x ln(a))。 ax 分別稱為底數指數

對數公式只要記住(設 a, b > 0,s ∈ ℝ)

  • 定義(邏輯上可以換底公式及自然對數定義來定義對數函數 log : (0, +∞) ⟶ ℝ —— log(b) = ln(b) / ln(a))
    • = bs = log(b)(特別有 log(a) = 1 及 log(1) = 0)
    • 常用對數(底數為 10):log(a) = log₁₀(a)
    • 自然對數(底數為 𝑒):ln(a) = log(a)
  • 還原
    • log() = s(從內向外開始,先指數,後對數,最後還原)
    • aˡᵒᵍˢ⁾ = s(從內向外開始,先對數,後指數,最後還原)
  • 換底:log(b) = log(b) / log(a)
  • 和 ↔ 積:log(ab) = log(a) + log(b)
  • 指數 ↔ 倍數:log() = s log (a) 最常用的是最後兩條公式。 用上面自然對數函數的定義能輕鬆推導以上課本中的經典公式,留作練習。

初探指數函數曲線的幾何特性

https://media.discordapp.net/attachments/1087424098562494505/1172979684783435786/701077747887243354.png?ex=69085835&is=690706b5&hm=67d1cc1c50cdc35432aa245b4a6d0b54e53856e57cfc74ad516bec6c9b272ffb&=&format=webp&quality=lossless&width=1003&height=893 引入「割線」概念,就是在曲線上取兩個不同的點,連成一(無限延伸的)直線,以證明上面觀察。 https://media.discordapp.net/attachments/1087424098562494505/1172980148103041074/701077747887243354.png?ex=690858a4&is=69070724&hm=1228ca53b8ec72d71cfdf8349b78b005a15faaf59d576770b7290428e319d86c&=&format=webp&quality=lossless&width=1344&height=763 此處用上之前證過的 𝑒ˣ ≥ 1 + x 兩次。留意上圖中的實數 x₀ 及正實數 h₁, h₂ 均為任意選取,且「左割線」和「右割線」兩部分相互獨立。將「左割線」右端點坐標中的 "x₀" 換成 "x₁",右割線保持 "x₀" 不變,內容仍然真確。 由於割線位置任意選取,所以其實我們有

  1. 割線斜率 < 割線右上端點函數值
  2. 割線斜率 > 割線左下端點函數值 綜合以上兩點 https://media.discordapp.net/attachments/1087424098562494505/1172980510541234207/701077747887243354.png?ex=690858fa&is=6907077a&hm=916c942f8550b32a9c850a0f5409fde6e2309ccd5763b992b6f6092b43fcee3b&=&format=webp&quality=lossless&width=1793&height=296 練習:定義「長割線」為左割線左下端點和右割線右上端點連成的直線,「長割線斜率」和「左割線斜率」及「右割線斜率」的關係是甚麼? 答案:||「長割線斜率」是「左割線斜率」及「右割線斜率」的的加權平均,權數為左右兩子區限的長度。|| https://media.discordapp.net/attachments/1087424098562494505/1172980990277341284/701077747887243354.png?ex=6908596d&is=690707ed&hm=7bbcbeebb4405e9d168c9065236df0d843d260651ecd5934ca7a30e7e11a0277&=&format=webp&quality=lossless&width=1173&height=864 註:上圖代碼由 ChatGPT 生成 https://sl.bing.net/fCyrnxDAHgO 從肉眼看來,這些正偶數幂函數曲線也有這種「割線斜率上升」的特性,但未必有「割線斜率 < 割線右上端點函數值」(為甚麼?||「割線斜率」不受平移影響,但函數值受平移影響||)。將上面「割線斜率上升」的圖抽象化,改 y = exp(x) 為一個「曲線向下凸出」的函數 f(x)。「抽象」是為了「抽出相像」,過程中會去掉一些事物的特殊特質(例如「正方形、三角形……」�→「多邊形」過程中,「邊長數目」這特質去掉了),最後出來的事物或會「抽離現象」,和我們日常見的事物很不同。這裏我們發現這些「曲線向下凸出」的函數「割線斜率上升」,於是「左割線斜率 < 右割線斜率」。此處「左割線」和「右割線」相交於函數曲線上的一點。 將這些文字用符號表達。 https://media.discordapp.net/attachments/1087424098562494505/1172981523151065159/701077747887243354.png?ex=690859ec&is=6907086c&hm=05491b6dc8f5842f6ff6caaab769f893b329998ff412307d25b6c5b861805822&=&format=webp&quality=lossless&width=1310&height=763 https://media.discordapp.net/attachments/1087424098562494505/1172981523474030592/701077747887243354.png?ex=690859ec&is=6907086c&hm=e76ba31dddaef26b35cee11a674b288a80231af188e01894d9d94515622e3445&=&format=webp&quality=lossless&width=1053&height=763

"左斜率" ≤ "右斜率":[f(b) - f(a)] / (b - a) ≤ [f(c) - f(b)] / (c - b)。 ⟺ [f(b) - f(a)] / [t₁ (c - a)] ≤ [f(c) - f(b)] / [t₂ (c - a)] ⟺ t₂ [f(b) - f(a)] ≤ t₁ [f(c) - f(b)] ⟺ (t₁ + t₂) f(b) ≤ tf(a) + tf(c) f(ta + tc) ≤ tf(a) + tf(c) 這條不等式很基本,但有很深刻的意義,需要另開分節討論。

指數函數的凸性

重看指數函數圖像,它向下凸起。 甚麼叫「凸」的圖形? 先思考甚麼叫「凹」。

https://media.discordapp.net/attachments/1087424098562494505/1174666644249923696/701077747887243354.png?ex=69088c90&is=69073b10&hm=142b9434d0c93aff392250ab7da72a14afc69f5edac538cbc8a12b086d8a96f7&=&format=webp&quality=lossless&width=1234&height=763

代碼來源:https://tex.stackexchange.com/a/639287/126386

留意圖右上方有凹位,在圖形中任取兩點,連成一線段,線段上有點在圖形外。 將以上觀察用符號寫出:設 S 為那個有凹位的圖形。

x, yS : ∃ t ∈ [0, 1] : (1 - t) x + t yS 「凸」就是「沒有凹」,所以將以上語句取邏輯上的相反,則變成 ∀ x, yS : ∀ t ∈ [0, 1] : (1 - t) x + t yS 這就是凸集合 S 的定義。 用文字表達凸集合的定義:圖形中任取兩點,連成一線段,整條線段都在圖形內。 留意上圖左邊圖形,它底部有直線邊,仍滿足「凸集合」的定義,但它和中間圖形不同: 中間圖形任取兩點(點可在邊界上),連成一線段,線段除兩端點外,在不在(白色)邊界上。 問題:何為「邊界」? 凸和嚴格凸的分別在於:線段除兩端點外,均在集合的內部(interior)。何為一集合 S 的「內部」? 任一點 xS 為圓心,若存在 δₓ > 0 為半徑:

  • 若整個圓為 S 的子集,則 xS 的「內點」(interior point)。內點組成的集合叫「內部」(int(S))。
  • 若整個圓為 X\SS 的補集)的子集,則 xS 的「外點」(exterior point)。外點組成的集合叫「外部」(ext(S))。
  • 否則,xS 的「邊界點」(boundary point)。邊界點組成的集合叫「邊界」(bd(S) 或 ∂S)。 圖片擷自維基,xy 分別為 S 的內點和邊界點。

在上圖中,決定 x 是否在 S 的內部,主要靠一堆虛線圓形「橡筋圈」。但是,為甚麼「橡筋圈」一定要是圓形,可否是方形或菱形?答案可在點集拓撲(point-set topology)中找到,我會在本章末拋出引子超出本章範疇。拓撲這數學分支,綽號「沒有長度的幾何」。

介紹凸集,主要為凸函數定義提供圖像直覺。在此之前,再引入「上圖」(epigraph)的概念。 再次從維基中截取圖片,解釋「上圖」:粗黑曲線為 y = f(x),它和它的上面,即成 epi(f) = { (x, a) ∈ ℝ × ℝ | f(x) ≤ a }。 若去掉曲線,則有「嚴格上圖」(strict epigraph) epi(f) = { (x, a) ∈ ℝ × ℝ | f(x) < a }外文維基條目「上圖」中,函數 f 定義得較抽象,對應域還包含 ±∞,初學者可先忽略這些細節,姑且把定義域及對應域當成 ℝ,不會影響整體理解。

註:下面上圖(epigraph)的圖片擷自MIT 的講義

(嚴格)凸函數的定義可輕易找到,其實就是上分節末粗體的不等式,在此只給出一個和凸函數等價的(形象化)條件。

若且唯若__一函數是凸的,它的上圖是凸的__。 將凸函數的定義中的不等式變成嚴格不等式,則凸函數是嚴格凸的。對應的等價條件變成: 若且唯若一函數是嚴格凸的,它的上圖中的任意一條線段去掉兩端點後,是該函數的嚴格上圖的子集。 若函數 f 滿足 -f 是(嚴格)凸的,則稱 f 是(嚴格)凹的。(定義中的不等式方向倒轉。)

要__學懂一個數學定義,最少要有三個例子和兩個反例子__。看見以下例子,腦中先想像它們的圖像。

留意自然數冪函數 xxⁿn ∈ ℕ)及指數函數 exp,除 n = 0(常數 1)或 n = 1(線性)在 ℝ 上既凸又凹外,其餘的都在 [0, +∞) 上是嚴格凸的。

引理(凸函數逆函數)一個嚴格遞增的(嚴格)凸函數若有逆函數,則此逆函數是(嚴格)凹的; 一個嚴格遞減的(嚴格)凸函數若有逆函數,則此逆函數是(嚴格)凸的。 證明留作練習,答案在連結中。 由此可知正 n 次方根函數 xxn ∈ ℕ)及對數函數 ln 在它們的定義域上均為(嚴格)凹函數(除 n = 1 外)。

(為省卻教學時間,)一般高中課程在沒有推導過以下關於凸函數的割線斜率「單調遞增」的情況下,直接拋出「線性近似的斜率」(即導數)單調遞增的結果,然後就有著名的兩階導數測試(Second derivative test)找拐點(point of inflexion)。對教育者和大學的理工科系來說,這能訓練和評核學生運用「微分」解難的能力,方便他們篩選出能讀書的學生,和未來的技術人才。

可是,這(些邏輯正確的方法)會讓學生產生錯覺,認為函數的凸凹性依賴於微分。用導數決定函數的凸凹性的確很方便,但前提是函數要可導(「在定義域的每一點上都有『切線』」)。比知絕對值函數 x ↦ |x| 在 原點 (0, 0) 沒有「切線」。只要函數牽涉到絕對值,用導數就不好使。

問題:上面有關凸函數的「割線斜率上升」的圖 有甚麼問題? 答案:||該圖右邊應為「左割線斜率 ≤ 右割線斜率」——這不等式不一定是嚴格的。(思考絕對值函數 f(x) = |x| 的圖像。)||

上圖「割線斜率上升」其實和凸函數定義等價,已在上分節末推導

為了減少計算,我會使用一系列引理,證明留作練習。這個抽象化的過程,令當中的內容可重用。 先處理自然數冪函數 x ↦ xⁿ 在 [0, +∞) 上的凸性,再利用奇偶函數的特性,拓展至定義域為 ℝ 的函數:

  1. 引理(非負單調凸函數積):設 f, g 為(定義在一個任意區間上的)非負單調遞增(或遞減)的(嚴格)凸函數,則它們的積 fg 也是(嚴格)凸函數。 證明:設……。 → ||f((1 - t)x + ty) g((1 - t)x + ty) ≤ [(1 - t) f(x) + tf(y)] [(1 - t) g(x) + tg(y)]|| → ||= (1 - tf(x) g(x) + t(1 - t) [f(x) g(y) + f(y) g(x)] + t² f(y) g(y) || → ||≤ (1 - tf(x) g(x) + t(1 - t) [f(x) g(x) + f(y) g(y)] + t² f(y) g(y) ||(排列不等式特例:abcdad + bcac + bd) → ||= (1 - t) f(x) g(x) + tf(y) g(y) ||
  2. 從凸函數定義直接證明 n = 2 時函數嚴格凸。 證明:套用下面引理證明(f(x) = g(x) = x, 定義域 [0, +∞))。留意使用排列不等式時,因 x < y,有 2xy < x² + y²。
  3. 運用數學歸納法||(f(x) = xᵏ, g(x) = x)||,當冪 n > 1,自然數冪函數 x ↦ xⁿ 在 [0, +∞) 上嚴格凸。 思考:此步運用上面引理結果時,有甚麼問題? 答案:||g(x) = x 非嚴格凸函數,但我們卻在結論中說它是嚴格凸的——引理中要求 fg 同為嚴格凸,所以要從引理證明中的不等式得知。|| 思考:為何 f, g 需要是非負函數? 答案:||在證明的第一步中,若 fg 出負數值,則不保證不等式成立。反例 f(x) = x² - 1, g(x) = x - 2 的 Desmos 圖像||

若冪 n 為負整數,仍有__負整數冪函數嚴格凸__。原因為以下四點:

  1. n = 1 時,函數變成線性,則既凸又凹。
  2. 引理(正凹函數倒數):(定義在一個任意區間上的)正(嚴格)凹函數 f 的倒數 1 / f : x ↦ 1 / f(x) 是(嚴格)凸函數。由此可知倒數函數 x ↦ 1 / x 在 [0, +∞) 上是嚴格凸函數。 思考:為甚麼線性函數不嚴格凹,但倒數函數卻嚴格凸? 答案:||在下面證明中,先假設 x < y,從最後一行易知有嚴格不等式。||
  3. 負整數冪函數在 [0, +∞) 上嚴格遞減。
  4. 「非負單調凸函數積」引理反覆套用在倒數函數。

https://media.discordapp.net/attachments/1087424098562494505/1174670603437998120/701077747887243354.png?ex=69089040&is=69073ec0&hm=ddd5d4ea0518ed112ebe34b4c973768cbb6ddc8beaab5bbc4b87aa591402eade&=&format=webp&quality=lossless&width=1435&height=763

接下來,我們把整數冪函數的定義域拓展至 ℝ。當冪 n 是偶數時,偶數冪函數圖像沿 y-軸反射對稱,使我們想出以下引理。

__引理(遞增凸函數鏡像)f 是定義在 [0, +∞) 上的單調遞增(嚴格)凸函數,則定義在 ℝ 上的複合函數 xf(|x|) 是(嚴格)凸函數。 在推導前想一想,還有沒有更一般的原因。 此處有__複合函數,那麼甚麼樣的(嚴格)凸/凹函數 fg 能令複合函數 fg (嚴格)凸?

  • g 凸:||g((1 - t)x + ty) ≤ (1 - t) g(x) + tg(y)||
  • f 單調遞增:||f( g((1 - t)x + ty) ) ≤ f( (1 - t) g(x) + tg(y) )||
  • f 凸:||f( (1 - t) g(x) + tg(y) ) ≤ (1 - t) f(g(x)) + tf(g(y))|| 若將上面條件改為 g 凹且 f 單調遞減和凸,其實同樣有 fg 凸。

⚠️ 以上關於複合函數的討論出現甚麼問題? 🤔 ||「反例」:設 f(x) = x², g(x) = x² - 1 = (x + 1) (x - 1),則 fg 在 [0, +∞) 上均為嚴格遞增嚴格凸函數,但fg(x) = (x + 1)² (x - 1)² 沿 y-軸反射對稱,x-截距為 ±1,所以 (±1, 0) 和 (0, 1) 是 fg 的臨界點(critical point),易知 fg 有一拐點在開區間 (0, 1) 中,即 fg 在 [0, +∞) 上非凸。|| 💡 ||漏掉條件「g 的對應域為 f 的定義域的子集」。||

由函數的奇偶性及以上「凸函數複合函數」引理,可知定義在 ℝ 上的自然數冪函數 xxⁿ

  • n = 0 或 1:既凸又凹(此處 n = 0 當常數函數 x ↦ 1)
  • n 為非零偶數:在 ℝ 上嚴格凸
  • n 為非一奇數:在 [0, +∞) 上嚴格凸;在 (-∞, 0] 上嚴格凹

上面已證明 exp 嚴格凸,按引理「凸函數逆函數」,ln 在 (0, +∞) 上嚴格凹。

問題:(定義在 (0, +∞) 上的)實數幂函數 x 何時為凸?何時為凹?

  • r 為整數或整數的倒數時,問題已解決。
  • r 為負實數時,將 寫成 exp(r ln(x) ),則 xr ln(x) 為嚴格凸函數,而外層的 exp 嚴格凸且嚴格遞增,所以按「凸函數複合函數」引理,x 為嚴格凸函數。

r > 1 的解答需要用上赫爾德不等式,所以下分節我們將證明這些經典基礎不等式。

用凸函數證明一些基礎不等式

本分節以「基礎方法」(變量代換和基礎不等式)證明一些著名的不等式,如

  • 簡森不等式(Jensen's inequality)
  • 加權算術-幾何平均值不等式(weighted AM-GM inequality)
  • 楊氏不等式(Young's inequality)
  • 赫爾德不等式(Hölder's inequality)
  • 閔可夫斯基不等式(Minkowski inequality)
  • 加權冪平均不等式(weighted power mean inequality) 它們在數學競賽的範疇內,也算是在大學的課程內,但在大學很少機會用得上。即使在大學課程中用得上,也會是在個更加抽象的情境,也不要求像解數學競賽題般,用上高超的技巧。

凸函數上圖 ⟹ 強森不等式 凸函數定義中只有定義域中的兩個點 x₁ 和 x₂,若出現幾個點怎麼辦?這就是經典的強森不等式(Jensen's inequality)的內容。

f 為凸函數,……,w₁, …, wₙ ≥ 0, w₁ + ⋯ + wₙ = 1, 則 f(wx₁ + ⋯ + wₙ xₙ) ≤ wf(x₁) + ⋯ + wₙ f(xₙ)。 若且唯若 f 為線性函數 + 常數;或 x₁ = ⋯ = xₙ,等式成立。

一般書上證明都是用數學歸納法。又是那一句,邏輯正確,但忽略了重要的數學內容。今次忽略的,就是凸函數的幾何特性。 透過「上圖(epigraph)」的概念,將問題圖像化,問題就很簡單: 一些凸集內的點 x₁, …, xₙ 的加權平均 wx₁ + ⋯ + wₙ xₙ(0 ≤ w₁, …, wₙ ≤ 1 是權數,且有 w₁ + ⋯ + wₙ = 1)在這些點連成的凸多邊形內:這個加權平均 wx₁ + ⋯ + wₙ xₙ 可以用這些點 x₁, …, xₙ 表示,我們叫這個加權平均為點 x₁, …, xₙ凸組合。 凸集合的定義用凸組合重寫一次,就是「集合內任意兩點組成的所有凸組合都在集合內」。 但事實上,這對集合內任意 n 點都對,比如正方形是個凸圖形,上面任取三個不共線的點(n = 3),連成一面積非零的三角形,則該三角形仍在該正方形內。 此觀察很直覺和形象化,算式上的證明是個數學歸納法的練習。

用文字表達強森不等式:若 f 為定義一區間上的凸函數,加權平均的函數值||(f(x₁, …, xₙ 的加權平均)||≤ 函數值||f(x₁), …, f(xₙ)||的加權平均)。 https://math.stackexchange.com/q/747180/290189 先思考 n = 2 (只有兩點)時,函數圖像中發生了甚麼事:||點 (t x₁ + (1 - t) x₂, t f(x₁) + (1 - t) f(x₂) ) 在曲線 y = f(x) 上,所以它在 epi f 內。||嘗試將這個觀察擴展至任意自然數 n。 運用凸函數的等價條件「凸函數 ⟺ 上圖凸」,思考 (x₁, f(x₁)), …, (xₙ, f(xₙ)) 的凸組合:||這些點都是 epi f 的點,epi f 是凸的,所以這些點的凸組合 (wx₁ + ⋯ + wₙ xₙ, wf(x₁) + ⋯ + wₙ f(xₙ)) 在 epi f 內,運用 epi f 的定義得證。|| 其實幾何方法沒有減少步驟,只是將數學歸納法中最關鍵的一步,搬去凸集罷了。但凸集是個有幾何意義的東西,不單較易視像化,將來學習理工科目也有大用。

https://media.discordapp.net/attachments/1087424098562494505/1176116778791874670/701077747887243354.png?ex=69088d1b&is=69073b9b&hm=634169d696606d9e0c565d47dbd5945f9343375f9b3c84c7e7904dc800403a84&=&format=webp&quality=lossless&width=1328&height=763

強森不等式 ⟹ 加權算術-幾何平均值不等式 上面 Math.SE 連結中的問題後半(加權算術-幾何平均值不等式(weighted AM-GM inequality)的證明),即是強森不等式應用在自然對數 ln 的結果。因為自然對數 ln 是嚴格凹函數(為甚麼?||自然對數 ln 被定義為指數函數 exp 的逆函數,而指數函數 exp 是在 ℝ 上嚴格凸且嚴格遞增的,所以按引理「凸函數逆函數」得證。||),所以強森不等式的方向反轉。 加權算術-幾何平均值不等式 ⟹ 楊氏不等式 留意楊氏不等式中的積 abab 次數各為一,但加權算術-幾何平均值不等式左邊的幾何平均中有 xʷ₁,所以取 x₁ = a¹ᐟʷ₁,讓兩(實數)次方(w₁ 和 1 / w₁)互相抵消。 取 n = 2, w₁ = 1 / p, w₂ = 1 / q, x₁ = aᵖ, x₂ = b𐞥,有 w₁ + w₂ = 1,且 xʷxʷ₂ = aba / p + b / q = wx₁ + wx₂。

楊氏不等式 ⟹ 赫爾德不等式 證明計算上不難,只是「齊次 ⟹ 設目標不等式右邊兩個 '∑' 各為 1」較不明顯,需要經驗。 其餘的就是將楊氏不等式中的 "a" 和 "b" 分別加上下標 "",然後求和 ∑。最後運用之前假設,得 1 / p + 1 / q = 1。 註:柯西-施瓦茨不等式(Cauchy–Schwarz inequality)是赫爾德不等式中 p = q = 2 的特殊情形。 赫爾德不等式 ⟹ 閔可夫斯基不等式 先寫出閔可夫斯基不等式。 赫爾德不等式左邊沒有 1 / p 次方,右邊有 1 / q 次方,所以先兩邊乘以 (...) 的 1 / q 次方。

https://media.discordapp.net/attachments/1087424098562494505/1176117224864489565/701077747887243354.png?ex=69088d85&is=69073c05&hm=b1c9c323e98b65ccce2d31037d49cea4476c648a72650394f449445222fcf1ca&=&format=webp&quality=lossless&width=898&height=893

留意 |xᵢ + yᵢ| = |xᵢ + yᵢ|⁻¹ |xᵢ + yᵢ| ≤ |xᵢ + yᵢ|⁻¹ (|xᵢ| + |yᵢ|),所以不等式 (1) 及 (2) 相加後,最終得出上面第二條不等式。

強森不等式 ⟹ 加權冪平均不等式 若將「強森不等式 ⟹ 加權算術-幾何平均值不等式」推導中的 |aᵢ| 換成 |aᵢ|ˢ,當中 s 為固定的非零實數,則有

ln(∑ wᵢ |aᵢ|ˢ) ≥ ∑ wᵢ ln(|aᵢ|ˢ) = s ln(∏ |aᵢ|ʷᵢ) ⟺ ln(∑ wᵢ |aᵢ|ˢ) / s ≥ ln(∏ |aᵢ|ʷᵢ)(若 s > 0);或 ln(∑ wᵢ |aᵢ|ˢ) / s ≤ ln(∏ |aᵢ|ʷᵢ)(若 s < 0) ⟺ ln[(∑ wᵢ |aᵢ|ˢ)¹ᐟˢ] ≥ ln(∏ |aᵢ|ʷᵢ)(若 s > 0);或…… ⟺ (∑ wᵢ |aᵢ|ˢ)¹ᐟˢ ≥ ∏ |aᵢ|ʷᵢ(若 s > 0);或…… 因此,對於所有 s > 0 > t,有 (∑ wᵢ |aᵢ|ˢ)¹ᐟˢ ≥ ∏ |aᵢ|ʷᵢ ≥ (∑ wᵢ |aᵢ|)¹ᐟ。 ||由於 ln 嚴格凹,||等式成立若且唯若 |a₁| = ⋯ = |aₙ|。

思考 0 < s < t 時,|a₁|, …, |aₙ| 的 s-冪平均 及 t-冪平均。

(∑ wᵢ |aᵢ|ˢ)¹ᐟˢ ? (∑ wᵢ |aᵢ|)¹ᐟ ⟺ (∑ wᵢ |aᵢ|ˢ) ? (∑ wᵢ |aᵢ|)ˢ(從這一行可看出要選凹~~/凸~~函數 f(x) = xᵢ = |aᵢ|) ⟺ [∑ wᵢ (|aᵢ|)ˢ] ? (∑ wᵢ |aᵢ|)ˢs / t = 1 / 2 < 1,可猜出 f 是凹函數,所以不等式方向應為「≤」。 由此,引導出以下問題: 因為引理「凸函數逆函數」,只需證明當 p > 1 時,實數冪函數 f(x) = xᵖ 在 [0, +∞) 上嚴格凸。 此處再次借用 Math.SE 的答案。 設 0 < x₁ < x₂,…… (wx₁ + wx₂) < wx + wxwx₁ + wx₂ < (wx + wx)¹ᐟ(右上的 1 / p 讓我們想起赫爾德不等式) ⟸ wx₁ + wx₂ < (wx + wx)¹ᐟ (?)¹ᐟ𐞥(取 q > 1 使得 1 / p + 1 / q = 1) 於是取 uᵢ = wᵢ¹ᐟ xᵢ,從 uᵢ vᵢ = wᵢ xᵢ 易知 vᵢ = wᵢ¹ᐟ𐞥。 ⟸ wx₁ + wx₂ < (wx + wx)¹ᐟ (w₁ + w₂)¹ᐟ𐞥 由於 w₁ + w₂ = 1,所以證畢。

s < t < 0 時,有類似結果,留作練習。

練習:固定實數 a₁, …, aₙ,當 (i) s → +∞ (ii) s → -∞ 時,|a₁|, …, |aₙ| 的 s-冪平均趨向甚麼?給定的條件有甚麼不足之處?可以如何修正? 提示:||引入 max{|a₁|, …, |aₙ|},為s-冪平均的分子設上下限。|| 由上面的練習可知,所謂 s-冪平均,就是閉區間 [min{|a₁|, …, |aₙ|}, max{|a₁|, …, |aₙ|}] 中的一個值。反過來問,是否這個閉區間中的每一個值,都能寫成一個 s-冪平均? 要回答這條問題,把 s-冪平均看成一個自變量為 s 的函數。留意除 s = 0 外,這函數在 ℝ \ {0} 上連續。於是,我們很自然會問,當 s → 0 時,這函數的極限是甚麼?

https://media.discordapp.net/attachments/1087424098562494505/1176118027088044112/701077747887243354.png?ex=69088e44&is=69073cc4&hm=646a2520a8d86cab42c403b3f748a35b6f2c6813ec30c59623ee85805e195901&=&format=webp&quality=lossless&width=1018&height=893

⚠️ 以上箭咀純為展示用途,減少重覆的 "lim",在正式的寫作中(例如交給老師的答案)不要這麼寫。 於是我們可以定義「0-冪平均」為「幾何平均」,使得上面的不等式變成

對於所有 s > t 及實數 a₁, …, aₙ,有 |a₁|, …, |aₙ| 的 s-冪平均 ≥ |a₁|, …, |aₙ| 的 t-冪平均。 等式成立若且唯若 |a₁| = ⋯ = |aₙ|。

練習

  1. 將伯努利不等式 (1 + x)ʳ ≥/≤ 1 + rx 推廣至實數冪。||分開 r < 1 及 r > 1 兩情形。使用加權算術-幾何平均值不等式:右邊加權算術平均等於 1,左邊砌加權幾何平均時,權數為次方。||
  2. 試將本章開首的「本利和數列」的定義域從 ℕ 推廣至 ℝ 的最大可能子集,並證明此函數在此子集中的每個子區間都嚴格遞增。||分開 0 < x < y 及 -y < -x < 0 兩情形。使用加權算術-幾何平均值不等式:右邊加權算術平均等於 1,左邊砌加權幾何平均時,權數為次方。||

應用: 了解 |x|ˢ + |y|ˢ = 1 在 ℝ² 上的圖像的幾何特性。 小米的新標誌,就是 s = 3 的情形。 https://youtu.be/c5m3nDVSCxc?si=h9R06dM45U9P9Mbc&t=73

用凸圖形定義易證:

  • 若且唯若 0 < s < 1,圖形嚴格凹。

  • s = 1,圖形凸。

  • 若且唯若 s > 1,圖形嚴格凸。 用微分證也可行,很複雜很多。

  • s → +∞,圖形接近方形,證明技巧和加權冪平均不等式的證明中 s → +∞ 部分一樣。

  • s → 0,圖形接近十字架。可定義 B₀ = ∩ {Bₛ | s > 0}, Bₛ := {(x, y) ∈ ℝ² | |x|ˢ + |y|ˢ ≤ 1}。B₀ 其實等於十字架 {(x, y) ∈ ℝ² | |xy| = 0}。||(|x|ˢ + |y|ˢ)¹ᐟˢ ≥ 2¹ᐟˢ min(|x|, |y|), s → 0, 右邊 → +∞,除非 |xy| = 0。||

  • s < 0,圖形似「井」字去掉中間的「口」,有點像倒數函數圖像。||倒數:越近 0,倒數後越遠。||

  • s → -∞,圖形趨近「井」字去掉中間的「口」。

觀察:一菱形 (s = 1) 被包在圓形內 (s = 2)。 練習:運用冪平均不等式,可準確算出圓形要收縮多少,才可以被包在菱形內。

由上面的圖易見,其實用圓形(s = 2)、星形(0 < s < 1)還是方形(s = +∞ / 1)討論數列/函數的收歛現象,其實都一樣。以上只展示了平面(ℝ²)上的情形,其實對於所有自然數 n,在 ℝ 上也有同樣結果。鄰域的形狀不重要,於是人們開始想把鄰域集合用「𝒯」代替,稱為「拓樸」,以想出更一般的法則。這就是拓樸學導論的引子。

 生人何幾

 星  點  圓  線  相  漸  套  消  趣  常  無  自  窮  結

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment