VincentTam/231019-intro.mkd

Last active November 2, 2025 20:01

Star (0) You must be signed in to star a gist
Fork (0) You must be signed in to fork a gist

Select an option

Learn more about clone URLs
Clone this repository at <script src="https://gist.github.com/VincentTam/53dbad0a637753e4f601637a93a2a38f.js"></script>
Save VincentTam/53dbad0a637753e4f601637a93a2a38f to your computer and use it in GitHub Desktop.

vin's discord math notes chap. 2

Raw

這個數列一直上升，其實很合乎直覺，因為複利過程中，將一週期的本利和更新作下一週期的本金，可以賺更多。n 越大，代表更新本利和次數更多，自然賺更多。思考：這個（本利和）數列若可以上升至「無限大」（想要多大，就有多大。比如想要存款一億元，就真的有個 n 值，使數列中有一項不少於一億），那會發生甚麼事？答：||那還工作幹嘛？存錢進銀行，然後設定 n「無限大」，讓自己躺着賺，想有多少錢花，就有多少錢花——但世上的貨幣是有限的，那麼貨幣供應會短缺。|| 為何上述事情不會發生？答：||從上面實驗觀測，當 n 「很大」時，該數列「接近」一個約為「2.71828」的數字。|| 上面的解答只為給大家一個直覺，並非正式答案，而是背後正式數學內容的一個引子。

接下來~~假設大家已熟悉~~要用上

等差級數及等比級數（求和、公差／比、項數、通項式）
二項式定理（最基礎版本，指數為自然數）

等差數列

高斯 (Gauss) 經典童年故事：老師要他們算 1 + 2 + 3 + ⋯ + 100，他用 5 秒算完，觀察 1 + 100 = 2 + 99 = 3 + 98 = ⋯ 99 + 2 = 100 + 1 更一般表達形式為首項 + 末項 = (首項 + 公差) + (末項 - 公差) = ⋯ (末項 - 公差) + (首項 + 公差) = 末項 + 首項留意上面每行相等，所以有 (首項 + 末項) 上面行數為 (末項 - 首項) / 公差 + 1 為何要 "+1"？ 1, 2, …, 首項, 首項 + 1, …, 末項 - 1, 末項 __-) 1, 2, …, 首項 __ 首項 + 1, …, 末項 - 1, 末項從 {首項 + 1, …, 末項 - 1, 末項} 中取出 {首項 + 公差, …, 末項}，{後者} 為 {前者} 的 1 / 公差，因為 {前者} 的公差個連續數中（{首項 + 1, 首項 + 2, …, 首項 + 公差 - 1, 首項 + 公差}），只取 {首項 + 公差}，當中有 [(末項 - 首項) / 公差] 項。上述數行過程中漏數首行 "首項 + 末項"，所以要加 1。最後因於原等差數列中每一項出現兩次，所以要除以 2。等差數列和 = (首項 + 末項) [(末項 - 首項) / 公差 + 1] / 2

等比數列

最簡單情形：1, r, r², r³, …, rⁿ 求和 Sₙ₊₁ = 1 + r + r² ⋯ + rⁿ 時將和乘以 r，發現一堆重覆的項。 Sₙ₊₁ = 1 + r + r² + r³ + ⋯ + rⁿ -) r Sₙ₊₁ = r + r² + r³ + ⋯ + rⁿ + rⁿ⁺¹ (1 - r) Sₙ₊₁ = 1 - rⁿ⁺¹ 這裏我們在 "S" 右下加下標 "ₙ₊₁"，寫成 "Sₙ₊₁"，因為

"S" 表示英語 "和" （"sum"）
下標 "ₙ₊₁" 表示 "（從 1 開始）加到第 n+1 項"
下標出現 "₊₁"，可從起始項理解：S₁ = 1, S₂ = 1 + r。留意 r 的最大次方比下標少 1 ℹ️ 碰到不懂的規律，可先試着從最簡單的案例理解。留意上面粗體公式中，上下標皆為 n + 1，可以 n 替換。 Sₙ = (1 - rⁿ) / (1 - r), ⚠️ r ≠ 1 ⚠️ 每當出現分數時，要思考分母何時為 0，以避免分母為 0。遇上首項 a (≠ 1) 時，抽出首項 "a (1, r, r², r³, …, rⁿ)"，再把括號內的數加起來。不難發現上面粗體公式 變成 Sₙ = a(1 - rⁿ) / (1 - r), ⚠️ r ≠ 1

上式給出 xⁿ - 1 的因式分解，留意上式分子為 1 減去變量 r 的 n 次方，代入 a = 1，r = x 並扭轉（分子及分母）正負，即為 xⁿ - 1。兩邊乘以分母 x - 1，即有 (x - 1)(xⁿ⁻¹ + xⁿ⁻² + ⋯ + x + 1) = xⁿ - 1。 💡 留意__等式兩邊__次數相等。

左邊次數為 1 + (n - 1) = n
- 因式 x -1 次數 1
- 因式 xⁿ⁻¹ + xⁿ⁻² + ⋯ + x + 1 次數 n - 1
右邊次數為 n 💡套用等比數列求和公式算 a + ar + ar² + ⋯ + arⁿ⁻¹ 時，可先察看兩邊次數是否相等，才繼續計算。使用上面方法，可處理一些簡單的因式分解。 x² - 1 = (x - 1) (x + 1) x⁴ - 1 = (x² - 1) (x² + 1) = (x - 1)(x + 1)(x² + 1) x⁸ - 1 = (x⁴ - 1) (x⁴ + 1) = ⋯ = (x - 1)(x + 1)(x² + 1)(x⁴ + 1) 　　　　　　 ₙ 練習：試分解x² - 1 ℹ️ 其實 x⁸ - 1 尚未完全分解，因為 x⁴ + 1 還可繼續分解成 (x² + √2 x + 1) (x² - √2 x + 1)，但這太複雜 ||要用上三角函數和複數||，在後面章節再談。

那麼 xⁿ + 1 怎樣因式分解？留意若 n 為奇數的話，把 "-x" 代入 xⁿ - 1 的因式分解，即有 ||-xⁿ - 1 = (-x - 1) (xⁿ⁻¹ - xⁿ⁻² + ⋯ - x + 1)|| xⁿ + 1 = (x + 1) (xⁿ⁻¹ - xⁿ⁻² + ⋯ - x + 1)。留意__上面等式右邊較長的因數__ 正負號交替。最簡單的例子：x³ + 1 = (x + 1) (x² - x + 1) x⁵ + 1 = (x + 1) (x⁴ - x³ + x² - x + 1) 若 n 為雙數怎辦？練習：試分解 x⁶ + 1 ||= (x²)³ + 1 = ⋯||。最後只剩下 n 為 2 的次方（n = 2ᵐ）無法以__上面公式__解決。

練習：若上面__兩條因式分解公式__中，把 xⁿ ± 1 改成 aⁿ ± bⁿ，那麼相應的公式會怎樣？

代入 x = 1.5 = 3/2，寫成分數形式。
弄走兩邊分母 ||兩邊乘以 2ⁿ||。
分別以 a 和 b 替換分子和分母。

兩項式初探

我高中的教科書為求教學方便，只用數學歸納法證明，雖然邏輯正確，但把背後的組合學意義都隱藏起來，實在可惜。

取個簡單例子：(a + b)³，寫成

a  a  a
b  b  b

從每直行中任選 {a, b} 內一數，算它們的積，如全選 a 就有積 a³，選 (a, b, a), (b, a, a) 或 (a, a, b) 則有積 a²b。每一個積都是 (a + b)³ 展開後的一項。留意 (_, _, _) 中，a 的個數代表積中 a 的次方。當所有 a 定好後，在空格填入 b——當所有 a 填好後，_ 空格也好，b 也好，只不過是個字符，不會影響數數過程。要知道 a²b 在 (a + b)³ 展開後出現多少次，只需數 (_, _, _) 中可以放兩個 a 的可能方法，換句話說，就是從位址集 {1, 2, 3} 中選取兩個位址，如 {1,2} 代表 (a, a, b)；{2,3} 代表 (b, a, a)。

將以上特例一般化：展開 (a + b)ⁿ 時，考慮如何從位址集 {1, 2, …, n} 中取 k 個位址，放入 k 個 a 進 (_, _, …, _)。由此，我們需要工具計算從 n 相異物取 k 件的所有組合數。

組合學基礎重溫

為免偏離主題，下面只會覆蓋了解二項式 (a + b)ⁿ 結構所需的組合學工具：排列數和組合數。

排列

{A, B, C} 有 3! 種排列方法，第 1 位有 3 個選擇；第 2 位有 3 - 1 = 2 個選擇；第 3 位有 3 - 2 = 1 個選擇。留意上面每分句中，兩個數字相加為 3 + 1 = 4。如此類推，則 n 相異物件有 n! = n (n - 1) (n - 2) ⋯ 2 ⋅ 1 種排列方法。 ℹ️ '⋅' 表示乘法。個人建議除非是小學基礎算術或有特別定義的積（如向量積 (vector product) 和直積 (direct product)），否則避免在有變量時使用 '×' 表示乘法，以免（在考試時因緊張）和 '𝑥' 混淆，要使用 '⋅' 或 '()' 代替。

若只需從 n 相異物件中取 0 ≤ k ≤ n 個排列，那怎麼辦？

k = n 的情形已做完。
k = 0 的情形只有 1 個：甚麼都不取。
其餘情形重覆上面 "第 i 位有 n + 1 - i 個選擇"，i = 1, 2, …, k，所以有 n (n - 1) (n - 2) ⋯ (n + 1 - k) 種排列法。以上數字標記為 ₙPₖ 或 Pₖⁿ。為方便電腦顯示，下面將使用 ₙPₖ。

任意排列 n 相異物。

            a₁, a₂, …,                                    , aₙ
|←-------------------- n 相異物任意排列 ---------------------------→|

有 n! 種可能。

另一方法
先從 n 相異物中選 k 件任意排列，有 ₙPₖ 種可能。
再排列剩下的 n - k 件物件，有 (n - k)! 種可能。

            a₁, a₂, …, aₖ,                      aₖ₊₁,aₖ₊₂, …, aₙ
|←--- n 相異物中選 k 件任一排列 ----→|←--- 剩下 n - k 件任意排列 ----→|

共有 ₙPₖ ⋅ (n - k)! 種可能。

兩種方法皆能構成 n 相異物的任意排列，所以可能數應一樣。取等式 ₙPₖ ⋅ (n - k)! = n!，則 ₙPₖ ＝ n! / (n - k)!
建立文字化理解：嘗試在上面右邊加入「忽略」兩字。不管右邊 n - k 件物件如何排列，都看成 1 種情況：甚麼都沒有。一邊望着上圖，一邊將文字「忽略」和算式中的除號「/」掛勾。

組合

從 n 相異物件中取出 0 ≤ k ≤ n 個，不考慮它們的排列。例如從 {1, 2, 3, 4} 中取出組合 {1,2}，(1, 2) (先取 1 後取 2) 和 (2, 1) (先取 2 後取 1) 一樣。回想上節談過「忽略」和「除號」的連繫，所以「忽略 k 個被選物的排列」轉化為算式中的「除以 k!」。 ₙCₖ = ₙPₖ / k! = n! / [k! (n - k)!] 種可能組合。

二項式定理基本版

(a + b)ⁿ 展開後其中一項 aᵏ bⁿ⁻ᵏ 的係數，代表從位址集 {1, 2, …, n} 中取 k 個位址的組合數，即 ₙCₖ。（像本章開首般為 (a + b)ⁿ 畫一幅圖，會有助理解。）由於 a 的次方 k 取值可由 0 至 n，所以有

           n
(a + b)ⁿ = ∑ ₙCₖ aᵏbⁿ⁻ᵏ 。
          k=0

Raw

231020-bdd.md

由於 (1 + 1/n)ⁿ 是二項式的 n 次方，要了解它的特性（如剛才展示的上下限），需要用上二項式定理。上面不等式最具技巧的一步在於藍色分母從 n! 變成 2ⁿ⁻¹。小問題：為何上標有 "-1"？重點在於 n! = 1 ⋅ 2 ⋅ 3 ⋯ (n - 1) n 中，當 n! 變成 (n + 1)! 時，額外乘上的數字 n + 1 是隨 n 而增長，但 2ⁿ 變成 2ⁿ⁺¹ 時，額外乘上的數字永遠是 2，所以當 n「足夠大」（n > 3）時，n! > 2ⁿ。取倒數後不等式反轉，於是出現 1/n! < 1/2ⁿ，然後就可以運用等比數列和公式，為 (1 + 1/n)ⁿ 給出上限。

上面實驗發現 n 越大，(1 + 1/n)ⁿ 也越大。即若 m < n，(1 + 1/m)ᵐ < (1 + 1/n)ⁿ。這種數列我們叫__嚴格遞增數列__。（「嚴格遞增」比「單調遞增」「嚴格」，只接受「>」，不接受「=」。）練習：試證 (1 + 1/n)ⁿ < (1 + 1/(n + 1))ⁿ⁺¹ 提示：

如上面般展開 (1 + 1/n)ⁿ，分離最簡單兩項。
其餘 n - 1 項中，調整分子分母配對，先把 1 / k! 放在左邊。
留意 (n - 1) / n = 1 - 1 / n < 1 - 1 / (n + 1) = n / (n + 1)，如此類推。

數列 ( (1 + 1/n)ⁿ )ₙ 只升不降，但又小於 3。

3 大於或等於此數列中所有項，我們稱 3 為此數列的__上界__ (upper bound)。
與之相對應的就是__下界__ (lower bound)。2 小於或等於此數列中所有項，我們稱 2 為此數列的__下界__。從實驗觀察中，我們發現此數列「最後接近 2.71828」。我們自然會問：「2.9 能否成為此數列的上界？2.8 呢？2.75 呢？」若我們改良有關 n! 的不等式成「若 n ≥ 4，n! > 2ⁿ」，再重覆上面用等比數列算 ( (1 + 1/n)ⁿ )ₙ 上界的方法，即有較少的上界 2 + 1/2 + 1/6 + (1/16) (2) = 2 + 19/24 = 2.791̇6666... 那麼這些 ( (1 + 1/n)ⁿ )ₙ 的上界（即大於此數列的所有項的數字，例如 2.7917, 2.8, 2.9, 3）中，有沒有一個最小的？答案是肯定的，因為數學上有條叫上確界公理（least-upper bound axiom）。

上圖擷自維基，能給大家一個圖像直覺。只要右邊有一綠點在所有藍點的右邊，那麼即存在最左的一點（紅點示），使得這一點在所有藍點的右邊。

綠點：集合 M 的上界
藍點：集合 M 元素
紅點：集合 M 的上確界，一般標記為「sup M」

留意：

上確界公理只說有紅點，但沒有說過怎樣算出紅點位置。
紅點位置上可能但不一定有藍點——這就是「上確界」（紅點, sup M）和「最大值」（最右的藍點, max M）的分別。後者不一定能找到，本章主角本利和數列即為一例，見下面解釋。

紅點有三個特質：

所有藍點都在紅點的左邊或紅點上。
從紅點向左畫一（任意長）橫線段，設線段上必有一藍點。
從紅點向右畫一橫線。所有綠點都在紅點的右邊或紅點上。用文字理解以上特質：
上確界是上界。
比上確界小的數就不是上界。
上確界是最小的上界。練習：用變量和不等式寫出上確界的特質。

我們的本利和數列 ( (1 + 1/n)ⁿ )ₙ 各項就如上圖中的藍點，只前進不後退。
2.7917, 2.8, 2.9, 3 就如上圖中的綠點，在藍點的右邊。
由上確界公理，可構建一紅點，代表此數列的上確界，標記為「sup {(1 + 1/n)ⁿ | n ∈ ℕ}」或簡單一些「supₙ (1 + 1/n)ⁿ」。
紅點上不可能有藍點，因為此數列是嚴格遞增，即每一藍點的右邊都有另一藍點。若紅點上有藍點，藍點右邊有另一藍點，則紅點右邊有藍點，違反上面特質 1。 ℹ️ 自然數集 ℕ 是否包括 0，視乎課題和作者選擇。本章 ℕ 不包括 0，因為主角是數列：數列可一個個地數，而我們日常生活數數是由 1 開始數的。

觀察：當數列 (aₙ)ₙ 單調遞增且有上界時，先取 L = supₙ aₙ（∈ ℝ，獨立於 n），再任取一正數 ε > 0（代表數列中任意一項和 L 的絕對誤差）。按特質 2，總有一指標 N ∈ ℕ，使得 $$L - \epsilon < a_N \le L。$$

由於 (aₙ)ₙ 單調遞增且 L 是上界 $$L - \epsilon < \underbrace{a_N < a_{N+1} < a_{N+2} < \dots}_{\textrm{數列 } \left(a_n\right)_n \textrm{ 的「尾巴」}} \le L$$

注意這裏我們先固定正數 ε > 0 的值，再按 ε 的值取 N ∈ ℕ（「尾巴頭」），所以有些書會寫 N = N (ε) ，代表 N 隨 ε 而變。由於絕對誤差 ε 的選取可以是__任意小__（想取有多小就有多小，例如 ε = 10⁻⁵, 10⁻⁸, …），所以單調遞增數列 (aₙ)ₙ 「任意接近」它的上確界 L = supₙ aₙ。只要將數列正負號倒轉，即有單調遞減數列「任意接近」它的下確界。我們即將引入符號，表達一數列「任意接近」一個數字。

數列極限 ε-N 定義

由於我們想引入定義，而定義越廣，能套用的機會就越大，所以引入符號前，再觀察上面不等式，看看有甚麼條件能放鬆。很多時實例會幫助思考抽象條件：以 ( (-1)ⁿ/n )ₙ 為例 (-1, 1/2, -1/3, 1/4, …)，它的「尾巴」很可任意小。 || 對任意小的 ε > 0, 0 - ε < (-1)ⁿ / n < 0 + ε ⟺ |1 / n| < ε || || ⟺ n > 1 / ε ⟸ (N = ⌈1 / ε⌉ 及 n ≥ N) ||

數列 (aₙ)ₙ 不需要單調遞增／單調遞減。
L ∈ ℝ 不需要是上界／下界。
留意上面隱藏文字中的單向箭咀 '⟸' 上面不等式可改寫做 $$L - \epsilon < \underbrace{a_N < a_{N+1} < a_{N+2} < \dots}_{\textrm{數列 } \left(a_n\right)_n \textrm{ 的「尾巴」}} < L + \epsilon$$

先用個較接近人類語言的方式寫極限定義：

能找出固定的實數 L ∈ ℝ（獨立於下面的 ε > 0）。對於任意小的絕對誤差 ε > 0，都能找到一個「尾巴頭」N = N(ε) ∈ ℕ，使得整條「尾巴」都被包含在「L 的ε-鄰域」(L - ε, L + ε) 內。此時定義 L 為數列 (aₙ)ₙ 的極限。

有文字理解不夠，最終要用符號正式寫一次。引入兩個邏輯符號 '∀'（對於所有）和 '∃'（存在）。

能找出……L ∈ ℝ：∃ L ∈ ℝ

對於……ε > 0：∀ ε > 0

都能找到……N = N(ε) ∈ ℕ：∃ N ∈ ℕ

整條「尾巴」：{aₙ | n ≥ N}

整條「尾巴」都被包含在……(L - ε, L + ε)：∀ n ≥ N, | aₙ - L | < ε

把上面右邊的符號一口氣寫完

∃ L ∈ ℝ : ∀ ε > 0 : ∃ N ∈ ℕ : ∀ n ≥ N, | aₙ - L | < ε 若 L 滿足以上條件，則稱__L 為數列 (aₙ)ₙ 的極限__。可記作「當 n → +∞，aₙ → L」或 $L = \lim_{n \to +\infty} a_n$。

Raw

231021-equiv.md

上面用符號記 (aₙ)ₙ 的極限 L 時，使用了等號 '='。若極限非唯一，將會得出「L = limₙ aₙ = L'」，這和「L ≠ L'」衝突，所以我們需要證明極限值唯一，使用等號 '=' 標示極限值方有意義。

  (𝑎ₙ)ₙ 的 𝑁-尾巴  (𝑎ₙ)ₙ 的 𝑁′-尾巴
           │              │
           ↓              ↓
──(─────┼─────)───────(─────┼─────)──→
 𝐿−𝜀    𝐿    𝐿+𝜀     𝐿′−𝜀   𝐿′   𝐿′+𝜀

   𝐿 的 𝜀-鄰域          𝐿′ 的 𝜀-鄰域

證明技巧很經典，有兩個極限 L 和 L′，即運用極限定義得出 (aₙ)ₙ 的兩條「尾巴」（{aₙ | n ≥ N} 和 {aₙ | n ≥ N′}）。注意兩條「尾巴」必定是一個包含住另一個，所以只需取較短的一條，以同時滿足兩個「鄰域條件」。 | L - L′ | ≤ | L - aₙ | + | aₙ - L′ | ≤ 2ε 留意上面不等式中 L 和 L′ 獨立於 ε，而 ε > 0 任意小。圖像直覺：L 和 L′ 的距離有 2ε，然後 ε 不停縮小。我們的目標是 L = L′，由於已知條件已用盡，L 和 L′ 獨立於 ε，所以用反證法：設 L ≠ L′，則 | L - L′ | > 0。取 ε = | L - L′ | / 3，則上面不等式變成 | L - L′ | ≤ 2 | L - L′ | / 3，此不等式顯然錯誤，所以假設 L ≠ L′ 錯誤。剛才我們證明一條引理。

設 a ≥ 0，且對任意 c > 0，a ≤ c。證明 a = 0。本科基礎分析碰到這引理時，老師說「這個日後好駛好用。」

極限的四則運算很直覺，它們的證明能練習極限定義，上網也能查到，在此不敍。練習：對於任意實數 r，等比數列 (rⁿ)ₙ 的極限存在嗎？提示：針對 | r | 的大小分開幾種情形，使用二項式定理：

| r | = 0 或 1
0 < | r | < 1 || 1 / (1 + c)ⁿ ≤ 1 / (1 + nc) ，取 n → +∞ ||
| r | > 1 || (1 + c)ⁿ ≥ 1 + nc，取 n → +∞ ||

數列的單調收斂定理

上面已證明過本章主角 ( (1 + 1/n)ⁿ )ₙ 是個嚴格遞增數列，即其中一種單調數列。上兩節末帶出有上界的單調遞增數列「任意接近」上確界。在上節引入「極限」的定義後，我們終於可以準確且精簡地描述這一現象。這個結果就是數列的 單調收斂定理 （Monotone Convergence Theorem (for sequences)）。

設 (aₙ)ₙ 是有（上界及下）界的單調數列，則它的極限存在。至此，我們只要運用這條定理，即知極限 limₙ (1 + 1/n)ⁿ 存在，且為此數列的上確界。在數學中，我們叫這個極限做尤拉數（Euler's number），標記為 𝑒，約值為 2.71828。

用無窮級數構造尤拉數

設有數列 (aₙ)ₙ，對於每一項 aₙ，取首 n 項之和 sₙ = a₁ + a₂ + ⋯ + aₙ，生成另一數列 (sₙ)ₙ。我們稱 (sₙ)ₙ 為 (aₙ)ₙ 的級數（series）。若 (sₙ)ₙ 的極限存在，則可以簡化

$$\textrm{「} \lim_{n\to+\infty} \sum_{k=1}^n a_n \textrm{」作「} \sum_{k=1}^{+\infty} a_n \textrm{」。}$$

練習：延續上兩節的練習，求等比數列 (rⁿ)ₙ 的無窮級數。留意上面為本章主角 ( (1 + 1/n)ⁿ )ₙ 求上界時，用二項式展開 (1 + 1/n)ⁿ，順手發現一條不等式（方框示）

對於所有 $n \in \Bbb{N}$，

$$\boxed{\sum_{k=0}^n \frac{1}{k!} = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \cdots + \frac{1}{n!} < 3}$$

由於級數

$$\left( \sum_{k=0}^{n} \frac{1}{k!} \right)_n$$

嚴格遞增，運用單調收斂定理，可知它的極限

$$\sum_{k=0}^{+\infty} \frac{1}{k!}$$

存在。

,w sum 1/k!, k=0 to 20

由於 n! 飆升極快，為節省電腦運算時間，實驗就止停下。上面使用 n = 20 估算無窮級數的誤差不大於

1/21! + 1/22! + ⋯ = (1/21!) (1 + 1/22 + ⋯) < (1/21!) (1 + 1/2 + ⋯) = 2/21! ─── (*)

這是個很微小的數字，比 10⁻¹⁵ 還要少。

(*) 極度粗略且不貼近真正的估算誤差，但足以說明此級數收歛之快。留意上面的數字「極度接近」尤拉數 𝑒 = limₙ (1 + 1/n)ⁿ。

如何在直覺上說服自己，覺得這很合理？比對本利和展開式及 ( 1/n! )ₙ 的級數的第 k 項：

若 k 遠小於 n，且 n「足夠大」，則括弧內的 1 - 1/n, 1 - 2/n, …, 1 - (k - 1)/n「足夠接近」1，整個大括弧「足夠接近」0。若 k「足夠大」，1 / k!「暴跌至」0，而左邊大括弧是個介乎 0 到 1 之間的數字。要處理大括弧內的積，其中一種思路就是化積為和。

練習：設 $n \in \bN$，對所有 $k \in {1, \dots, n}$，$x_k \in [0,1]$。證明 $$1 - \sum_{k=1}^n x_k \le \prod_{k=1}^n (1 - x_k)$$

上述不等式很粗略，因為左邊有可能為負數，但右邊永遠在 0 和 1 之間。思考一下以上不等式的意義：代入 xₖ = cₖ ε > 0，其中 ε > 0 表示「遠比 cₖ 們小的誤差」。這時不等式左邊代表不等式右邊積的__一階估計__（first-order approximation），即只保留該積中 ε 次數 ≤ 1 的項。為甚麼做一階估計？為甚麼 ε 次數 ≥ 2 的東西，我們想忽略？試想像 ε = 0.1，即麼 ε² = 0.01。0.1 cm 長的東西或能用間尺手畫，但 0.01 cm 長的東西已經不能用手畫。做點科學實驗，加入若干 ml 的液體，或是做烘焙磅重時，試試感受一下分配材料重量時的精確度。

現在試用文字理解上面不等式：假設起始值 1 （例如有 1 份身家）。

大兒子分走現有身家的 x₁：起始值 1 乘以 1 - x₁，代表起始值 1 減去 x₁
二兒子分走剩餘身家的 x₂：

不等式右邊：現值 1 - x₁ 乘以 1 - x₂，代表現值 1 - x₁ 減去當中的 x₂（即__減去 (1 - x₁) x₂__ < x₂）。
不等式左邊：從 1 - x₁ 直接減去 x₂，減得比不等式右邊多。

三兒子分走剩餘身家的 x₃：

不等式右邊：現值 (1 - x₁) (1 - x₂) 乘以 1 - x₃，代表現值 (1 - x₁) (1 - x₂) 減去當中的 x₃（即__減去 (1 - x₁) (1 - x₂) x₃__ < x₃）。
不等式左邊：從 1 - x₁ - x₂ 直接減去 x₃，減得比不等式右邊多。若且唯若 {xₖ | k = 1, …, n} 中最多只有一個非零元素，等式成立。（有兩個兒子拿走非零身家後，不等式左邊小於不等式右邊。）用數學歸納法證明以上不等式，看不清現實意義，但仍有練習價值，值得一做。

以上不等式中取 xₖ₋₁ = (k - 1) / n，則上面兩極限差中的大括弧內小於 x₁ + x₂ + ⋯ + xₖ₋₁ = k(k - 1) / (2 n)，此分數中的

1/(2n) 調往 '∑ₖ' 外。
分子 k(k - 1) 和 1 / k! 約簡成 1 / (k - 2)!。接着 '∑ₖ' 範圍改成 k = 0, …, n - 2，右邊改成 1 / k!。從上面方框框起的不等式，可知此和有上界（3）取 n → +∞ 以完成目標。

$$ \begin{align} &\quad \left( \sum_{k=0}^n \frac{1}{k!} \right) - \left(1 + \frac1n \right)^n \\ &= \sum_{k=2}^n \left(1 - \frac{\color{red!50}n \cdot \dots \cdot (n + 1 - k)} {\underbrace{n \cdot \dots \cdot n}_{n^k}} \right) , \frac{1}{\color{blue!50}k!} \\ &= \sum_{k=2}^n \left(1 - \left(1 - \frac1n\right)\left(1 - \frac2n\right) \dots \left(1 - \frac{k-1}{n}\right) \right) , \frac{1}{\color{blue!50}k!} \\ &< \sum_{k=2}^n \frac{k(k-1)}{2n} , \frac{1}{\color{blue!50}k!} \\ &= \frac{1}{2n} \sum_{k=2}^n \frac{1}{(k-2)!} \\ &= \frac{1}{2n} \sum_{k=0}^{n-2} \frac{1}{k!} \\ &< \frac{1}{2n} , (3) \tag{$\fbox{方框不等式}$} \\ &\xrightarrow[n\to+\infty]{} 0 \end{align} $$

用極限四則運算得出理想結論。 $$e = \lim_{n\to+\infty} \left(1 + \frac1n\right)^n = \sum_{k=0}^{+\infty} \frac{1}{k!}$$

Raw

231022-exp.md

複利率和指數定律

上面為把尤拉數介紹得更簡單，把本利和假設為 r = 100% = 1 ——這顯然不設實際，因為在不少地區，放高利貸（年利率超過一定百分比，例如 60%）不合法。這時本利和數列變成 ( (1 + r/n)ⁿ )ₙ。運用同樣方法，用二項式定理展開它。

\definecolor{r}{RGB}{200,150,150} \definecolor{b}{RGB}{150,150,200} \begin{CJK}{UTF8}{bkai} $$\begin{aligned} &\quad 1 + n\left(\frac{r}{n}\right) + \frac{\color{r}n(n-1)}{\color{b}2!}\left(\frac{r}{n}\right)^2 + \frac{\color{r}n(n-1)(n-2)}{\color{b}3!}\left(\frac{r}{n}\right)^3 + \cdots \ &\quad+ \frac{\color{r}n(n-1)(n-2) \cdots 2 \cdot 1}{\color{b}n!}\left(\frac{r}{n}\right)^n \ &= 1 + r + \frac{r^2}{\color{b}2} , \underbrace{\frac{\color{r}n(n-1)}{n^2}}{<1} + \frac{r^3}{\color{b}3\cdot 2} , \underbrace{\frac{\color{r}n(n-1)(n-2)}{n^3}}{<1} + \cdots \ &\quad+ \frac{r^n}{\color{b}n \cdot (n-1) \cdots 3 \cdot 2 \cdot 1} , \underbrace{\frac{\color{r}n(n-1)(n-2) \cdots 2}{n^n}}{<1} \ &= 1 + r + \boxed{\frac{r^2}{\color{b}2} + \frac{r^3}{\color{b}3\cdot2} + \cdots + \frac{r^n}{\color{b}n(n-1)\cdots3\cdot2}} \ &< 1 + r + \frac{r^2}{\color{b}2} + \frac{r^3}{\color{b}2\cdot2} + \cdots + \frac{r^n}{\color{b}\underbrace{2\cdot2\cdots2}{=2^{n-1}}} \ &= 1 + r + \frac{r^2}{2} , \frac{1-(r/2)^{n-1}}{1-r/2} \ &< 1 + r + \frac{r^2}{2} , \frac{2}{2-r} \end{aligned}$$ 從以上展開式，易見當 $n>1$, $1 + r < \qty(1+\frac{r}{n})^n < 2 + \frac{r^2}{2} , \frac{2}{2-r}$. \end{CJK}

一如上面順手發現的級數不等式，我們也發現這個級數是收斂的。關於二項式極限和無窮級數極限等價，證明也是同一道理，只不過將右邊分數 1 / k! 中的分子改成 rᵏ，留作練習。可惜上述論證只對 0 < r < 2 有效。那麼對其他的 r，可以怎樣調整上面的內容？分作以下兩種情形討論：

r ≥ 2：仍舊留意 n! 飆升遠比 Mⁿ 快，此處 M 為一固定的（底）數。按 r 的值選取適當的 M，使得 r / M < 1，於是我們可以用等比數列和給上界，再用單調收歛定理構建極限。留意 M 的選取不受 n 影響，還有首兩項 1 + r 仍為本利和 (1 + r/n)ⁿ 下界及線性近似（linear approximation）。
r < 0：(r / n)ᵏ 在 k為奇數時變負數，所以不能直接用 " (紅色分母/ nᵏ) < 1 " 使該分數消失。

留意當 n 「足夠大」，「負利率本利和」(1 + r/n)ⁿ 仍為正數。
- 「負利率本利和」以引號括起，因為負利率 r < 0 不符現實，但理論上有價值，在下一節能幫助我們理解一般形式的指數定律和對數——一般課程中無法仔細討論的課題。
- 由於我們已經引入了 "∀"（對於所有）和 "∃"（存在）兩個符號，所以可以定義何為「足夠大」：「當 n 足夠大，命題 P(n)成立」即「這裏存在 N ∈ ℕ，使得對於所有 n ≥ N，命題 P(n) 成立」。一條__命題__就是一句__可以被__（已知公設、公理、定義和已被證明的定理）證明為對或錯的句子。比如剛才的 "n! ≥ 2ⁿ" 就是一條關於變量 n 的命題，可以記為 P(n)。那麼除了 1, 2 和 3 外，n 可取值其他的非負整數，使得 P(n) 成立。
- 此處需要用上「足夠大」的概念，是因為當 n 是「不夠大」（n < -r）的奇數時，「負利率本利和」(1 + r/n)ⁿ 變成負數。由於我們在考慮「負利率本利和」數列的極限（換句話說，給定一個任意小的鄰域，看看能否把此數列的「尾巴」裝進這個鄰域。），所以我們不管它的前 10 項、前 100 項、前一億項，只管數列的某條「尾巴」（選定一 N ∈ ℕ，然後有「N-尾巴」{ aₙ | n ≥ N }）。一旦取 N = ⌈ -r ⌉，那麼隨着 n (≥ N) 增大，1 + r/n 中的 r/n 會越來越接近 0。
- 「負利率本利和」(1 + r/n)ⁿ 展開後，每一包含 r 的奇數次方的項前，有一個 r 偶數次項，該兩項係數比例 = 後項 (2k + 1 次) / 前項 (2k 次) = [ (n - 2k) / (2k + 1) ] (r / n)。即使 n 足夠大，只要 -r > 2k + 1，起始時 r / (2k + 1) < -1 無法控制，唯有改變策略。
- ( (1 + r/n)ⁿ )ₙ 有嚴格遞增的尾巴。當中使用了伯努利不等式的最基本情形 "∀ x ≥ -1, ∀ n ≥ 1, (1 + x)ⁿ ≥ 1 + nx"。練習：用數學歸納法證明伯努利不等式的最基本情形。又使用單調收歛定理構建極限。

\begin{CJK}{UTF8}{bkai} 難處：用伯努利不等式拆括弧做線性近似時，看似只能縮小分子，無法單獨對分母套用此不等式。\ 解法：把分子分母融合，砌出 $(1 + 1/?)^{\textrm{同一次方}}$ 後再套用此不等式。 \begin{align} &\quad \frac{\left(1-\frac r{n+1}\right)^{n+1}}{\left(1-\frac rn\right)^n} \tag{假設 $n > r$} \ &=\left(\frac {n(n+1-r)}{(n+1)(n-r)}\right)^{n+1}\left(1-\frac rn\right)\ &=\left(1+\frac r{(n+1)(n-r)}\right)^{n+1}\left(1-\frac rn\right) \tag{伯努利不等式} \ &>\left(1+\frac r{n-r}\right)\left(1-\frac rn\right) \tag{$r > 0, n > r$}\ &=1 \end{align} （答案來自 Math.SE robjohn） \end{CJK}

可是，「負利率」 r < 0 對應的無窮級數

,,\sum_{k=0}^{+\infty} \frac{r^k}{k!}

中有負數，不能直接施展上面的不等式技巧。為了將他們全變做正數，我們需要借助一種叫「絕對收斂」的技巧。

絕對收斂與柯西數列

\begin{CJK}{UTF8}{bkai} \begin{Lemma}[絕對收斂 $\implies$ 收斂] 若 $\sum_{n=0}^{+\infty} |a_n|$ 存在（即數列 $(a_n)n$ \textbf{絕對收斂}），則 $\sum{n=0}^{+\infty} a_n$ 存在。 \end{Lemma} \end{CJK}

有了這一招，則上面無窮級數中的分子可變成正數 |r|ᵏ，然後重覆套用二項式和級數比較，即可證明對所有 r ∈ ℝ

,,\lim_{n\to+\infty} \left(1 + \frac{r}{n}\right)^n = \sum_{k=0}^{+\infty} \frac{r^k}{k!}

我們暫且標記這極限為 "exp(r)"，"exp" 取自英文 "exponential"，中文叫「指數函數」，因為對於每一個實數 r ，這極限都有唯一的極限值。下一節會介紹另一個常用標記。了解了「絕對收斂」如何幫助我們達成本節目標後，我們繼續此引理。記起我們上面求用 n = 20 估算 ( 1 / n! )ₙ 的無窮級數時的誤差： 1/21! + 1/22! + ⋯ = (1/21!) (1 + 1/22 + ⋯) < (1/21!) (1 + 1/2 + ⋯) 右邊看似做等比數列的無窮級數，心中卻想着有限項的和，然後丟掉分子中的 "- (1/2)ⁿ"。其實留這條「尾巴」的首 10 項已夠，再多無實際意義。我們把級數 (sₙ)ₙ 看做一數列，那麼這「尾巴」的首 10 項和是 a₂₁ + a₂₂ + ⋯ + a₃₀ = s₃₀ - s₂₀。我們剛才估算「誤差」 s₃₀ - s₂₀ （< 10⁻¹⁵）時，完全沒想過 (sₙ)ₙ 的極限值（𝑒 ≈ 2.71828）。這提示了我們，其實不一定要知道數列的極限值，也有可能知道數列是否收斂。極限值（例如 𝑒）是個「外在的條件」，因為在極限的定義中，極限值 L ∈ ℝ 的存在完全獨立於數列 (aₙ)ₙ。（我們不能從本利和 (1 + 1/n)ⁿ 中觀察出 𝑒 來。）若然找不出數字 L，就無法使用定義證明極限。「尾巴長度」| aₙ - aₘ | 明顯是個「內在的條件」。試用文字加圖像回想極限定義，就是將一條尾巴塞進一個「（L 的）ε-鄰域」，那麼「尾巴長度」也應任意小。

對於任意 ε > 0，存在 N ∈ ℕ，使得對於所有 m, n ≥ N，| aₙ - aₘ | < ε。 ∀ ε > 0 : ∃ N ∈ ℕ : ∀ m, n ≥ N, | aₙ - aₘ | < ε 我們稱這種數列 (aₙ)ₙ 為柯西數列（Cauchy sequence）。如果先有 L（數列 (aₙ)ₙ 收斂），那麼剛才引入柯西數列前的那段字已經勾勒出為何 (aₙ)ₙ 柯西。剛才關於估算「誤差」的討論引發我們去想，究竟反過來，柯西的「任意短尾巴」能否令「尾巴不要亂跑，固定在一 ε-鄰域」？換句話說，(aₙ)ₙ 柯西是否代表它收斂？若然答案是肯定的，那麼「柯西」和「收斂」等價，上面的「絕對收斂 ⟹ 收斂」即可透過「柯西」得證，證明要用絕對值的三角不等式 | a + b | ≤ | a | + | b |，又留作練習。

\begin{CJK}{UTF8}{bkai} 「柯西 $\implies$ 收斂」關鍵在於找出一個子數列（subsequence）$(a_{n_k})_k$（$(n_k)_k$ 是一數列，按此數列選 $(a_n)_n$ 的項），使用此子數列的極限為 $L$。之後運用「柯西的任意短尾巴」就能搞定，詳細步驟在任何基礎分析書或講義能找到。子數列極限 $L$ 可用以下三種方法構建，按難易度排列： \end{CJK}

任何數列 (aₙ)ₙ 有單調子數列。又知柯西數列 (aₙ)ₙ 有界，所以運用單調收斂定理造出此子數列的極限 L——這是波爾查諾-魏爾施特拉斯定理（Bolzano-Weierstrass Theorem）一維情況證明的大概。
俄羅斯娃娃一個套一個：

最外層的娃娃裝住整個數列 (aₙ)ₙ。這個娃娃 [a, b] 裏面有另一個大小是一半的娃娃 [a, (a + b) / 2) 或 [(a + b) / 2, b]。
由於數列有無窮多個，所以兩個子區間中有最少一個會包含無窮多個 (aₙ)ₙ，選一個子區間做「裏面的娃娃」，大小是「外面的娃娃」的一半。
重覆這個過程，得出一串一個套一個的俄羅斯娃娃。子區間兩邊端點皆為單調數列，又用單調收斂定理造出極限，再用「裏面的娃娃」可任意小得證——這是區間套定理（Nested Intervals Theorem）證明的大概。

區間套定理的進階變種版：見 Math.SE。利用柯西數列 (aₙ)ₙ 有界，構建以下三條數列：

「尾巴下確界」：ℓₙ = inf { aₖ | k ≥ n } 單調遞減
「尾巴上確界」：uₙ = sup { aₖ | k ≥ n } 單調遞增
「尾巴長度」：cₙ = sup { aᵢ - aⱼ | i, j ≥ n } 任意小
從文字直覺得知 cₙ = uₙ - ℓₙ
- 又用單調收斂定理得知前兩數列的極限存在
  - 前者叫數列 (aₙ)ₙ 的「下極限」（limit inferior，記作 liminfₙ aₙ）
  - 後者叫數列 (aₙ)ₙ 的「上極限」（limit superior，記作 limsupₙ aₙ）
- 「柯西的尾巴長度 cₙ 任意小」
- 最後用極限四則運算得知前兩數列的極限值一樣

上面第三種方法用上以下經典結果：用 liminf 和 limsup 可給出和上幾節「極限的 ε-N 定義」等價的定義。

若且唯若 limₙ aₙ = L ∈ ℝ，liminfₙ aₙ = limsupₙ aₙ = L ∈ ℝ。為何要引入這個 liminf 和 limsup 定義？下舉一些它的優缺點。 ❌ liminf 和 limsup 很難用於實際極限值計算（取個較複雜的多項式試試）。這是因為上下界和數列的項很多時候都是用不等式連繫起來，對一些不等式做四則運算（例如從 "a ≤ c 及 b ≤ d" 推出 "a + b ≤ c + d"）肯定沒有對等式容易。 ✅ 數列 (aₙ)ₙ 的 liminf 和 limsup 永遠存在，通常是個「內在的條件」，不用像 ε-N 定義般要先自行決定極限值。可是，很多高中課本和習題中的極限值可以用簡單公式（如極限的四則運算）算出，所以 ε-N 定義中的「外在條件」 L 未必如想像中那麼難求出。 ✅ 我們不能用 ε-N 直接定義何為「趨向正無限大（limₙ aₙ = +∞）」，因為我們不能寫 "| aₙ - (+∞) | < ε"，因為我們只知道實數的四則運算，沒法清楚定義 "(+∞) - (+∞)" ||ℕ \ {偶數} vs ℕ \ {正整數} 皆為兩個（有）無限（多元素的）集合，但前者是無限集合，後者是有限集合||。只能

透過 "倒數的極限為 0 且「最終是正數（當 n 足夠大時，aₙ > 0）」" （limₙ 1 / aₙ = 0 及 ∃ N ∈ ℕ : ∀ n ≥ N, aₙ > 0）間接定義 "limₙ aₙ = +∞"，或
乾脆將 ε-N 定義中的任意小量 "ε > 0" 用任意大量 "M > 0" 代替，語句最右邊的不等式改成 aₙ > M。以上兩者都不及一句「liminfₙ aₙ = limsupₙ aₙ = +∞」來得簡潔。 "數列 (aₙ)ₙ 的 liminf 和 limsup 相等" 和 "數列 (aₙ)ₙ 的極限存在" 兩者容易掛勾，由於 liminf 和 limsup 出現在基礎分析中，所以不少數學分析書有採用這個定義，能包含 "L = ±∞" 的情形。對於其他非數學主修的人來說，他們學微積分的目的主要為應用當中的計算技巧，解決他們領域的問題（求速度、體積、重量等），所以學習內容以計算為主。上面已舉例說明我們不能對 "±∞" 像普通實數般做四則運算，所以高中微積分課本會把 "L = ±∞" 的情形當作 "極限不存在"。數學是科學家和工程師之間的共同語言，所以就看語境和對象的習慣，決定 "極限存在" 是否包含 "趨向無限大"。

回顧一下我們所做過的事：

用複利率構建尤拉數 𝑒

從年利率 r = 100% = 1 的情況，通過兩項式定理及等比級數找出 ( (1 + 1/n)ⁿ )ₙ 上界。
展示此本利和數列是嚴格遞增。
實驗觀測此數列「接近」一約為 2.71828 的數，藉此引入「極限」和「上確界」。
運用單調收斂定理造出它的極限 𝑒，並解釋它的存在在貨幣系統中的意義。
聚焦剛才上界推導過程中順手發現的一條不等式。
- 引入「（無窮）級數」概念，上面順手發現的不等式有 (1 / n!)ₙ 的級數。
- 再用簡單的等比級數的不等式，以此級數首 20 項的和估計 (1 / n!)ₙ 的無窮級數，並粗略估算剛才近似值的誤差極小 (< 10⁻¹⁵)。由此可知此級數收斂極快。
解釋為何本利和數列極限 ( (1 + 1/n)ⁿ )ₙ 和 (1 / n!)ₙ 的無窮級數等值，同為 𝑒。

用任意「實數複利率 r」構建指數函數 exp(r)，嘗試重覆上節技巧，再引出一些技術問題。

先為「本利和數列」( (1 + r/n)ⁿ )ₙ 找上界。
- r > 0 的情形和上面形式相似，原理相同，並順手發現對應的無窮級數為 (rⁿ / n!)ₙ，並提及「本利和數列」和對應的無窮級數等值。
- 處理較複雜情形 r < 0：
  - 從網上借來的不等式（和伯努利不等式）推出 ( (1 + r/n)ⁿ )ₙ 「最終會」嚴格遞增，又運用單調收斂定理造出它的極限。
  - 對應的無窮級數 (rⁿ / n!)ₙ 出現負數項，引入「絕對收斂」的技巧，化負為正，以套用上點結果，於是有兩個指數函數 exp: ℝ → (0, +∞) 的等價定義。
    - 解釋「絕對收斂」的技巧：回望剛才估算 (1 / n!)ₙ 的無窮級數的過程，引入「柯西數列」的概念。
    - 給出三個證明「柯西數列」和「數列有極限」等價的方法，三者觸碰到不同的基礎分析經典結果，都用上單調收斂定理。
    - 比對兩種極限定義的優缺點。

Raw

231025-exp.mkd

為甚麼 "exp" 叫「指數函數」？它和指數有甚麼關係？試想像以年利率 r₁ 複利一年後，本利和為 (1 + r₁/n)ⁿ。之後發現一個更吸引的存款計劃，以更高的年利率為 r₂ 複利一年，本利和為 (1 + r₁/n)ⁿ (1 + r₂/n)ⁿ = [ (1 + r₁/n) (1 + r₂/n) ]ⁿ "≈" [ 1 + (r₁ + r₂)/n ]ⁿ? (線性估計方括號內的量) 兩邊取極限，按指數函數定義得 exp(r₁) exp(r₂) "≈" exp(r₁ + r₂)。我用引號包起 "≈"，因為這只是我的直覺，沒有嚴謹論證。上面用了「線性估計」，因為當 n 「很大」（如 n = 10¹⁵）時，1 / n 「很小」（如 n = 10⁻¹⁵），而 1 / n² 更是「微不足道」（如 n = 10⁻³⁰）。當然，上面只是用直覺猜答案——這在數學和物理中，是一種重要技能。細心思考這個事實「如果命題能被證明，那麼它是對的」。反過來說，如果命題（一開始）是錯的，那麼我們不可能證明它。花時間嘗試找個不存在的證明，猶如刻舟求劍，只會徒勞無功。另一項重要技能就是先從一些簡單的特例入手。我們不是在考試，可以借助電腦代替一些人手計算。

我們已引入了「極限」和「絕對收斂」的概念，所以我們可以精準地寫出本節的一個重要目標： exp(r₁ + r₂) = exp(r₁) exp(r₂) 或 limₙ [1 + (r₁ + r₂)/n]ⁿ = [limₙ (1 + r₁/n)ⁿ] [limₙ (1 + r₂/n)ⁿ]。

https://media.discordapp.net/attachments/1087424098562494505/1166836145204776980/701077747887243354.png?ex=69086817&is=69071697&hm=af7e137cd215260a8ec4c61fedc814a333341a84761a8a4406a03ceec7b2aa83&=&format=webp&quality=lossless&width=1793&height=741 https://media.discordapp.net/attachments/1087424098562494505/1166836195217645590/701077747887243354.png?ex=69086823&is=690716a3&hm=f3a316c539401d2892104d1007b3d52a70ecd789db1d453562a3bb8c3bcea41d&=&format=webp&quality=lossless&width=655&height=893

(3) → (4) 解釋

r₁ r₂ 可能 < 0，所以加上絕對值以保證不等式成立。
r₁ + r₂ 可能 < 0，所以回想構建 exp("負利率" r) 的過程中，我們用上「當 n 足夠大（n > r），『負利率本利和』數列嚴格遞增」。exp(r) 即為此數列的上確界及極限。為確保分母 n + r₁ + r₂ 為正數，取 n > r₁ + r₂。取 (4) 式從 k = 1 到 k = n 的和。

https://media.discordapp.net/attachments/1087424098562494505/1166836340936147005/701077747887243354.png?ex=69086846&is=690716c6&hm=ec88e744b967cb5d84808fdfda9aa8bed7e8040793fa5b44b05bbe317cf6adcd&=&format=webp&quality=lossless&width=1173&height=801

此處用上兩個基本事實

limₙ |aₙ| = 0 ⟺ limₙ aₙ = 0
aₙ ≤ bₙ 且兩數列的極限存在，則 limₙ aₙ ≤ limₙ bₙ

指數函數及對數的基礎性質

指數函數的另一種寫法

為甚麼 exp 叫指數函數？留意對於整數次方及固定底數，我們有 aᵐ⁺ⁿ = aᵐ ⋅ aⁿ，結構和__上面目標公式__一樣，左右各有 "+" 和 "⋅"，所以 exp(r) 有個更簡短的寫法 "𝑒ʳ"。用這種寫法，__上面目標公式__變成 𝑒ᵐ⁺ⁿ = 𝑒ᵐ ⋅ 𝑒ⁿ。到底哪種寫法更好？其實兩者都行，不過符號和字母組合有限。在別的課題中（如平面幾何），小楷的 e 或會被用作線段長度。又或者 "𝑒ʳ" 中的 r 太小，寫在黑板上，課室後排看不清。這時用 "exp(r)" 則更清晰，避免誤會。"𝑒²" 比 "exp(2)" 更能令初學者想起 "𝑒² = 𝑒 ⋅ 𝑒"，便於學習。兩種寫法都要懂，但可按個人習慣選擇寫法。

有了這種新寫法，加上 𝑒 是 > 1 的常數，於是有 ⋯ < 𝑒⁻² < 𝑒⁻¹ < 1 < 𝑒 < 𝑒² < ⋯，用文字精簡地說，就是「指數函數在 ℤ 上嚴格遞增」。上幾節我們努力從「實利率本利和」極限構建指數函數，而這函數的定義域是 ℝ。若把 (k, 𝑒ᵏ), k = -5, -4, …, 5, 畫出，然後連起來，很自然地會想到下分節目標。

指數函數嚴格遞增

x < y ⟺ 𝑒ˣ < 𝑒ʸ 等價於 h > 0 ⟹ 𝑒ʰ > 1 （為甚麼？|| 用反證法並思考 h 前隱藏的 '∀'，即明白為何雙頭箭咀會變成單頭箭咀。 ||）從一開始為本利和數列找上界時 ( (1 + r/n)ⁿ )ₙ，該二項式展開後首兩項即 1 + r，而其餘項均為正數，很自然有 (1 + r/n)ⁿ > 1 + r，加上指數函數是從此嚴格遞增數列的上確界而來，很自然又有 exp(r) > (1 + r/n)ⁿ。兩者結合，即「當 r > 0，exp(r) > 1 + r」。至此，本分節目標已達成。但這無阻我們問「當 r < 0，"exp(r) > 1 + r" 仍然成立？」當 r ≤ -1，答案太明顯，接下來集中討論 -1 < r < 0 的情形：數式仍和 r > 0 時一樣，不同的是背後的理由：

"exp(r) > (1 + r/n)ⁿ" 是 n 足夠大（n > -r）的情形。
"(1 + r/n)ⁿ > 1 + r" 則由於伯努利不等式。於是，我們有

對於所有 x ∈ ℝ，𝑒ˣ ≥ 1 + x，若且唯若x = 0，等式成立。用圖像理解此不等式：代表指數函數的曲線在直線 y = x + 1 之上，且它們只交於一點 (0,1)。

https://media.discordapp.net/attachments/1087424098562494505/1166836580741283900/701077747887243354.png?ex=6908687f&is=690716ff&hm=169fdbe26caae0a47e63de3890bba3b33d9a69296f6adc251526335c2d2d7080&=&format=webp&quality=lossless&width=800&height=763 https://media.discordapp.net/attachments/1087424098562494505/1166836581257203772/701077747887243354.png?ex=6908687f&is=690716ff&hm=234ed6a9d4ee5a739cd355ae1721e36ab7c1bee971100c7a0e7acecdf7b9d8e8&=&format=webp&quality=lossless&width=738&height=763

放大它們的相交點 (0, 1) 附近的圖像，肉眼所見，它們好像在「0 的 0.01 鄰域」(-0.01, 0.01) 重畳在一起。可是，上面不等式很實切地告訴我們，相交點只有一個。由此可知，繪圖工具有它的局限，雖用代算式補完我們的理解。代數算式有時會太抽象，讓我們不知如何繼續。此時，我們需要圖像或文字直覺。此三種理解概念的方法各有長短，因應概念不同，某方法會比另一方法更合適。不管要理解的概念如何，盡量嘗試用齊三種方法。

連續複利公式

返回最初的複利率公式：本利和 A = P (1 + r/n)ⁿᵗ 上式右邊取極限 n → +∞，得出__連續複利公式： A = P𝑒ʳᵗ__ 問題：剛才我們一直思考的是，固定「實年利率」 r ∈ ℝ 及年期 t = 1，求最後本利和是本金的多少倍 (A / P)。換角度思考，若我們固定 A / P，以及 r 和 t 兩者之一，如何找出另一變量的數值？這帶出下分節目標——從函數值（A / P）反過來求指數函數中自變數（rt）的值。

對數：指數函數的逆函數

上節已證明指數函數是嚴格遞增的，所以它是單射函數（或稱一對一函數：對於函數 f 值域上的任意 x 和 y，若 f(x) = f(y)，則 x = y）。可是，指數函數曲線中會否有些「空洞」，使曲線斷開？例如 f(x) = |x| / x 中 x ≠ 0 未能定義，值域 {-1, 1} 出現空隙，使得 "f(x) = 0.5" 無解。連引導我們思考何謂「連續」。還記得我有位老師說，用有限步驟思考無限，是件很偉大的事。

𝑓(𝑢ₙ) ─────○

          •────── 𝑓(𝑣ₙ)
     ─────┼──────⟶ 𝑥
          𝑥₀

見上圖，設兩數列 (uₙ)ₙ 和 (vₙ)ₙ 分別從左右兩方向趨向 x₀。( f(uₙ) )ₙ 和 ( f(vₙ) )ₙ 皆為常數數列，但它們的極限值不同。

左邊的虛點 "○" 代表函數 f 不在該點取值，但有 limₙ f(uₙ) = f(u₁)。
右邊的實點 "•" 代表函數 f 在該點取值（f(x₀) = f(v₁)），且有 limₙ f(vₙ) = f(v₁)。由此，我們得出用數列定義函數極限及連續的定義。

https://media.discordapp.net/attachments/1087424098562494505/1166837034791477302/701077747887243354.png?ex=690868eb&is=6907176b&hm=6b34703a7bbd9de3dbaced672ae429c88b2f46c0f5304fcdd724799616a567a8&=&format=webp&quality=lossless&width=1793&height=666

上面用數列的極限來定義函數的極限，雖然嚴謹，但實際操作困難。我們的目標是證明指數函數在整個定義域（ℝ）上是連續的，且在對應域（(0, +∞)）內找不到「空隙」。按數列的極限定義寫「| exp(xₙ) - exp(x₀) | = exp(x₀) | exp(xₙ - x₀) - 1 |」也可，但下標 ₙ 其實不變。使用函數極限的 ε-δ 定義則可省卻 "ₙ"。

https://media.discordapp.net/attachments/1087424098562494505/1166837125711409253/701077747887243354.png?ex=69086901&is=69071781&hm=b6ed268fdee968835c1c1d10a20957d70028c537a2e33f833339f7a9a5077772&=&format=webp&quality=lossless&width=1140&height=893

https://media.discordapp.net/attachments/1087424098562494505/1166837208339198003/image.png?ex=69086915&is=69071795&hm=71dc7fc2a2acfd0fb33a20691ec89500fd958957ec122b922d5326d08fd668cc&=&format=webp&quality=lossless&width=866&height=893

要證明__指數函數在任意 x₀ ∈ ℝ 連續__，取 h = x - x₀。只需證明當 h → 0 時，𝑒ʰ → 1 即可。使用無窮級數定義後，先把 |h| 抽出 "∑" 符號，接下用些簡單不等式，應等得到理想結果。

介值定理（Intermediate value theorem）真正把「連續」中「沒有空隙」的特性呈現出來。

連續函數 f : [a, b] ⟶ ℝ 滿足 f(a) < f(b)。對於任何 u ∈ f(a) < f(b)，存在一點 c ∈ (a, b)，使得 f(c) = u。（當 f(a) > f(b) 時，取 "-f" 以得出同樣結果。）將此定理應用在指數函數上，即可證明它是滿射函數。（函數 f : 定義域 ⟶ 對應域滿足 "對應域的任一元素 = f(定義域的某一元素)"）既是單射，又是滿射，即是雙射，那麼逆函數便存在。

介值定理圖解（擷自維基百科）

俄羅斯娃娃一個套一個：起始區間為 [a, b]，考慮 f(左端點)、f(中點) 和 f(右端點)。

f(中點) = u 證畢
f(中點) < u < f(右端點)：新左端點 ��← 中點，右端點不變
f(左端點) < u < f(中點)：新右端點 ��← 中點，左端點不變
反覆以上過程，定義域中的子區間長度每次迭代減半……用區間套定理知子區間們的左端點和右端點各組成一個數列，都趨向 (a, b) 中的同一點。運用函數連續性的數列定義，比對左端點和右端點的函數值極限，以及給定的 u，最後用夾臍定理得證。

最後水中一刻：考慮「潛水時間」集合 {x ∈ [a, b] | f(x) ≤ u}。a 屬於此集合，所以它非空。取「最後水中一刻」 c 為「潛水時間」的上確界。運用文字直覺：在「最後上水一刻」，人剛好在水平面（f(c) = u）。

以下兩種情況均使用一連續函數基本性質：局部保號性：（若連續函數 f : (a, b) ⟶ ℝ 的定義域中有一點 c 滿足 f(c) > 0，則存在 δ > 0，使得對於所有 x ∈ (c - δ, c + δ)，f(x) > 0。）
f(c) > u（水平面上）：
- 局部保號性：有一時段 (c - δ, c + δ) 在水平面上
- c = 「最後水中一刻」：c 前的任意短時段 (c - δ′,c] 中，總有一瞬間在水中。
- 此兩者矛盾。
f(c) < u（水平面下）：局部保號性：有一時段 (c - δ, c + δ) 在水平面下，則 c + δ / 2 > c 仍在水中，則 c 不是「最後水中一刻」，矛盾。
前者用上區間套定理，邏輯上較曲折，但證明過程中給出一個算法，可按此估算 c 點數值。我覺得這證明較形象化和接近直覺。
後者主要依賴上確界公理及連續函數的 ε-δ 定義，邏輯上較直接，從定義可以直接證明，不需要用上經典定理，但初學者較難想出。我是在基礎分析的導修課上學得的，在中文維基「介值定理」條目也找得到。

剛剛的介值定理說明，對於任意的正整數 m 及 n，整個閉區間 [𝑒⁻ᵐ, 𝑒ⁿ] 都被包含在指數函數 exp 的值域。由於 𝑒 > 1，所以當 n → +∞，𝑒ⁿ → +∞；當 n → -∞，𝑒ⁿ → 0，對於任意的正實數 b，總能找到適當的正整數 m 及 n，使得 𝑒⁻ᵐ < b < 𝑒ⁿ，所以按介值定理，存在一實數 a ∈ (-m, n)，使得 𝑒ᵃ = b。因此，指數函數 exp : ℝ ⟶ (0, +∞) 是滿射函數。

至此，我們可以把__自然對數函數 ln : (0, +∞) ⟶ ℝ 定義為指數函數的反函數__。要找出定義 aˣ 的方法，可試想將 a 變成 𝑒ʳ||（取r = ln(a)）||，則 aˣ 變成 𝑒ʳˣ。思考整數時的情形，不難想出「對任意實數 x，定義 (𝑒ʳ)ˣ 為 𝑒ʳˣ」。把 a 放回去這句，即是

對於任意正數 a 及任意實數 x，定義 aˣ 為 exp(x ln(a))。 a 和 x 分別稱為底數和指數。

對數公式只要記住（設 a, b > 0，s ∈ ℝ）

定義（邏輯上可以換底公式及自然對數定義來定義對數函數 logₐ : (0, +∞) ⟶ ℝ —— logₐ(b) = ln(b) / ln(a)）
- aˢ = b ⟺ s = logₐ(b)（特別有 logₐ(a) = 1 及 logₐ(1) = 0）
- 常用對數（底數為 10）：log(a) = log₁₀(a)
- 自然對數（底數為 𝑒）：ln(a) = logₑ(a)
還原
- logₐ(aˢ) = s（從內向外開始，先指數，後對數，最後還原）
- aˡᵒᵍₐ⁽ˢ⁾ = s（從內向外開始，先對數，後指數，最後還原）
換底：logₐ(b) = log(b) / log(a)
和 ↔ 積：log(ab) = log(a) + log(b)
指數 ↔ 倍數：log(aˢ) = s log (a) 最常用的是最後兩條公式。用上面自然對數函數的定義能輕鬆推導以上課本中的經典公式，留作練習。

Raw

231111-exp-geom.mkd

初探指數函數曲線的幾何特性

https://media.discordapp.net/attachments/1087424098562494505/1172979684783435786/701077747887243354.png?ex=69085835&is=690706b5&hm=67d1cc1c50cdc35432aa245b4a6d0b54e53856e57cfc74ad516bec6c9b272ffb&=&format=webp&quality=lossless&width=1003&height=893 引入「割線」概念，就是在曲線上取兩個不同的點，連成一（無限延伸的）直線，以證明上面觀察。 https://media.discordapp.net/attachments/1087424098562494505/1172980148103041074/701077747887243354.png?ex=690858a4&is=69070724&hm=1228ca53b8ec72d71cfdf8349b78b005a15faaf59d576770b7290428e319d86c&=&format=webp&quality=lossless&width=1344&height=763 此處用上之前證過的 𝑒ˣ ≥ 1 + x 兩次。留意上圖中的實數 x₀ 及正實數 h₁, h₂ 均為任意選取，且「左割線」和「右割線」兩部分相互獨立。將「左割線」右端點坐標中的 "x₀" 換成 "x₁"，右割線保持 "x₀" 不變，內容仍然真確。由於割線位置任意選取，所以其實我們有

割線斜率 < 割線右上端點函數值
割線斜率 > 割線左下端點函數值綜合以上兩點 https://media.discordapp.net/attachments/1087424098562494505/1172980510541234207/701077747887243354.png?ex=690858fa&is=6907077a&hm=916c942f8550b32a9c850a0f5409fde6e2309ccd5763b992b6f6092b43fcee3b&=&format=webp&quality=lossless&width=1793&height=296 練習：定義「長割線」為左割線左下端點和右割線右上端點連成的直線，「長割線斜率」和「左割線斜率」及「右割線斜率」的關係是甚麼？答案：||「長割線斜率」是「左割線斜率」及「右割線斜率」的的加權平均，權數為左右兩子區限的長度。|| https://media.discordapp.net/attachments/1087424098562494505/1172980990277341284/701077747887243354.png?ex=6908596d&is=690707ed&hm=7bbcbeebb4405e9d168c9065236df0d843d260651ecd5934ca7a30e7e11a0277&=&format=webp&quality=lossless&width=1173&height=864 註：上圖代碼由 ChatGPT 生成 https://sl.bing.net/fCyrnxDAHgO 從肉眼看來，這些正偶數幂函數曲線也有這種「割線斜率上升」的特性，但未必有「割線斜率 < 割線右上端點函數值」（為甚麼？||「割線斜率」不受平移影響，但函數值受平移影響||）。將上面「割線斜率上升」的圖抽象化，改 y = exp(x) 為一個「曲線向下凸出」的函數 f(x)。「抽象」是為了「抽出相像」，過程中會去掉一些事物的特殊特質（例如「正方形、三角形……」�→「多邊形」過程中，「邊長數目」這特質去掉了），最後出來的事物或會「抽離現象」，和我們日常見的事物很不同。這裏我們發現這些「曲線向下凸出」的函數「割線斜率上升」，於是「左割線斜率 < 右割線斜率」。此處「左割線」和「右割線」相交於函數曲線上的一點。將這些文字用符號表達。 https://media.discordapp.net/attachments/1087424098562494505/1172981523151065159/701077747887243354.png?ex=690859ec&is=6907086c&hm=05491b6dc8f5842f6ff6caaab769f893b329998ff412307d25b6c5b861805822&=&format=webp&quality=lossless&width=1310&height=763 https://media.discordapp.net/attachments/1087424098562494505/1172981523474030592/701077747887243354.png?ex=690859ec&is=6907086c&hm=e76ba31dddaef26b35cee11a674b288a80231af188e01894d9d94515622e3445&=&format=webp&quality=lossless&width=1053&height=763

"左斜率" ≤ "右斜率"：[f(b) - f(a)] / (b - a) ≤ [f(c) - f(b)] / (c - b)。 ⟺ [f(b) - f(a)] / [t₁ (c - a)] ≤ [f(c) - f(b)] / [t₂ (c - a)] ⟺ t₂ [f(b) - f(a)] ≤ t₁ [f(c) - f(b)] ⟺ (t₁ + t₂) f(b) ≤ t₂ f(a) + t₁ f(c) ⟺ f(t₂ a + t₁ c) ≤ t₂ f(a) + t₁ f(c) 這條不等式很基本，但有很深刻的意義，需要另開分節討論。

指數函數的凸性

重看指數函數圖像，它向下凸起。甚麼叫「凸」的圖形？先思考甚麼叫「凹」。

https://media.discordapp.net/attachments/1087424098562494505/1174666644249923696/701077747887243354.png?ex=69088c90&is=69073b10&hm=142b9434d0c93aff392250ab7da72a14afc69f5edac538cbc8a12b086d8a96f7&=&format=webp&quality=lossless&width=1234&height=763

代碼來源：https://tex.stackexchange.com/a/639287/126386

留意圖右上方有凹位，在圖形中任取兩點，連成一線段，線段上有點在圖形外。將以上觀察用符號寫出：設 S 為那個有凹位的圖形。

∃ x, y ∈ S : ∃ t ∈ [0, 1] : (1 - t) x + t y ∉ S 「凸」就是「沒有凹」，所以將以上語句取邏輯上的相反，則變成 ∀ x, y ∈ S : ∀ t ∈ [0, 1] : (1 - t) x + t y ∈ S 這就是凸集合 S 的定義。用文字表達凸集合的定義：圖形中任取兩點，連成一線段，整條線段都在圖形內。留意上圖左邊圖形，它底部有直線邊，仍滿足「凸集合」的定義，但它和中間圖形不同：中間圖形任取兩點（點可在邊界上），連成一線段，線段除兩端點外，在不在（白色）邊界上。問題：何為「邊界」？凸和嚴格凸的分別在於：線段除兩端點外，均在集合的內部（interior）。何為一集合 S 的「內部」？任一點 x ∈ S 為圓心，若存在 δₓ > 0 為半徑：

若整個圓為 S 的子集，則 x 為 S 的「內點」(interior point)。內點組成的集合叫「內部」（int(S)）。
若整個圓為 X\S （S 的補集）的子集，則 x 為 S 的「外點」(exterior point)。外點組成的集合叫「外部」（ext(S)）。
否則，x 為 S 的「邊界點」(boundary point)。邊界點組成的集合叫「邊界」（bd(S) 或 ∂S）。圖片擷自維基，x 和 y 分別為 S 的內點和邊界點。

在上圖中，決定 x 是否在 S 的內部，主要靠一堆虛線圓形「橡筋圈」。但是，為甚麼「橡筋圈」一定要是圓形，可否是方形或菱形？答案可在點集拓撲（point-set topology）中找到，我會在本章末拋出引子~~超出本章範疇~~。拓撲這數學分支，綽號「沒有長度的幾何」。

介紹凸集，主要為凸函數定義提供圖像直覺。在此之前，再引入「上圖」（epigraph）的概念。再次從維基中截取圖片，解釋「上圖」：粗黑曲線為 y = f(x)，它和它的上面，即成 epi(f) = { (x, a) ∈ ℝ × ℝ | f(x) ≤ a }。若去掉曲線，則有「嚴格上圖」（strict epigraph） epiₛ(f) = { (x, a) ∈ ℝ × ℝ | f(x) < a }。外文維基條目「上圖」中，函數 f 定義得較抽象，對應域還包含 ±∞，初學者可先忽略這些細節，姑且把定義域及對應域當成 ℝ，不會影響整體理解。

註：下面上圖（epigraph）的圖片擷自MIT 的講義

（嚴格）凸函數的定義可輕易找到，其實就是上分節末粗體的不等式，在此只給出一個和凸函數等價的（形象化）條件。

若且唯若__一函數是凸的，它的上圖是凸的__。將凸函數的定義中的不等式變成嚴格不等式，則凸函數是嚴格凸的。對應的等價條件變成：若且唯若一函數是嚴格凸的，它的上圖中的任意一條線段去掉兩端點後，是該函數的嚴格上圖的子集。若函數 f 滿足 -f 是（嚴格）凸的，則稱 f 是（嚴格）凹的。（定義中的不等式方向倒轉。）

要__學懂一個數學定義，最少要有三個例子和兩個反例子__。看見以下例子，腦中先想像它們的圖像。

留意自然數冪函數 x ↦ xⁿ（n ∈ ℕ）及指數函數 exp，除 n = 0（常數 1）或 n = 1（線性）在 ℝ 上既凸又凹外，其餘的都在 [0, +∞) 上是嚴格凸的。

引理（凸函數逆函數）一個嚴格遞增的（嚴格）凸函數若有逆函數，則此逆函數是（嚴格）凹的；一個嚴格遞減的（嚴格）凸函數若有逆函數，則此逆函數是（嚴格）凸的。證明留作練習，答案在連結中。由此可知正 n 次方根函數 x ↦ ⁿ√x （n ∈ ℕ）及對數函數 ln 在它們的定義域上均為（嚴格）凹函數（除 n = 1 外）。

（為省卻教學時間，）一般高中課程在沒有推導過以下關於凸函數的割線斜率「單調遞增」的情況下，直接拋出「線性近似的斜率」（即導數）單調遞增的結果，然後就有著名的兩階導數測試（Second derivative test）找拐點（point of inflexion）。對教育者和大學的理工科系來說，這能訓練和評核學生運用「微分」解難的能力，方便他們篩選出能讀書的學生，和未來的技術人才。

可是，這（些邏輯正確的方法）會讓學生產生錯覺，認為函數的凸凹性依賴於微分。用導數決定函數的凸凹性的確很方便，但前提是函數要可導（「在定義域的每一點上都有『切線』」）。比知絕對值函數 x ↦ |x| 在原點 (0, 0) 沒有「切線」。只要函數牽涉到絕對值，用導數就不好使。

問題：上面有關凸函數的「割線斜率上升」的圖有甚麼問題？答案：||該圖右邊應為「左割線斜率 ≤ 右割線斜率」——這不等式不一定是嚴格的。（思考絕對值函數 f(x) = |x| 的圖像。）||

上圖「割線斜率上升」其實和凸函數定義等價，已在上分節末推導。

為了減少計算，我會使用一系列引理，證明留作練習。這個抽象化的過程，令當中的內容可重用。先處理自然數冪函數 x ↦ xⁿ 在 [0, +∞) 上的凸性，再利用奇偶函數的特性，拓展至定義域為 ℝ 的函數：

引理（非負單調凸函數積）：設 f, g 為（定義在一個任意區間上的）非負單調遞增（或遞減）的（嚴格）凸函數，則它們的積 f ⋅ g 也是（嚴格）凸函數。證明：設……。 → ||f((1 - t)x + ty) g((1 - t)x + ty) ≤ [(1 - t) f(x) + tf(y)] [(1 - t) g(x) + tg(y)]|| → ||= (1 - t)² f(x) g(x) + t(1 - t) [f(x) g(y) + f(y) g(x)] + t² f(y) g(y) || → ||≤ (1 - t)² f(x) g(x) + t(1 - t) [f(x) g(x) + f(y) g(y)] + t² f(y) g(y) ||（排列不等式特例：a ≤ b 及 c ≤ d ⟹ ad + bc ≤ ac + bd） → ||= (1 - t) f(x) g(x) + tf(y) g(y) ||
從凸函數定義直接證明 n = 2 時函數嚴格凸。證明：套用下面引理證明（f(x) = g(x) = x, 定義域 [0, +∞)）。留意使用排列不等式時，因 x < y，有 2xy < x² + y²。
運用數學歸納法||（f(x) = xᵏ, g(x) = x）||，當冪 n > 1，自然數冪函數 x ↦ xⁿ 在 [0, +∞) 上嚴格凸。思考：此步運用上面引理結果時，有甚麼問題？答案：||g(x) = x 非嚴格凸函數，但我們卻在結論中說它是嚴格凸的——引理中要求 f 和 g 同為嚴格凸，所以要從引理證明中的不等式得知。|| 思考：為何 f, g 需要是非負函數？答案：||在證明的第一步中，若 f 和 g 出負數值，則不保證不等式成立。反例 f(x) = x² - 1, g(x) = x - 2 的 Desmos 圖像||

若冪 n 為負整數，仍有__負整數冪函數嚴格凸__。原因為以下四點：

冪 n = 1 時，函數變成線性，則既凸又凹。
引理（正凹函數倒數）：（定義在一個任意區間上的）正（嚴格）凹函數 f 的倒數 1 / f : x ↦ 1 / f(x) 是（嚴格）凸函數。由此可知倒數函數 x ↦ 1 / x 在 [0, +∞) 上是嚴格凸函數。思考：為甚麼線性函數不嚴格凹，但倒數函數卻嚴格凸？答案：||在下面證明中，先假設 x < y，從最後一行易知有嚴格不等式。||
負整數冪函數在 [0, +∞) 上嚴格遞減。
「非負單調凸函數積」引理反覆套用在倒數函數。

https://media.discordapp.net/attachments/1087424098562494505/1174670603437998120/701077747887243354.png?ex=69089040&is=69073ec0&hm=ddd5d4ea0518ed112ebe34b4c973768cbb6ddc8beaab5bbc4b87aa591402eade&=&format=webp&quality=lossless&width=1435&height=763

接下來，我們把整數冪函數的定義域拓展至 ℝ。當冪 n 是偶數時，偶數冪函數圖像沿 y-軸反射對稱，使我們想出以下引理。

__引理（遞增凸函數鏡像）設 f 是定義在 [0, +∞) 上的單調遞增（嚴格）凸函數，則定義在 ℝ 上的複合函數 x ↦ f(|x|) 是（嚴格）凸函數。在推導前想一想，還有沒有更一般的原因。此處有__複合函數，那麼甚麼樣的（嚴格）凸/凹函數 f 和 g 能令複合函數 f ∘ g （嚴格）凸？

g 凸：||g((1 - t)x + ty) ≤ (1 - t) g(x) + tg(y)||

f 單調遞增：||f( g((1 - t)x + ty) ) ≤ f( (1 - t) g(x) + tg(y) )||

f 凸：||f( (1 - t) g(x) + tg(y) ) ≤ (1 - t) f(g(x)) + tf(g(y))|| 若將上面條件改為 g 凹且 f 單調遞減和凸，其實同樣有 f ∘ g 凸。

⚠️ 以上關於複合函數的討論出現甚麼問題？ 🤔 ||「反例」：設 f(x) = x², g(x) = x² - 1 = (x + 1) (x - 1)，則 f 和 g 在 [0, +∞) 上均為嚴格遞增嚴格凸函數，但f ∘ g(x) = (x + 1)² (x - 1)² 沿 y-軸反射對稱，x-截距為 ±1，所以 (±1, 0) 和 (0, 1) 是 f ∘ g 的臨界點（critical point），易知 f ∘ g 有一拐點在開區間 (0, 1) 中，即 f ∘ g 在 [0, +∞) 上非凸。|| 💡 ||漏掉條件「g 的對應域為 f 的定義域的子集」。||

由函數的奇偶性及以上「凸函數複合函數」引理，可知定義在 ℝ 上的自然數冪函數 x ↦ xⁿ：

n = 0 或 1：既凸又凹（此處 n = 0 當常數函數 x ↦ 1）
n 為非零偶數：在 ℝ 上嚴格凸
n 為非一奇數：在 [0, +∞) 上嚴格凸；在 (-∞, 0] 上嚴格凹

上面已證明 exp 嚴格凸，按引理「凸函數逆函數」，ln 在 (0, +∞) 上嚴格凹。

問題：（定義在 (0, +∞) 上的）實數幂函數 x ↦ xʳ 何時為凸？何時為凹？

當 r 為整數或整數的倒數時，問題已解決。
當 r 為負實數時，將 xʳ 寫成 exp(r ln(x) )，則 x ↦ r ln(x) 為嚴格凸函數，而外層的 exp 嚴格凸且嚴格遞增，所以按「凸函數複合函數」引理，x ↦ xʳ 為嚴格凸函數。

r > 1 的解答需要用上赫爾德不等式，所以下分節我們將證明這些經典基礎不等式。

Raw

231120-ineq.mkd

用凸函數證明一些基礎不等式

本分節以「基礎方法」（變量代換和基礎不等式）證明一些著名的不等式，如

簡森不等式（Jensen's inequality）
加權算術-幾何平均值不等式（weighted AM-GM inequality）
楊氏不等式（Young's inequality）
赫爾德不等式（Hölder's inequality）
閔可夫斯基不等式（Minkowski inequality）
加權冪平均不等式（weighted power mean inequality）它們在數學競賽的範疇內，也算是在大學的課程內，但在大學很少機會用得上。即使在大學課程中用得上，也會是在個更加抽象的情境，也不要求像解數學競賽題般，用上高超的技巧。

凸函數上圖 ⟹ 強森不等式 凸函數定義中只有定義域中的兩個點 x₁ 和 x₂，若出現幾個點怎麼辦？這就是經典的強森不等式（Jensen's inequality）的內容。

若 f 為凸函數，……，w₁, …, wₙ ≥ 0, w₁ + ⋯ + wₙ = 1，則 f(w₁ x₁ + ⋯ + wₙ xₙ) ≤ w₁ f(x₁) + ⋯ + wₙ f(xₙ)。若且唯若 f 為線性函數 + 常數；或 x₁ = ⋯ = xₙ，等式成立。

一般書上證明都是用數學歸納法。又是那一句，邏輯正確，但忽略了重要的數學內容。今次忽略的，就是凸函數的幾何特性。透過「上圖（epigraph）」的概念，將問題圖像化，問題就很簡單：一些凸集內的點 x₁, …, xₙ 的加權平均 w₁ x₁ + ⋯ + wₙ xₙ（0 ≤ w₁, …, wₙ ≤ 1 是權數，且有 w₁ + ⋯ + wₙ = 1）在這些點連成的凸多邊形內：這個加權平均 w₁ x₁ + ⋯ + wₙ xₙ 可以用這些點 x₁, …, xₙ 表示，我們叫這個加權平均為點 x₁, …, xₙ 的凸組合。凸集合的定義用凸組合重寫一次，就是「集合內任意兩點組成的所有凸組合都在集合內」。但事實上，這對集合內任意 n 點都對，比如正方形是個凸圖形，上面任取三個不共線的點（n = 3），連成一面積非零的三角形，則該三角形仍在該正方形內。此觀察很直覺和形象化，算式上的證明是個數學歸納法的練習。

用文字表達強森不等式：若 f 為定義一區間上的凸函數，加權平均的函數值||（f(x₁, …, xₙ 的加權平均）||≤ 函數值||f(x₁), …, f(xₙ)||的加權平均）。 https://math.stackexchange.com/q/747180/290189 先思考 n = 2 （只有兩點）時，函數圖像中發生了甚麼事：||點 (t x₁ + (1 - t) x₂, t f(x₁) + (1 - t) f(x₂) ) 在曲線 y = f(x) 上，所以它在 epi f 內。||嘗試將這個觀察擴展至任意自然數 n。運用凸函數的等價條件「凸函數 ⟺ 上圖凸」，思考 (x₁, f(x₁)), …, (xₙ, f(xₙ)) 的凸組合：||這些點都是 epi f 的點，epi f 是凸的，所以這些點的凸組合 (w₁ x₁ + ⋯ + wₙ xₙ, w₁ f(x₁) + ⋯ + wₙ f(xₙ)) 在 epi f 內，運用 epi f 的定義得證。|| 其實幾何方法沒有減少步驟，只是將數學歸納法中最關鍵的一步，搬去凸集罷了。但凸集是個有幾何意義的東西，不單較易視像化，將來學習理工科目也有大用。

https://media.discordapp.net/attachments/1087424098562494505/1176116778791874670/701077747887243354.png?ex=69088d1b&is=69073b9b&hm=634169d696606d9e0c565d47dbd5945f9343375f9b3c84c7e7904dc800403a84&=&format=webp&quality=lossless&width=1328&height=763

強森不等式 ⟹ 加權算術-幾何平均值不等式 上面Ｍath.SE 連結中的問題後半（加權算術-幾何平均值不等式（weighted AM-GM inequality）的證明），即是強森不等式應用在自然對數 ln 的結果。因為自然對數 ln 是嚴格凹函數（為甚麼？||自然對數 ln 被定義為指數函數 exp 的逆函數，而指數函數 exp 是在 ℝ 上嚴格凸且嚴格遞增的，所以按引理「凸函數逆函數」得證。||），所以強森不等式的方向反轉。 加權算術-幾何平均值不等式 ⟹ 楊氏不等式 留意楊氏不等式中的積 ab 中 a 和 b 次數各為一，但加權算術-幾何平均值不等式左邊的幾何平均中有 x₁ʷ₁，所以取 x₁ = a¹ᐟʷ₁，讓兩（實數）次方（w₁ 和 1 / w₁）互相抵消。取 n = 2, w₁ = 1 / p, w₂ = 1 / q, x₁ = aᵖ, x₂ = b𐞥，有 w₁ + w₂ = 1，且 x₁ʷ₁ x₂ʷ₂ = ab ≤ a / p + b / q = w₁ x₁ + w₂ x₂。

楊氏不等式 ⟹ 赫爾德不等式 證明計算上不難，只是「齊次 ⟹ 設目標不等式右邊兩個 '∑' 各為 1」較不明顯，需要經驗。其餘的就是將楊氏不等式中的 "a" 和 "b" 分別加上下標 "ₖ"，然後求和 ∑ₖ。最後運用之前假設，得 1 / p + 1 / q = 1。註：柯西-施瓦茨不等式（Cauchy–Schwarz inequality）是赫爾德不等式中 p = q = 2 的特殊情形。 赫爾德不等式 ⟹ 閔可夫斯基不等式 先寫出閔可夫斯基不等式。赫爾德不等式左邊沒有 1 / p 次方，右邊有 1 / q 次方，所以先兩邊乘以 (...) 的 1 / q 次方。

https://media.discordapp.net/attachments/1087424098562494505/1176117224864489565/701077747887243354.png?ex=69088d85&is=69073c05&hm=b1c9c323e98b65ccce2d31037d49cea4476c648a72650394f449445222fcf1ca&=&format=webp&quality=lossless&width=898&height=893

留意 |xᵢ + yᵢ|ᵖ = |xᵢ + yᵢ|ᵖ⁻¹ |xᵢ + yᵢ| ≤ |xᵢ + yᵢ|ᵖ⁻¹ (|xᵢ| + |yᵢ|)，所以不等式 (1) 及 (2) 相加後，最終得出上面第二條不等式。

強森不等式 ⟹ 加權冪平均不等式 若將「強森不等式 ⟹ 加權算術-幾何平均值不等式」推導中的 |aᵢ| 換成 |aᵢ|ˢ，當中 s 為固定的非零實數，則有

ln(∑ᵢ wᵢ |aᵢ|ˢ) ≥ ∑ᵢ wᵢ ln(|aᵢ|ˢ) = s ln(∏ᵢ |aᵢ|ʷᵢ) ⟺ ln(∑ᵢ wᵢ |aᵢ|ˢ) / s ≥ ln(∏ᵢ |aᵢ|ʷᵢ)（若 s > 0）；或 ln(∑ᵢ wᵢ |aᵢ|ˢ) / s ≤ ln(∏ᵢ |aᵢ|ʷᵢ)（若 s < 0） ⟺ ln[(∑ᵢ wᵢ |aᵢ|ˢ)¹ᐟˢ] ≥ ln(∏ᵢ |aᵢ|ʷᵢ)（若 s > 0）；或…… ⟺ (∑ᵢ wᵢ |aᵢ|ˢ)¹ᐟˢ ≥ ∏ᵢ |aᵢ|ʷᵢ（若 s > 0）；或…… 因此，對於所有 s > 0 > t，有 (∑ᵢ wᵢ |aᵢ|ˢ)¹ᐟˢ ≥ ∏ᵢ |aᵢ|ʷᵢ ≥ (∑ᵢ wᵢ |aᵢ|ᵗ)¹ᐟᵗ。 ||由於 ln 嚴格凹，||等式成立若且唯若 |a₁| = ⋯ = |aₙ|。

思考 0 < s < t 時，|a₁|, …, |aₙ| 的 s-冪平均及 t-冪平均。

(∑ᵢ wᵢ |aᵢ|ˢ)¹ᐟˢ ? (∑ᵢ wᵢ |aᵢ|ᵗ)¹ᐟᵗ ⟺ (∑ᵢ wᵢ |aᵢ|ˢ) ? (∑ᵢ wᵢ |aᵢ|ᵗ)ˢᐟᵗ（從這一行可看出要選凹~~／凸~~函數 f(x) = xˢᐟᵗ，xᵢ = |aᵢ|ᵗ） ⟺ [∑ᵢ wᵢ (|aᵢ|ᵗ)ˢᐟᵗ] ? (∑ᵢ wᵢ |aᵢ|ᵗ)ˢᐟᵗ 取 s / t = 1 / 2 < 1，可猜出 f 是凹函數，所以不等式方向應為「≤」。由此，引導出以下問題：因為引理「凸函數逆函數」，只需證明當 p > 1 時，實數冪函數 f(x) = xᵖ 在 [0, +∞) 上嚴格凸。此處再次借用 Math.SE 的答案。設 0 < x₁ < x₂，…… (w₁ x₁ + w₂ x₂)ᵖ < w₁ x₁ᵖ + w₂ x₂ᵖ ⟺ w₁ x₁ + w₂ x₂ < (w₁ x₁ᵖ + w₂ x₂ᵖ)¹ᐟᵖ（右上的 1 / p 讓我們想起赫爾德不等式） ⟸ w₁ x₁ + w₂ x₂ < (w₁ x₁ᵖ + w₂ x₂ᵖ)¹ᐟᵖ (?)¹ᐟ𐞥（取 q > 1 使得 1 / p + 1 / q = 1）於是取 uᵢ = wᵢ¹ᐟᵖ xᵢ，從 uᵢ vᵢ = wᵢ xᵢ 易知 vᵢ = wᵢ¹ᐟ𐞥。 ⟸ w₁ x₁ + w₂ x₂ < (w₁ x₁ᵖ + w₂ x₂ᵖ)¹ᐟᵖ (w₁ + w₂)¹ᐟ𐞥 由於 w₁ + w₂ = 1，所以證畢。

當 s < t < 0 時，有類似結果，留作練習。

練習：固定實數 a₁, …, aₙ，當 (i) s → +∞ (ii) s → -∞ 時，|a₁|, …, |aₙ| 的 s-冪平均趨向甚麼？給定的條件有甚麼不足之處？可以如何修正？提示：||引入 max{|a₁|, …, |aₙ|}，為s-冪平均的分子設上下限。|| 由上面的練習可知，所謂 s-冪平均，就是閉區間 [min{|a₁|, …, |aₙ|}, max{|a₁|, …, |aₙ|}] 中的一個值。反過來問，是否這個閉區間中的每一個值，都能寫成一個 s-冪平均？要回答這條問題，把 s-冪平均看成一個自變量為 s 的函數。留意除 s = 0 外，這函數在 ℝ \ {0} 上連續。於是，我們很自然會問，當 s → 0 時，這函數的極限是甚麼？

https://media.discordapp.net/attachments/1087424098562494505/1176118027088044112/701077747887243354.png?ex=69088e44&is=69073cc4&hm=646a2520a8d86cab42c403b3f748a35b6f2c6813ec30c59623ee85805e195901&=&format=webp&quality=lossless&width=1018&height=893

⚠️ 以上箭咀純為展示用途，減少重覆的 "lim"，在正式的寫作中（例如交給老師的答案）不要這麼寫。於是我們可以定義「0-冪平均」為「幾何平均」，使得上面的不等式變成

對於所有 s > t 及實數 a₁, …, aₙ，有 |a₁|, …, |aₙ| 的 s-冪平均 ≥ |a₁|, …, |aₙ| 的 t-冪平均。等式成立若且唯若 |a₁| = ⋯ = |aₙ|。

練習

將伯努利不等式 (1 + x)ʳ ≥/≤ 1 + rx 推廣至實數冪。||分開 r < 1 及 r > 1 兩情形。使用加權算術-幾何平均值不等式：右邊加權算術平均等於 1，左邊砌加權幾何平均時，權數為次方。||
試將本章開首的「本利和數列」的定義域從 ℕ 推廣至 ℝ 的最大可能子集，並證明此函數在此子集中的每個子區間都嚴格遞增。||分開 0 < x < y 及 -y < -x < 0 兩情形。使用加權算術-幾何平均值不等式：右邊加權算術平均等於 1，左邊砌加權幾何平均時，權數為次方。||

應用：了解 |x|ˢ + |y|ˢ = 1 在 ℝ² 上的圖像的幾何特性。小米的新標誌，就是 s = 3 的情形。 https://youtu.be/c5m3nDVSCxc?si=h9R06dM45U9P9Mbc&t=73

用凸圖形定義易證：

若且唯若 0 < s < 1，圖形嚴格凹。
若 s = 1，圖形凸。
若且唯若 s > 1，圖形嚴格凸。用微分證也可行，很複雜很多。
若 s → +∞，圖形接近方形，證明技巧和加權冪平均不等式的證明中 s → +∞ 部分一樣。
若 s → 0，圖形接近十字架。可定義 B₀ = ∩ {Bₛ | s > 0}, Bₛ := {(x, y) ∈ ℝ² | |x|ˢ + |y|ˢ ≤ 1}。B₀ 其實等於十字架 {(x, y) ∈ ℝ² | |xy| = 0}。||(|x|ˢ + |y|ˢ)¹ᐟˢ ≥ 2¹ᐟˢ min(|x|, |y|), s → 0, 右邊 → +∞，除非 |xy| = 0。||
若 s < 0，圖形似「井」字去掉中間的「口」，有點像倒數函數圖像。||倒數：越近 0，倒數後越遠。||
若 s → -∞，圖形趨近「井」字去掉中間的「口」。

觀察：一菱形 (s = 1) 被包在圓形內 (s = 2)。練習：運用冪平均不等式，可準確算出圓形要收縮多少，才可以被包在菱形內。

由上面的圖易見，其實用圓形（s = 2）、星形（0 < s < 1）還是方形（s = +∞ / 1）討論數列／函數的收歛現象，其實都一樣。以上只展示了平面（ℝ²）上的情形，其實對於所有自然數 n，在 ℝⁿ 上也有同樣結果。鄰域的形狀不重要，於是人們開始想把鄰域集合用「𝒯」代替，稱為「拓樸」，以想出更一般的法則。這就是拓樸學導論的引子。

　生人何幾

　星　　點　圓　　線　相　　漸　套　　消　趣　　常　無　　自　窮　　結