Last active
August 4, 2024 06:22
-
-
Save coodoo/fd50b7e2352db877656d9a096ed44303 to your computer and use it in GitHub Desktop.
LLM 30秒入門簡介
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# LLM 最基本元素就兩個:generation 與 prompt | |
# generation | |
就像平常在 chatgpt 上提問後它會生出答案並可一來一往多輪對話,這個過程就是 LLM generation。換成 LLM 開發時則改成用程式呼叫某家服務商提供的 LLM API 做上面一樣的事,例如最常見的是 OpenAI 的 gpt-4 或 google 的 gemini。 | |
# prompt | |
就像在 chatgpt 上提問一般,用戶下指令告訴 LLM 要執行的任務,例如摘要一篇文章。這裏 tricky 的地方在於不同的任務需要不同的 prompt 才能順利完成,而 prompt 技巧千變萬化通常要不斷試誤才能找出最有效的。 | |
簡單講只要將不同公司的 LLM 想成不同品牌的 SQL server 就行,例如 MySql 與 PostgreSQL 功能其實大同小異,執行的語法也都是 SQL 只是稍有不同,換成在 LLM 的世界裏就是彼此用的 prompt 其實差不多,只是每家可能各有些專屬文法要注意即可。 | |
# 有了 generation 跟 prompt 兩個基本概念,剩下就可以直接看各大廠商的文件提供的範例囉,下面是兩家我覺得最好的: | |
1. 先看 OpenAI 的比較平易近人 | |
https://platform.openai.com/docs/guides/prompt-engineering | |
2. 再看 Claude 的算是進階版百科全書,尤其它有個 prompt library 可查各種用例 | |
https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview | |
# ollama | |
最後就是推薦可安裝 ollama 能在本機上跑 LLM,它的運作方式是啟動本地 server 提供 API 服務以取代上面提到的商業品牌例如 OpenAI/Google Gemini/Claude 等。 | |
本機跑 LLM 的好處有:資料不外流、可嚐試多種不同 LLM 體驗它們不同的個性與能力,但主要優點仍是免費因此可大膽大方的瘋狂嚐試各種想法,很快就能摸熟門路囉~ |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment