Skip to content

Instantly share code, notes, and snippets.

@coodoo
Last active August 4, 2024 06:22
Show Gist options
  • Save coodoo/fd50b7e2352db877656d9a096ed44303 to your computer and use it in GitHub Desktop.
Save coodoo/fd50b7e2352db877656d9a096ed44303 to your computer and use it in GitHub Desktop.
LLM 30秒入門簡介
# LLM 最基本元素就兩個:generation 與 prompt
# generation
就像平常在 chatgpt 上提問後它會生出答案並可一來一往多輪對話,這個過程就是 LLM generation。換成 LLM 開發時則改成用程式呼叫某家服務商提供的 LLM API 做上面一樣的事,例如最常見的是 OpenAI 的 gpt-4 或 google 的 gemini。
# prompt
就像在 chatgpt 上提問一般,用戶下指令告訴 LLM 要執行的任務,例如摘要一篇文章。這裏 tricky 的地方在於不同的任務需要不同的 prompt 才能順利完成,而 prompt 技巧千變萬化通常要不斷試誤才能找出最有效的。
簡單講只要將不同公司的 LLM 想成不同品牌的 SQL server 就行,例如 MySql 與 PostgreSQL 功能其實大同小異,執行的語法也都是 SQL 只是稍有不同,換成在 LLM 的世界裏就是彼此用的 prompt 其實差不多,只是每家可能各有些專屬文法要注意即可。
# 有了 generation 跟 prompt 兩個基本概念,剩下就可以直接看各大廠商的文件提供的範例囉,下面是兩家我覺得最好的:
1. 先看 OpenAI 的比較平易近人
https://platform.openai.com/docs/guides/prompt-engineering
2. 再看 Claude 的算是進階版百科全書,尤其它有個 prompt library 可查各種用例
https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
# ollama
最後就是推薦可安裝 ollama 能在本機上跑 LLM,它的運作方式是啟動本地 server 提供 API 服務以取代上面提到的商業品牌例如 OpenAI/Google Gemini/Claude 等。
本機跑 LLM 的好處有:資料不外流、可嚐試多種不同 LLM 體驗它們不同的個性與能力,但主要優點仍是免費因此可大膽大方的瘋狂嚐試各種想法,很快就能摸熟門路囉~
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment