Skip to content

Instantly share code, notes, and snippets.

View SimonAKing's full-sized avatar
🍅
PRESS START

SimonAKing SimonAKing

🍅
PRESS START
View GitHub Profile
@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
Memory 的几种类型 - 05/25/2025

最近刷到了一张 agent 记忆的分类图,简单概括下: 短期记忆:记住刚刚说过的话 比如你问"我女儿多大了",它记得你刚说过是5岁,就能接着聊"哦,那该上幼儿园了"

长期记忆:存储重要信息、用户偏好 比如记住你喜欢喝美式不加糖,下次点咖啡就自动记得你的口味啦

情节记忆:记住具体发生的事情 比如知道上周你加班很累,这周就会贴心地问问你休息得怎么样

@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
多模态研究(张祥雨)播客分享 - 06/09/2025

分享一期 最近被疯狂推荐的播客 - 102。 和张祥雨聊,多模态研究的挣扎史和未来两年的 2 个“GPT-4 时刻”文字版)。 该播客是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈,其中张祥雨阐述了他近些年对 LLMs、MultiModal 领域的一些思考,我和 claude 总结了下收获比较大的点,欢迎讨论:

  1. 自监督学习 在 NLP 与 CV 领域的差异 NLP 领域中 自监督训练 配合 decoder-only 架构取得了惊人成功。相比之下,CV 领域试图复制这种成功的尝试却遇到了瓶颈。无论是对比学习还是掩码图像建模(MIM),都没能展现出类似的 scaling 效果。这背后可能的深层原因:
  • 信息密度差异:语言 token 天然具有高信息密度,每个 token 都承载了丰富的语义信息;图像 patch 的信息往往是冗余的,相邻像素高度相关,这导致看似相同的"token prediction"任务,在两个领域的难度和意义完全不同
  • 人类认知对齐:语言数据天然包含了人类的理解和意图,是人类智慧的结晶,预测下一个 token 实际上是在学习人类的思维模式,而图像是自然界的产物,CV 领域的自监督方法(如对比学习)本质上还是在人工设计视觉上的"不变性"特征,而不是完全数据驱动的,显然像素分布建模≠人类视觉认知(重点在多模态的编码方式,类似于 Yann LeCun 提出的"World Model"理念)
  1. Next Token Prediction 的天然局限 分布拟合的局限:如果预训练数据中同时存在直接给答案和步骤推理(CoT)的样本,模型会倾向于拟合这种分布而不是真正理解如何解决问题
@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
Andrej - AI 时代下的软件演进趋势分享 - 06/24/2025

分享下最近 Andrej 在 YC 上的一次分享,主题是 AI 时代下软件演进的趋势,其中有一些深刻的洞察: 该分享原内容:视频PPT中文版

  1. 软件演进的三个时代:从传统的代码编程到 训练神经网络 再到自然语言编程,突然间 每个人都是程序员。

    对应了现在 vibe coding 兴起,ai coding 产品风靡(该概念也是 Andrej 提出)

  2. LLMs 是新一代的操作系统:如同早期计算机,计算资源昂贵且集中在云端,不同的是 LLMs 优先在消费者端大规模爆发而非 政府与企业。

    类比:新的交互方式 - CUI 类似于早期的 GUI;同样的多模态输入;PC 之间的连接(如 A2A);新的 RAM(context window);Disk(embeddings);Softwares(CodeInterpreter、Terminal、Browser)

  3. 如何更好的使用 LLMs:不要完全指望 LLM 自主完成端到端的任务,而是让它们做"增强工具"。成功的 LLMs 产品(如 Cursor、Perplexity)都有个共同点:人机协同(LLMs 负责生成内容;人类负责检查验证),产品设计让协同过程显得直观。

@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
行业观察:模型即产品趋势 - 06/26/2025

分享下最近的一个行业观察:

  1. 国内 ai 模型厂商 minmax、kimi 最近有一些新动态:
  2. minmax 推出了 通用 agent 产品 https://agent.minimax.io/share/281535490056355
  3. kimi 推出了 researcher 模型与产品 https://www.163.com/dy/article/K30342N605566Y1D.html
  4. 国外 claude 今天则进一步 artifacts 部署、发布等端到端流程 内置
  5. (非最近)openai 模型、gemini 在 tool 生态上推出了常见的一方 tool:如 google search、code Interpreter、computer use agent 等
  6. 在产品层 research 形态的产品、代码生成的产品(codex、gemini-cli)也都有超高 star 的一方应用

整体趋势上的趋势,国内外模型厂商都有往应用层 发力的趋势,甚至最近还有一篇“爆文” ChatGPT将来要做的,大家就绕开吧,进一步探讨下:

  1. 模型厂商的发力应用层好处有哪些?
@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
AI 时代的分发策略:速度即护城河 - 06/30/2025

分享下 a16z 的近期一篇文章,对产品早期增长很有启发:In Consumer AI, Momentum Is the Moat

标题:AI 时代的分发策略:速度即护城河,对应的中文版

文章的主旨是:LLMs 同质化趋势下,AI 产品 的护城河不再是技术壁垒 为主(技术的差异越来越小),而是增长的速度与产品认知差。

一些关键洞察:

  1. 产品前期的时间窗口 非常非常非常重要 文中的暴论:如果在 前 48 小时内,产品没有形成社交扩散,那么一开始就被判了“死刑”,关键不是"能不能做出来" ,而是“能不能迅速推广市场” 用 Lovable 举例,2 个月内达成 1000 万美元 mrr
  2. 新的增长策略
@SimonAKing
SimonAKing / content.md
Last active July 8, 2025 06:15
Context engineering 解读 - 07/08/2025

分享一个最近比较火的概念 “context engineering”(由 Andrej Karpathy 提出),一句话解释:在模型推理时 提供出 任务所需的所有完整信息的工程。

以下内容参考自 Awesome-Context-Engineering

为什么近期 context engineering 被广泛讨论?原因是 prompt engineering 不足以代表了现在生产级 LLMs 应用的复杂度。 首先 LLMs 的概率函数是: Image

prompt engineering 约等于将 prompt 视为了 context,而 LLMs 应用中 context 等于以下多个组件的组合: context = Assemble(instructions, knowledge, tools, memory, state, query)

  • |context| ≤ MaxTokens(context window limitation)
@SimonAKing
SimonAKing / isElementInViewport.js
Created November 7, 2020 07:22
isElementInViewport
function isElementInViewport(el) {
http://stackoverflow.com/questions/325933/determine-whether-two-date-ranges-overlap
{ /* The source of the following code. */ }
const rect = el.getBoundingClientRect()
const windowHeight = (window.innerHeight || document.documentElement.clientHeight)
const windowWidth = (window.innerWidth || document.documentElement.clientWidth)
const vertInView = (rect.top <= windowHeight) && ((rect.top + rect.height) >= 0)
const horInView = (rect.left <= windowWidth) && ((rect.left + rect.width) >= 0)
@SimonAKing
SimonAKing / QuickSort.js
Created October 10, 2020 05:12
QuickSort.js
const quickSort = a => {
if (!a.length) { return [] }
return [
...quickSort(a.filter(e => e < a[0])),
...a.filter(e => e === a[0]),
...quickSort(a.filter(e => e > a[0]))]
}
@SimonAKing
SimonAKing / permutate.js
Created September 25, 2020 13:36
permutation
const permutate = (n, choices = ['A', 'B', 'C', 'D']) => {
const result = []
const recursion = path => {
if (path.length === n) {
result.push(path.join(''))
return
}
choices.forEach(c => { recursion([...path, c]) })
}
@SimonAKing
SimonAKing / main.js
Created September 25, 2020 10:30
leastWorkTime
const patchTasksByTimeout = (task, tasks, timeout) => {
return tasks.reduce((a, t) => {
if (t.value === task.value) {
t.timeout = timeout
} else {
t.timeout = Math.max(0, t.timeout - 1)
}
return [...a, t]
}, [])
}