Skip to content

Instantly share code, notes, and snippets.

@niquola
Created January 24, 2026 06:43
Show Gist options
  • Select an option

  • Save niquola/222a17000fe5ae79ab1408d45a35126a to your computer and use it in GitHub Desktop.

Select an option

Save niquola/222a17000fe5ae79ab1408d45a35126a to your computer and use it in GitHub Desktop.
Agent Engineering Papers Research

Agent Engineering Papers

AgentSM: Semantic Memory for Agentic Text-to-SQL

arXiv: https://arxiv.org/abs/2601.15709 Авторы: Asim Biswal, Chuan Lei, Xiao Qin, Aodong Li, Balakrishnan Narayanaswamy, Tim Kraska

Идея: Вместо сырых логов агент сохраняет execution traces как структурированные программы. При новом запросе ищет семантически похожие задачи и переиспользует их логику решения.

Результаты: −25% токенов, −35% шагов, SOTA на Spider 2.0 (44.8%)

Ключевое: "Мышечная память" для агентов — не решай с нуля, опирайся на проверенные паттерны.


Agentic Confidence Calibration (HTC)

arXiv: https://arxiv.org/abs/2601.15778 Авторы: Jiaxin Zhang, Caiming Xiong, Chien-Sheng Wu

Идея: AI-агенты слишком самоуверенны когда ошибаются. HTC (Holistic Trajectory Calibration) анализирует всю траекторию агента, а не отдельные ответы:

  • Macro dynamics — паттерны уверенности по всей траектории
  • Micro stability — консистентность на уровне шагов

Результаты: Работает на 8 бенчмарках, переносится на новые домены без переобучения (GAC).

Ключевое: Смотри на всю историю работы агента — это даёт честную оценку его уверенности.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment