~/snippets

知识库

探索过程中积累的笔记、参考资料和见解。

LLM & RAG

检索增强生成、向量数据库、基于事实的AI系统

RAG 基础

检索增强生成(RAG)将文档检索与LLM生成相结合,提供有据可依的回答。

RAG
LLM
Vector DB
LangChain RAG Docs

向量嵌入与相似性搜索

文本嵌入的工作原理、嵌入模型选择以及相似度指标(余弦、点积、L2)。

Embeddings
ChromaDB
FAISS

文档分块策略

固定大小、句子级、语义和递归分块。上下文保留与检索精度之间的权衡。

Chunking
Preprocessing
RAG

模型微调

参数高效训练、LoRA、数据集准备

LoRA & QLoRA

基于Low-Rank Adaptation的参数高效微调。QLoRA通过4位量子化提升内存效率。

LoRA
QLoRA
PEFT

训练数据准备

数据清洗、指令格式(Alpaca、ShareGPT)及质量过滤技术。

Dataset
Preprocessing

实用LLM技巧

提示工程、工具调用、Agent模式

提示工程模式

思维链、少样本、系统提示词和结构化输出技术。

Prompting
CoT
Few-shot

Function Calling 与工具调用

通过Function Calling(OpenAI、Anthropic)和Agent框架将LLM与外部工具集成。

Tools
Agents
Function Calling

开发笔记

框架模式、语言技巧、工程笔记

Next.js App Router 模式

服务端组件、流式渲染、并行路由以及使用next-intl的国际化。

Next.js
React
SSR

Rust 所有权与生命周期

所有权、借用、生命周期的心智模型和常见模式。

Rust
Memory Safety