知识库
探索过程中积累的笔记、参考资料和见解。
LLM & RAG
检索增强生成、向量数据库、基于事实的AI系统
向量嵌入与相似性搜索
文本嵌入的工作原理、嵌入模型选择以及相似度指标(余弦、点积、L2)。
Embeddings
ChromaDB
FAISS
文档分块策略
固定大小、句子级、语义和递归分块。上下文保留与检索精度之间的权衡。
Chunking
Preprocessing
RAG
模型微调
参数高效训练、LoRA、数据集准备
LoRA & QLoRA
基于Low-Rank Adaptation的参数高效微调。QLoRA通过4位量子化提升内存效率。
LoRA
QLoRA
PEFT
训练数据准备
数据清洗、指令格式(Alpaca、ShareGPT)及质量过滤技术。
Dataset
Preprocessing
实用LLM技巧
提示工程、工具调用、Agent模式
提示工程模式
思维链、少样本、系统提示词和结构化输出技术。
Prompting
CoT
Few-shot
Function Calling 与工具调用
通过Function Calling(OpenAI、Anthropic)和Agent框架将LLM与外部工具集成。
Tools
Agents
Function Calling
开发笔记
框架模式、语言技巧、工程笔记
Next.js App Router 模式
服务端组件、流式渲染、并行路由以及使用next-intl的国际化。
Next.js
React
SSR
Rust 所有权与生命周期
所有权、借用、生命周期的心智模型和常见模式。
Rust
Memory Safety