知识库

探索过程中积累的笔记、参考资料和见解。

LLM & RAG

检索增强生成、向量数据库、基于事实的AI系统

RAG 基础

检索增强生成（RAG）将文档检索与LLM生成相结合，提供有据可依的回答。

RAG

LLM

Vector DB

LangChain RAG Docs

向量嵌入与相似性搜索

文本嵌入的工作原理、嵌入模型选择以及相似度指标（余弦、点积、L2）。

Embeddings

ChromaDB

FAISS

文档分块策略

固定大小、句子级、语义和递归分块。上下文保留与检索精度之间的权衡。

Chunking

Preprocessing

RAG

模型微调

参数高效训练、LoRA、数据集准备

LoRA & QLoRA

基于Low-Rank Adaptation的参数高效微调。QLoRA通过4位量子化提升内存效率。

LoRA

QLoRA

PEFT

训练数据准备

数据清洗、指令格式（Alpaca、ShareGPT）及质量过滤技术。

Dataset

Preprocessing

实用LLM技巧

提示工程、工具调用、Agent模式

提示工程模式

思维链、少样本、系统提示词和结构化输出技术。

Prompting

CoT

Few-shot

Function Calling 与工具调用

通过Function Calling（OpenAI、Anthropic）和Agent框架将LLM与外部工具集成。

Tools

Agents

Function Calling

开发笔记

框架模式、语言技巧、工程笔记

Next.js App Router 模式

服务端组件、流式渲染、并行路由以及使用next-intl的国际化。

Next.js

React

SSR

Rust 所有权与生命周期

所有权、借用、生命周期的心智模型和常见模式。

Rust

Memory Safety