Spring AI 玩转多轮对话

步雪卉 · 2025-7-7 17:02:16

AI "失忆"怎么办？本文带你用 Spring AI 一招搞定多轮对话，让你的 AI 应用拥有超强记忆！从 ChatClient、Advisors 到实战编码，三步打造一个能记住上下文的智能历史专家。
大家好，我是程序员NEO。
你是否遇到过这样的 AI？上一秒刚告诉它你的名字，下一秒就问你是谁。这种“金鱼记忆”的 AI 简直让人抓狂！在智能客服、虚拟助手等场景，如果 AI 无法记住上下文，用户体验将大打折扣。
别担心，今天 NEO 就带你用 Spring AI 框架，彻底解决这个难题，轻松为你的 AI 应用植入“记忆芯片”！
为了方便演示，我们将一起创建一个“历史知识专家”AI。它不仅能对答如流，还能记住我们之前的对话，实现真正流畅的智能交流。
准备好了吗？让我们开始吧！
更强大的 ChatClient

要让 AI 拥有“记忆力”，首先得掌握与它高效沟通的工具。Spring AI 提供了 ChatClient API，这是我们与大模型交互的瑞士军刀。
很多同学可能习惯了直接注入 ChatModel，但 ChatClient 提供了功能更丰富、更灵活的链式调用（Fluent API），是官方更推荐的方式。
看看对比，高下立判：

// 基础用法(ChatModel)
ChatResponse response = chatModel.call(new Prompt("你好"));
// 高级用法(ChatClient)
ChatClient chatClient = ChatClient.builder(chatModel)
.defaultSystem("你是历史顾问")
.build();
String response = chatClient.prompt().user("你好").call().content();

复制代码

ChatClient 的构建方式也很灵活，可以通过构造器注入或使用建造者模式：

// 方式1：使用构造器注入
@Service
public class ChatService {
private final ChatClient chatClient;
public ChatService(ChatClient.Builder builder) {
this.chatClient = builder
.defaultSystem("你是历史顾问")
.build();
}
}
// 方式2：使用建造者模式
ChatClient chatClient = ChatClient.builder(chatModel)
.defaultSystem("你是历史顾问")
.build();

复制代码

它还支持多种响应格式，无论是包含 Token 信息的完整响应、自动映射的 Java 对象，还是实现打字机效果的流式输出，都能轻松搞定。

// ChatClient支持多种响应格式
// 1. 返回 ChatResponse 对象（包含元数据如 token 使用量）
ChatResponse chatResponse = chatClient.prompt()
.user("Tell me a joke")
.call()
.chatResponse();
// 2. 返回实体对象（自动将 AI 输出映射为 Java 对象）
// 2.1 返回单个实体
record ActorFilms(String actor, List<String> movies) {}
ActorFilms actorFilms = chatClient.prompt()
.user("Generate the filmography for a random actor.")
.call()
.entity(ActorFilms.class);
// 2.2 返回泛型集合
List multipleActors = chatClient.prompt()
.user("Generate filmography for Tom Hanks and Bill Murray.")
.call()
.entity(new ParameterizedTypeReference<List>() {});
// 3. 流式返回（适用于打字机效果）
Flux<String> streamResponse = chatClient.prompt()
.user("Tell me a story")
.stream()
.content();
// 也可以流式返回ChatResponse
Flux<ChatResponse> streamWithMetadata = chatClient.prompt()
.user("Tell me a story")
.stream()
.chatResponse();

复制代码

更棒的是，你可以为 ChatClient 设置默认的“人设”（系统提示词），甚至在对话中动态替换模板变量，让 AI 的角色扮演更加生动。

// 定义默认系统提示词
ChatClient chatClient = ChatClient.builder(chatModel)
.defaultSystem("You are a friendly chat bot that answers question in the voice of a {voice}")
.build();
// 对话时动态更改系统提示词的变量
chatClient.prompt()
.system(sp -> sp.param("voice", voice))
.user(message)
.call()
.content());

复制代码

Advisors 拦截器

如果说 ChatClient 是 AI 的躯体，那 Advisors（顾问）就是给它加持的各种“外挂”和“Buff”。
你可以把 Advisors 理解为一系列可插拔的拦截器。在请求发给 AI 前或收到 AI 响应后，它们可以执行各种骚操作：

前置增强：悄悄改写你的提问，让它更符合 AI 的胃口；或者进行安全检查，过滤掉危险问题。
后置增强：记录调用日志，或者对 AI 的回答进行二次加工。

用法非常简单，直接在构建 ChatClient 时配置 defaultAdvisors 即可。比如，MessageChatMemoryAdvisor 就是我们实现对话记忆的关键“外挂”。

var chatClient = ChatClient.builder(chatModel)
.defaultAdvisors(
new MessageChatMemoryAdvisor(chatMemory), // 对话记忆 advisor
new QuestionAnswerAdvisor(vectorStore) // RAG 检索增强 advisor
)
.build();
String response = this.chatClient.prompt()
// 对话时动态设定拦截器参数，比如指定对话记忆的 id 和长度
.advisors(advisor -> advisor.param("chat_memory_conversation_id", "678")
.param("chat_memory_response_size", 100))
.user(userText)
.call()
.content();

复制代码

Advisors 的工作原理就像一条精密的流水线（责任链模式）：

流水线流程解读：

用户的请求进来，被包装成一个 AdvisedRequest。
请求在 Advisor 链上依次传递，每个 Advisor 都可以对它进行处理或修改。
最终，请求被发送给 ChatModel。
模型的响应再沿着流水线反向传回，每个 Advisor 也可以处理响应。
最后，客户端收到经过层层“加持”的最终结果。

注意：Advisor 的执行顺序由其 getOrder() 方法决定，值越小，优先级越高，跟代码书写顺序无关哦！

Chat Memory Advisor

要实现对话记忆，ChatMemoryAdvisor 是我们的不二之选。它有几种实现方式，最常用的是 MessageChatMemoryAdvisor。

MessageChatMemoryAdvisor：将历史对话作为完整的消息列表（包含用户和 AI 的角色）添加到提示中。这是最符合现代大模型交互方式的选择。
PromptChatMemoryAdvisor：将历史对话拼接成一段文本，塞进系统提示词里。
VectorStoreChatMemoryAdvisor：使用向量数据库来存储和检索历史对话，适用于更复杂的场景。

MessageChatMemoryAdvisor 保留了对话的原始结构，能让 AI 更好地理解上下文，因此 强烈推荐使用。
Chat Memory

ChatMemoryAdvisor 只是“搬运工”，真正存储对话历史的是 Chat Memory。Spring AI 提供了多种“记忆仓库”：

InMemoryChatMemory：内存存储，简单快捷，适合测试（我们今天就用它）。
JdbcChatMemory, CassandraChatMemory, Neo4jChatMemory：持久化存储，可将对话历史保存在数据库中，适合生产环境。

打造一个“历史学家”AI

理论讲完了，上代码！
初始化 ChatClient

我们通过构造器注入 ChatModel，然后构建 ChatClient。在构建时，设定好“历史学家”的人设（SYSTEM_PROMPT），并装上我们的记忆“外挂”——MessageChatMemoryAdvisor。

/**
* @author 程序员NEO
* @version 1.0
* @description 历史知识专家应用
* @since 2025-07-07
**/
@Component
@Slf4j
public class HistoryExpertApp {
private final ChatClient chatClient;
private static final String SYSTEM_PROMPT = "你是一位风趣幽默的历史知识专家，学识渊博。" +
"你需要根据用户的提问，生动、清晰地回答相关的历史知识。" +
"如果用户的问题不清晰，你需要引导用户提供更多信息。";
public HistoryExpertApp(ChatModel chatModel) {
// 初始化基于内存的对话记忆
ChatMemory chatMemory = new InMemoryChatMemory();
chatClient = ChatClient.builder(chatModel)
.defaultSystem(SYSTEM_PROMPT)
.defaultAdvisors(
new MessageChatMemoryAdvisor(chatMemory)
)
.build();
}
// ... doChat 方法
}

复制代码

这里我们使用了 InMemoryChatMemory，它将对话历史存在内存里。对于生产环境，记得换成 Redis 或数据库等持久化方案。
编写对话方法

核心的 doChat 方法接收用户消息（message）和会话 ID（chatId）。chatId 是区分不同对话的关键，确保每个用户的聊天记录相互独立。

/**
* 执行聊天操作，处理用户消息并返回 AI 的响应。
*
* @param message 用户发送的消息
* @param chatId 对话 ID，用于标识当前会话
* @return AI 的响应内容
*/
public String doChat(String message, String chatId) {
ChatResponse chatResponse = chatClient
.prompt()
.user(message)
.advisors(spec -> spec
.param(MessageChatMemoryAdvisor.CHAT_MEMORY_CONVERSATION_ID_KEY, chatId) // 设置对话 ID
.param(MessageChatMemoryAdvisor.CHAT_MEMORY_RETRIEVE_SIZE_KEY, 10)) // 设置记忆容量
.call()
.chatResponse();
String content = chatResponse.getResult().getOutput().getContent();
log.info("AI Response: {}", content);
return content;
}

复制代码

在 .advisors() 方法中，我们传入了两个关键参数：

CHAT_MEMORY_CONVERSATION_ID_KEY: 会话 ID，确保每个用户的对话历史是隔离的。
CHAT_MEMORY_RETRIEVE_SIZE_KEY: 对话记忆检索大小。设置为 10 表示 AI 在回答时，会参考最近的 10 条消息（5 轮对话）。

见证奇迹的时刻！

我们用一个单元测试来验证 AI 是否真的拥有了记忆。

@SpringBootTest
public class HistoryExpertAppTest {
@Resource
private HistoryExpertApp historyExpertApp;
@Test
void testChat() {
String chatId = UUID.randomUUID().toString();
// 第一轮对话
System.out.println("--- 第一轮对话 ---");
String message1 = "我叫NEO，我最喜欢的数字是7。";
System.out.println("我: " + message1);
String answer1 = historyExpertApp.doChat(message1, chatId);
Assertions.assertNotNull(answer1);
System.out.println("AI: " + answer1);
// 第二轮对话
System.out.println("\n--- 第二轮对话 ---");
String message2 = "我叫什么名字？我最喜欢的数字是几？";
System.out.println("我: " + message2);
String answer2 = historyExpertApp.doChat(message2, chatId);
Assertions.assertNotNull(answer2);
System.out.println("AI: " + answer2);
}
}

复制代码

场景一：拥有完整记忆

当 CHAT_MEMORY_RETRIEVE_SIZE_KEY 设置为 10 时，AI 能轻松记住我们在第一轮对话中提供的信息。
测试结果：
[code]--- 第一轮对话 ---我: 我叫NEO，我最喜欢的数字是7。AI: 哈哈，Neo！很高兴认识你！7确实是一个神奇的数字——不仅是上帝创造世界的天数，也是彩虹的颜色数、一周的天数，甚至还是詹姆斯·邦德的代号！看来你和神秘事物很投缘啊！既然你喜欢7，那我考考你：你知道人类历史上有哪些著名的"七"吗？比如七大奇迹、七星瓢虫，或者...《七龙珠》？
来源：豆瓜网用户自行投稿发布，如果侵权，请联系站长删除

账号		自动登录	找回密码
密码			立即注册

Spring AI 玩转多轮对话

相关帖子

签约作者

Spring AI 玩转多轮对话

相关帖子

相关推荐

签约作者