多轮对话 - 鲸林向海

EMPA与MAPO：大模型长程共情评测与训练新范式，让AI真正理解情感陪伴

现如今，大模型在单轮对话中已能生成温柔体贴、充满情绪价值的文字。然而，我们或许会怀疑：在一句句“高情商回复”的背后，模型是否真正理解了共情。在情感陪伴与心理支持等真实场景中，人类之间的有效交流极少依靠单薄的漂亮话。一句回复不仅影响用户当下的情绪，更会潜移默化地改变后续对话的轨迹。真正有效的共情，需要模型在长期的多轮互动中，持续观察并理解对方的潜在心理状态，…

2026年3月18日

842000

大模型评测

Agent能力评测全景图：从多轮对话到数据分析，解锁智能体真实水平

大型语言模型的进化速度令人惊叹。我们见证了它们从简单的文本生成工具，逐步演变为能够感知、推理、规划并调用外部工具的智能体（Agent）。这种质的飞跃让LLM开始真正走向复杂任务的解决——无论是自动化办公流程、辅助数据分析，还是多轮对话中的智能决策。然而，一个关键问题随之浮现：如何科学、系统地评测这些Agent的真实能力？这并非简单的准确率计算。Agent…

2025年11月8日

437000

大模型工程

上下文工程：AI长任务性能优化的核心策略

Prompts 确立意图。Context 选择事实、历史和工具输出，让 AI 在长任务中保持连贯。在 AI 应用的早期，我们沉迷于字词的斟酌。微调一个动词，增加一条约束，观察模型是否按预期响应。这些技巧常常奏效，足以让人以为这是一门手艺。直到任务变得更长、更复杂、涉及更多步骤时，一条安静的真相才浮出水面：措辞固然重要，但模型看到什么更为关键。 Promp…

2025年11月7日

464000