人工智能与工程8 分钟阅读
人工智能金融科技负责任的人工智能LLM多语言

我们如何打造一个不会幻觉的金钱解释 AI

理财应用里 AI 把数字搞错不是趣闻——那是伤害。本文讲我们如何打造能用 13 种语言解释信用、预算和债务的助手,而不会编造建议或数字。

Svetlana Burninova

Svetlana Burninova

CTO & Co-Founder

我们如何打造一个不会幻觉的金钱解释 AI

YPA-FINANCE 的 AI 解释金融概念,它从不编造建议或数字。每一项触及你钱包的计算都跑在经过审计的代码里,而不是在语言模型里。这篇文章讲的是我们如何画下这条边界,以及为什么这是我们 AI 助手背后最重要的工程决定。

人们听到"AI 金融助手"时,通常会想到一个回答理财问题的聊天机器人。那是容易的部分。难的部分,几乎没人谈论的部分,是确保它永远不会自信地告诉你错的事情。在大多数产品里,幻觉只是一张尴尬的截图。在一款给正在用第二语言摸索新国家金融体系的人用的理财应用里,这意味着一个人在依据我们编造出来的数字做出真实的决定。

所以我想说说我们是如何真正构建它的:在哪里让 AI 自由地说话,在哪里完全不让它接近,以及中间的安全护栏。

金融里的幻觉不是趣闻,是伤害。

大语言模型预测的是听起来合理的文字。这就是它们的工作方式。大多数时候合理与正确是重叠的,而这恰恰让这道缝隙变得危险,因为它在出问题之前是看不见的。

向一个通用聊天机器人提问:"如果我每月在 5,000 美元的余额上以 24% 的 APR 还 200 美元,什么时候能还清?"它会给你一个自信、具体、格式漂亮的答案。有时是对的。有时差一年。仅仅看着它你无法分辨是哪一种,需要问这个问题的那个人也无法分辨。

再加上我们真实的用户:很多移民和新到者既没有金融安全网,也没有已经熟悉这套体系的父母,也没有足够的英语去核对一段听起来很自信的话。他们使用 YPA-FINANCE 的全部理由,正是因为他们*没办法*自己轻易核对这些东西。这不是我们可以递给一个"听起来合理的猜测"的用户。所以我们围绕一条硬性规则做设计:模型永远不是任何必须正确之事的真理来源。

解释 ≠ 建议

我们画下的最重要的一条线,是解释建议之间的线。

解释是:"APR 是借钱的年度成本,包括利息。24% 的 APR 大致意味着,你在卡上保留一年的每 100 美元,会增加大约 24 美元的利息。"这是一个概念。它稳定、与你的具体情况无关都成立,而 AI 可以用我们 13 种语言中的任何一种,用通俗的话解释清楚。

建议是:"你应该往这张卡上还 300 美元,停止使用另一张。"这是关于某个具体人的钱的处方。它依赖必须精确的数字,出错有后果。

我们的 AI 做前者。它被刻意设计成不做后者。这条边界不是我们要为之道歉的局限,它是一个安全特性。一个解释信用如何运作的工具让你自己做决定。一个根据猜测悄悄替你做决定的工具,正是我们想保护人们免受其害的东西。

安全护栏,具体来看

下面是这条边界在真实系统里的样子。

数学跑在代码里,不在模型里。每一项计算,债务清偿时间表、已付利息、不同清偿策略的比较,都跑在确定性的、经过测试的代码里。和 Calculator PRO 背后的逻辑相同。语言模型从不做算术。当你问一个需要数字的问题时,模型的工作是识别你在问什么,把它交给计算器,然后用你的语言解释结果。数字是被计算出来的;只有解释是被生成的。如果计算引擎答不出来,AI 就会说出来,它不会即兴发挥。

解释是有锚的,不是自由发挥的。当 AI 解释一个概念时,它使用的是我们自己审核过的金融内容,和我们指南背后是同一份材料,而不是它在训练时碰巧吸收到的东西。把答案锚定在已知来源里,正是防止"什么是最低还款"漂移成一个自信的胡编的关键。

范围是刻意收窄的。这个助手是为谈论信用、预算、债务和理解金融文档而构建的。问它范围之外的事情,预测股票、保证你会被卡获批、保证 30 天内拿到某个信用分数,它被设计成宁可拒绝也不用一个答案讨好你。"我不知道"和"看情况,以下是需要考虑的"是有效、正确的回答。我们把它们当作功能。

总有一条人工通道。当一个问题超出了 AI 应当回答的范围,正确的做法不是更好的猜测,而是一个人。用户可以通过 WhatsApp 或 Telegram 联系到真人。AI 知道自己的工作在哪里结束,和它在工作之内做什么同样重要。

用 13 种语言做这件事会让风险翻倍

这里有一个大多数"AI 理财应用"文章完全跳过的问题:幻觉风险和翻译风险会叠加。

让一个模型用英语正确解释 APR 是一回事。让*同样的*解释在西班牙语、阿拉伯语、俄语、韩语、越南语、塔加洛语和另外七种语言里都准确、通俗、文化上可读,又是另一回事,这还包括从右到左的语言,以及金融词汇没办法干净地映射到美国概念上的语言。把"最低还款"或"账单余额"翻译错一点,可能和幻觉出一个数字一样有害,而且更难发现,因为英文看起来没问题。

所以同样的原则跨语言适用:我们解释的金融概念来自经过审核、受控的源材料,模型的工作是把它们清晰地呈现在用户的语言里,而不是每次翻译都重新发明金融含义。结构保持不变;语言来适应。这就是怎么避免"13 种语言的通俗表达"悄悄变成"13 次细微出错的机会"。

我们不让它做什么

值得明确说出来,因为这份清单就是信任本身:

  • 编造数字。如果一个数字重要,它是被计算出来的,不是被生成的。
  • 给出具体的买卖或投资建议。
  • 承诺结果——不会说"你会获批",不会说"你的分数到时候会到 X"。
  • 为了显得有用而回答范围之外的事情。
  • 看或使用我们没有的数据,这和 我们处理你数据的方式 背后是同一个架构约束。
  • 为什么这就是全部的重点

    我以前说过,理财困惑不是个人的失败,它是一个设计缺陷,而设计缺陷是可以修的。AI 是我们有过的最强大的修复工具:一个用你的语言、按你的节奏、不带评判的、耐心的解释者。

    但这股力量是双刃剑。一个解释*又清楚又准确*的 AI,对一个被语言挡在金融系统外的人来说真的能改变命运。一个解释清楚但*有时是错的*的 AI,对同一个人来说比没有还糟,因为他没办法知道哪一次是哪一次。

    这就是为什么我们这么造它。我们的用户打过交道的大多数理财工具——银行、客服中心、通用聊天机器人——听起来都很自信,却悄悄地出错。我们拒绝再交付一个那样的。这些安全护栏不是我们造完 AI 之后加上去的。它们是让这套 AI 值得发布的根本理由。

    你可以在 AI 助手页面 看助手实际是怎么工作的,或者在 对比页面 看 YPA-FINANCE 和其他理财应用的差别。

    ---

    Svetlana Burninova 是 YPA Finance 的联合创始人兼 CTO,有 15 年金融系统经验和 7 年基础设施经验。持有 AWS、CKA、CKAD 和 HashiCorp Terraform 认证。关于我们如何构建 AI 的问题?写邮件到 hello@ypa.finance 找她。