「微服务架构」微服务架构中的数据一致性

架构设计梦想屋 2020-4-24 1640 0

「微服务架构」微服务架构中的数据一致性

在微服务中，一个逻辑上原子操作可以经常跨越多个微服务。即使是单片系统也可能使用多个数据库或消息传递解决方案。使用多个独立的数据存储解决方案，如果其中一个分布式流程参与者出现故障，我们就会面临数据不一致的风险 - 例如在未下订单的情况下向客户收费或未通知客户订单成功。在本文中，我想分享一些我为使微服务之间的数据最终保持一致而学到的技术。

为什么实现这一目标如此具有挑战性？只要我们有多个存储数据的地方（不在单个数据库中），就不能自动解决一致性问题，工程师在设计系统时需要注意一致性。目前，在我看来，业界还没有一个广为人知的解决方案，可以在多个不同的数据源中自动更新数据 - 我们可能不应该等待很快就能获得一个。

以自动且无障碍的方式解决该问题的一种尝试是实现两阶段提交（2PC）模式的XA协议。但在现代高规模应用中（特别是在云环境中），2PC似乎表现不佳。为了消除2PC的缺点，我们必须交易ACID for BASE并根据要求以不同方式覆盖一致性问题。

Saga模式

在多个微服务中处理一致性问题的最着名的方法是Saga模式。 您可以将Sagas视为多个事务的应用程序级分布式协调。根据用例和要求，您可以优化自己的Saga实施。相反，XA协议试图涵盖所有场景。 Saga模式也不是新的。它在过去已知并用于ESB和SOA体系结构中。最后，它成功地转变为微服务世界。跨越多个服务的每个原子业务操作可能包含技术级别的多个事务。 Saga Pattern的关键思想是能够回滚其中一个单独的交易。众所周知，开箱即用的已经提交的单个事务无法进行回滚。但这是通过引入补偿操作来实现的 - 通过引入“取消”操作。

「微服务架构」微服务架构中的数据一致性

除了取消之外，您还应该考虑使您的服务具有幂等性，以便在出现故障时重试或重新启动某些操作。应监控故障，并应积极主动地应对故障。

对账

如果在进程的中间负责调用补偿操作的系统崩溃或重新启动，该怎么办？在这种情况下，用户可能会收到错误消息，并且应该触发补偿逻辑，或者 - 当处理异步用户请求时，应该恢复执行逻辑。

「微服务架构」微服务架构中的数据一致性

要查找崩溃的事务并恢复操作或应用补偿，我们需要协调来自多个服务的数据。对账

是在金融领域工作的工程师所熟悉的技术。你有没有想过银行如何确保你的资金转移不会丢失，或者两个不同的银行之间如何汇款？快速回答是对账。

「微服务架构」微服务架构中的数据一致性

在会计中，对账是确保两组记录（通常是两个账户的余额）达成一致的过程。对帐用于确保离开帐户的资金与实际支出的资金相匹配。这是通过确保在特定会计期间结束时余额匹配来完成的。 - Jean Scheid，“了解资产负债表账户调节”，Bright Hub，2011年4月8日

回到微服务，使用相同的原则，我们可以在一些动作触发器上协调来自多个服务的数据。当检测到故障时，可以按计划或由监控系统触发操作。最简单的方法是运行逐记录比较。可以通过比较聚合值来优化该过程。在这种情况下，其中一个系统将成为每条记录的真实来源。

事件簿

想象一下多步骤交易。如何在对帐期间确定哪些事务可能已失败以及哪些步骤失败？一种解决方案是检查每个事务的状态。在某些情况下，此功能不可用（想象一下发送电子邮件或生成其他类型消息的无状态邮件服务）。在其他一些情况下，您可能希望立即了解事务状态，尤其是在具有许多步骤的复杂方案中。例如，预订航班，酒店和转机的多步订单。

「微服务架构」微服务架构中的数据一致性

复杂的分布式流程

在这些情况下，事件日志可以提供帮助。记录是一种简单但功能强大的技术。许多分布式系统依赖于日志。 “预写日志记录”是数据库在内部实现事务行为或维护副本之间一致性的方式。相同的技术可以应用于微服务设计。在进行实际数据更改之前，服务会写入有关其进行更改的意图的日志条目。实际上，事件日志可以是协调服务所拥有的数据库中的表或集合。

「微服务架构」微服务架构中的数据一致性

事件日志不仅可用于恢复事务处理，还可用于为系统用户，客户或支持团队提供可见性。但是，在简单方案中，服务日志可能是冗余的，状态端点或状态字段就足够了。

编配(Orchestration)与编排(choreography)

到目前为止，您可能认为sagas只是编配(orchestration )方案的一部分。但是sagas也可以用于编排(choreography )，每个微服务只知道过程的一部分。 Sagas包括处理分布式事务的正流和负流的知识。在编排(choreography )中，每个分布式事务参与者都具有这种知识。

单次写入事件

到目前为止描述的一致性解决方案并不容易。他们确实很复杂。但有一种更简单的方法：一次修改一个数据源。我们可以将这两个步骤分开，而不是改变服务的状态并在一个过程中发出事件。

更改为先

在主要业务操作中，我们修改自己的服务状态，而单独的进程可靠地捕获更改并生成事件。这种技术称为变更数据捕获（CDC）。实现此方法的一些技术是Kafka Connect或Debezium。

「微服务架构」微服务架构中的数据一致性

使用Debezium和Kafka Connect更改数据捕获

但是，有时候不需要特定的框架。一些数据库提供了一种友好的方式来拖尾其操作日志，例如MongoDB Oplog。如果数据库中没有此类功能，则可以通过时间戳轮询更改，或使用上次处理的不可变记录ID查询更改。避免不一致的关键是使数据更改通知成为一个单独的过程。在这种情况下，数据库记录是单一的事实来源。只有在首先发生变化时才会捕获更改。

「微服务架构」微服务架构中的数据一致性

无需特定工具即可更改数据捕获

事件第一

让我们来看看颠倒的单一事实来源。如果不是先写入数据库，而是先触发一个事件，然后与自己和其他服务共享。在这种情况下，事件成为事实的唯一来源。这将是一种事件源的形式，其中我们自己的服务状态有效地成为读取模型，并且每个事件都是写入模型。

事件优先方法

设计一致性

有许多方法可以将系统拆分为多个服务。我们努力将单独的微服务与单独的域匹配。但域名有多细化？有时很难将域与子域或聚合根区分开来。没有简单的规则来定义您的微服务拆分。

我建议务实并考虑设计方案的所有含义，而不是只关注领域驱动的设计。其中一个影响是微服务隔离与事务边界的对齐情况。事务仅驻留在微服务中的系统不需要上述任何解决方案。在设计系统时我们一定要考虑事务边界。在实践中，可能很难以这种方式设计整个系统，但我认为我们应该致力于最大限度地减少数据一致性挑战。

选择哪种解决方案

数据的原子更新需要两个不同系统之间达成共识，如果单个值为0或1则达成协议。当涉及到微服务时，它归结为两个参与者之间的一致性问题，并且所有实际解决方案都遵循一条经验法则：

在给定时刻，对于每个数据记录，您需要找到系统信任的数据源

事实的来源可能是事件，数据库或其中一项服务。实现微服务系统的一致性是开发人员的责任。我的方法如下：

尝试设计一个不需要分布式一致性的系统。不幸的是，对于复杂的系统来说，这几乎是不可能的。

尝试通过一次修改一个数据源来减少不一致的数量。

考虑事件驱动的架构。除了松散耦合之外，事件驱动架构的强大优势是通过将事件作为单一事实来源或由于更改数据捕获而产生事件来实现数据一致性的自然方式。

更复杂的场景可能仍然需要服务，故障处理和补偿之间的同步调用。知道有时候你可能需要在之后进行调和。

设计您的服务功能是可逆的，决定如何处理故障情况并在设计阶段早期实现一致性。

「微服务架构」微服务架构中的数据一致性

Saga模式

对账

事件簿

复杂的分布式流程

编配(Orchestration)与编排(choreography)

单次写入事件

更改为先

事件第一

设计一致性

接受不一致

选择哪种解决方案

您可能还会对下面的文章感兴趣：

相关文章