分布式系统

How to Build a Highly Availability System using Consensus

2012年11月21日 阅读(996)

 

作者:Butler W.Lampson 1996

原文:http://research.microsoft.com/en-us/um/people/blampson/58-consensus/Acrobat.pdf

译者:phylips@bmy 2012-11-18

译文:http://duanple.blog.163.com/blog/static/709717672012102185013508/

 

[序:关于这篇文章,其实之前在“A brief history of Consensus, 2PC and Transaction Commit”中有过一些介绍,它最重要的意义在于使得Paxos算法为理论研究领域的科学家们所重视,并最终使得Leslie Lamport那篇“The Part-Time Parliament”从故纸堆里重见天日。

 

Butler W.Lampson,计算机科学领域的超级大牛,其名气要甚于Leslie Lamport,1992年图灵奖以及2001年冯诺依曼奖得主,也是微软研究院的,跟Leslie Lamport一个单位。关于Lampson更详细的介绍可以参考这篇文章“IEEE 约翰·冯诺依曼奖”。这篇文章初读起来感觉可能要比Leslie Lamport重写的那篇“Paxos Made Simple”还要艰深一些,当然了这也是可以理解的,因为这篇文章是写在1996年的,在此之前基本没人看懂Leslie Lamport那篇“The Part-Time Parliament”,即使看懂了也没有意识到其重要性,而Lamport 在2001年重写的那篇“Paxos Made Simple”实际上也听取了很多来自Lampson的建议(但是读完又会感觉它很些地方比Lamport写的要好,而且这篇文章所讨论的内容并不局限于Paxos,只是以Paxos为实例,讲述了如何描述、解决、理解、证明分布式算法)。Lamport本人在回顾Paxos的整个曲折发表历程时,这样评价到,“在整个悲催的经历中(指论文一开始被拒,没有人重视),Butler W.Lampson是一个例外,他立刻意识到这个算法的重要性,并在他的演讲和一篇论文(即本文)中对该算法进行了描述,这引起了Nancy Lynch(分布式理论研究大牛,Distributed Algorithms一书作者)的关注”。此后的1998年,Lynch和Lampson还合写了一篇文章“Revisiting the Paxos algorithm”,发表在1999年的Theoretical Computer Science上,从那个时候开始Paxos才逐渐引起理论科学家们的关注,而真正为大众熟知应该是在Google发表Chubby之后了。

 

通过这篇文章可以看到大牛是如何理解Paxos的,当然除了Paxos之外,这篇文章还提到了Paxos与租约(Leases)机制的结合,并介绍了一种形式化地描述系统行为的方式。阅读本文需要具有一些关于safety,liveness,guarded command,prophecy variable,backward simulation,abstract function的基础知识。

]

 

pdf完整版本下载:http://wenku.baidu.com/view/36837a71e87101f69f319538

6.How to Build a Highly Availability System using Consensus

You Might Also Like