• About

duanple

银河里的星星

  • AddressSanitizer&ThreadSanitizer原理与应用

    2015年1月11日 阅读(7,980)

    序

    AddressSanitizer&ThreadSanitizer都是最初由Google开发的,用于运行时检测C/C++程序中的内存错误和多线程data race的,俗话说“Google出品,必属精品”。首先它们都非常新,最近几年才出来的,有很多先进的地方,弥补了现有一些工具的很多不足,代表了先进生产力的发展方向。比如它们都采用了CTI(CompileTime Instrumentation)技术,即在编译时进行代码插入,运行速度快,比传统的Valgrind等工具速度上要快一个数量级。它们的输出信息都非常详细,方便快速地定位问题。AddressSanitizer除了可以发现堆上内存越界外,还可以检查到栈及全局变量的越界访问,这是很多内存检查工具无法做到的。 read more

  • Consensus on Transaction Commit(译)

    2014年2月9日 阅读(2,034)

    作者:Jim Gray & Leslie Lamport 2004

    原文:http://research.microsoft.com/pubs/64636/tr-2003-96.pdf

    译者:phylips@bmy 2013-10-07

    译文:http://duanple.blog.163.com/blog/static/70971767201419111256135/

    [序:很早之前就注意到这篇文章了,冲着这超豪华的作者阵容当时二话不说就将它加入到了待读列表中,只是最近才有时间将它看完。提到Paxos,人们会禁不住想到Lamport,提到事务,那当仁不让就是Jim Gray了。而由这两位所写的关于Paxos和事务提交的文章,还有让你错过的理由吗?  read more

  • Single-Message Communication(译)

    2013年11月1日 阅读(1,069)

    作者:DAG BELSNES 1976

    原文:http://ieeexplore.ieee.org/xpl/tocresult.jsp?isnumber=23863

    译者:phylips@bmy 2012-11-28

    译文:http://duanple.blog.163.com/blog/static/70971767201310194243109/

    摘要

    当通信系统需要传输大量短消息时,减少进程间连接(connection)的创建和销毁以及消息可靠性方面的控制开销是非常重要的。本文描述了几种不同的端到端控制流程,同时研究了它们是否会导致消息丢失及收到重复消息。结果表明(基于对通信网络的一定假设)所有的端到端协议要么会产生消息丢失,要么会导致重复。 read more

  • MillWheel: Fault-Tolerant Stream Processing at Int

    2013年10月18日 阅读(1,581)

    作者:Tyler Akidau, Alex Balikov etc. Google Inc.

    原文:http://research.google.com/pubs/pub41378.html

    译者:phylips@bmy 2013-10-1

    译文:http://duanple.blog.163.com/blog/static/709717672013918101253853/

    [说明:最近Google在VLDB上发表了两篇文章,其中一篇是F1,另外一篇就是此文。关于流处理,目前业界也已有如下多个系统:Storm,Samza,Summingbird,Spark Streaming,StreamBase。另外,highscalability.com上也有个关于这篇paper的推荐文章Paper: MillWheel: Fault-Tolerant Stream Processing At Internet Scale,Zeitgeist。] read more

  • Photon: Fault-tolerant and Scalable Joining of Con

    2013年9月25日 阅读(683)

    作者:Rajagopal Ananthanarayanan, Venkatesh Basker etc. Google Inc.

    原文:http://www.mpi-sws.org/~areznich/files/photon-sigmod13.pdf

    译者:phylips@bmy 2013-9-1

    译文:http://duanple.blog.163.com/blog/static/70971767201382591541823/

    摘要

    Photon是Google开发的用于实时地对多个连续数据流进行join的部署于多个地理位置的分布式系统,具有高扩展性和低延迟的特点。该系统可以在不需要人工干预的情况下,完全容忍设施降级和数据中心级的故障。在Google内部,该系统是与广告系统一起部署的,可以用来对像网页搜索请求和广告点击这样的数据流进行join,它的输出结果是进行广告客户费用结算的重要依据。目前的线上环境中,峰值情况下每分钟要处理数百万的事件,平均延迟低于10秒。本文我们会描述在跨地理位置情况下,维护大规模持久化状态遇到的那些挑战和解决方案,并着重讲述下那些源于实践过程的设计原则。 read more

  • Storm原理与实现

    2013年9月25日 阅读(551)

    作者:phylips@bmy 2013-02

    1         Storm简介
    1.1      简介

    本文主要是从内部实现的角度来认识下Storm(0.7.1版本),因此需要用户对Storm的基本原理和使用具有一定的了解。如果缺乏这方面的知识,建议首先阅读下Storm的官方wiki:https://github.com/nathanmarz/storm/wiki read more

  • On Designing and Deploying Internet-Scale Services

    2013年6月11日 阅读(748)

    James Hamilton – Windows Live Services Platform 2007

    原文:http://www.mvdirona.com/jrh/TalksAndPapers/JamesRH_Lisa.pdf

    译者:phylips@bmy 2013-06-10

    译文:http://duanple.blog.163.com/blog/static/709717672013511101045985/

    发布周期和测试

    在生产环境下的测试是必需的,所有的大规模服务都应该把它作为QA方案的一部分。对于大多数服务来说,都至少会有一个尽可能接近生产的测试环境,同时所有优秀的工程团队都会用实际的生产负载来驱动测试系统。但我们的经验表明,无论测试环境有多好,总是不可能会与生产环境完全一致。与生产相比,总是或多或少会有些差别。随着测试环境与生产系统的接近,成本也会逐步与生产系统相当。 read more

  • On Designing and Deploying Internet-Scale Services

    2013年6月2日 阅读(659)

    作者:James Hamilton – Windows Live Services Platform 2007

    原文:http://www.mvdirona.com/jrh/TalksAndPapers/JamesRH_Lisa.pdf

    译者:phylips@bmy 2013-06-01

    译文:http://duanple.blog.163.com/blog/static/70971767201352105348729/

    [序:James Hamilton,连线,主页,blog。James Hamilton目前是亚马逊AWS的VP和杰出工程师,专注于基础设施的效率、可靠性和可伸缩性。 read more

  • Why Do Computers Stop and What Can be Done About It

    2013年5月18日 阅读(980)

    作者:Jim Gray 1985

    原文:http://www.hpl.hp.com/techreports/tandem/TR-85.7.pdf

    译者:phylips@bmy 2013-04-30

    译文:http://duanple.blog.163.com/blog/static/7097176720134189481819/

    [序:早在互联网出现以前,Tandem Computers 就已经构建了具有高度容错性和可用性的系统。Tandem Computers 是最早从事容错服务器制造的厂商,它制造的机器广泛应用在银行证券等在线处理交易领域。本文即是Jim Gray在Tandem Computers工作期间所撰写的,文中揭示了Tandem Computers 的“NonStop”神话所依赖的那些重要技术:isolation、failing fast、transactional updates、process pairs、supervision。同时提出了容错领域的很多重要概念,诸如:Availability 、Reliability  、MTBF、MTTR。虽然这篇文章是写在1985年,距今已30年,但是影响深远,其中的很多内容即使在今天看来依然非常有意义。 read more

  • Information about Null (SQL)

    2013年4月20日 阅读(470)

    zz from:http://english.turkcebilgi.com/null+(sql)


    Null is a special marker used to indicate that a data value is unknown in the Structured Query Language (SQL). Introduced by the creator of the relationaldatabase model, Dr. E.F. Codd,SQL Null serves to fulfill the requirement that all true relational database management systems (RDBMS) support a representation of "missing information and inapplicable information". Dr. Codd also introduced the use of the lowercase Greek omega (ω) symbol to represent Null indatabase theory. NULL is also an SQL reserved keyword used to identify the Null special marker.  read more

  • The Tail at Scale(译)

    2013年4月5日 阅读(1,921)

    作者:Jeffrey Dean, Luiz André Barroso Google Inc 2013-2

    原文:http://cacm.acm.org/magazines/2013/2/160173-the-tail-at-scale/fulltext

    译者:phylips@bmy 2013-02-23

    译文:http://duanple.blog.163.com/blog/static/7097176720133511217445/

    序

    那些可以对用户动作进行快速响应(100ms以内)的系统与那些响应慢的系统相比,可以提供更自然流畅的体验。随着Internet连通性的提高以及warehouse-scale 计算系统的出现,使得web服务可以在访问存在数千台服务器上的TB级数据的同时还能保持流畅的响应;比如Google搜索系统会根据用户类型对查询结果进行交互式更新,会基于用户当前已经输入的前缀预测用户查询意图,在数十毫秒的时间内执行该查询并完成结果展示。新兴的增强现实(augmented-reality )设备(比如Google Glass)为保证无缝的交互,对相关web服务的快速响应提出了更高要求。 read more

  • Google Dapper-大规模分布式系统的基础跟踪设施

    2013年3月10日 阅读(1,025)

    [说明:本文是阅读Google论文“Dapper, a Large-Scale Distributed Systems Tracing Infrastructure”之后的一个简要总结,完整译文可参考此处。 另论文“Uncertainty in Aggregate Estimates from Sampled Distributed Traces”中有关于采样的更详细分析。此外,Twitter开源的Zipkin就是参考Google Dapper而开发。] read more

  • 分布式事务之两阶段提交

    2013年2月18日 阅读(1,636)

    作者:Philip A. Bernstein, Vassos Hadzilacos, Nathan Goodman. 1987

    原文:Concurrency Control and Recovery in Database Systems

    译者:phylips@bmy 2013-02-14

    译文:http://duanple.blog.163.com/blog/static/70971767201311810939564/

    [序:历史上,数据库领域共产生过三位图灵奖得主Charles Bachman,E.F.Codd和Jim Gray read more

  • 众里寻她千百度–2012年度总结

    2013年1月19日 阅读(458)

    按照习惯,还是在这岁月交替之际,写一篇小小的总结吧。虽许久不再写流年,而流年依旧如流年。依旧觉得很快这一年就又过去了。

    过去的一年里,起了很多变化,无论是工作还是生活。刚工作的时候,一个人度着周末,经常就是打印个三两篇论文,读着读着就是一天。偶尔还看点闲书,生活倒也惬意,只是颇有些单调。所以在那极单调的日子里,倒也看了不少东西。很多人会觉得能有时间看这么多文章而且还翻译出来的人,一定是在学校或者研究所的吧。其实如果想看,又何需一定是悠闲的人呢。也忘了是哪年哪月读到的了,只是记忆犹新,欧阳修<<归田录>>中有云”余平生所作文章,多在三上,乃马上、枕上、厕上也。盖惟此尤可以属思尔“。其实并不是没有时间,只是需要自己去找,即使每天给自己一个小时的阅读时间,累积下来,一周,一月,一年,只要坚持,就能读很多东西。 read more

  • 软件测试与发布技术

    2013年1月18日 阅读(366)

    Exclusive: a behind-the-scenes look at Facebook release engineering

    [译文]Facebook工程发布技术的幕后故事

    Release Engineering at Facebook

    [译文]Release Engineering at Facebook

    Facebook 的自动化测试

    提高软件质量实践
    代码和产品发布的几种方式

    Shell/BASH CronTab Expect rsync cacti nagios cfengine ganglia gearman puppet. read more

  • 关于内存泄露

    2013年1月5日 阅读(514)

    valgrind 详细说明 
    http://www.cnblogs.com/wangkangluo1/archive/2011/07/20/2111273.html

    近期Imgsrc一处内存泄露问题的查找和解决 http://rdc.taobao.com/blog/cs/?p=1651

    应用 Valgrind 发现 Linux 程序的内存问题 https://www.ibm.com/developerworks/cn/linux/l-cn-valgrind/ read more

  • Paxos Made Live(译)

    2012年12月23日 阅读(4,056)

    作者:Tushar Chandra&Rebert Griesemer&Joshua Redstone 2007 Google.Inc

    原文:http://labs.google.com/papers/paxos_made_live.pdf

    译者:phylips@bmy 2012-11-28

    译文:http://duanple.blog.163.com/blog/static/7097176720121123114918404/

    [序:Google在它的分布式系统中,大量使用了Paxos,比如Chubby、MegaStore、Spanner等系统中。这篇文章详细讲述了最初实现Paxos碰到的一系列问题及解决方案,是一篇全面讲解分布式系统工程实践的文章。其中提到的很多真实发生的场景,相信做过分布式系统的人都会感同身受,每个人或多或少都会遇到过一些类似的问题。与理论界的文章相比,这篇文章显得非常实际,所有内容都来自Google一线工程师的实战,非常值得一看。] read more

  • 关于Paxos的历史

    2012年12月22日 阅读(2,026)

    作者:phylips@bmy 2012.12.21

    出处:http://duanple.blog.163.com/blog/static/709717672012112203543166/

    自Paxos提出,迄今已有20多年了,围绕着该算法曾经发生过一些非常有趣的事情,这些也已成为人们津津乐道的一段轶事,故事的主角自然是Paxos的提出者Lamport,当然Lamport的特立独行也是很早就出了名的。首先来讲述下这些有趣的八卦,之后会再理一下Paxos的整个发展过程,以及在这个过程中产生的一系列比较重要的论文,总共会涉及到十几篇论文,如果有时间还是最好都研读一下。由于时间关系,我也只是选择了其中最为重要的三篇,进行了阅读,并将它们翻译了出来,稍后会整理出来。  read more

  • On Understanding Data Abstraction, Revisited(zz)

    2012年11月23日 阅读(410)

    zz from:http://blog.csdn.net/hoping/article/details/5164194

    前段时间看到一篇文章:On Understanding Data Abstraction, Revisited。其中对数据抽象这个概念进行了深入的探讨,清晰地给出了抽象数据类型和对象的定义,并阐述了其区别以及对于实际编程的影响。因此抽空翻译出来供大家学习、参考。 read more

  • How to Build a Highly Availability System using Consensus

    2012年11月21日 阅读(1,125)

    作者:Butler W.Lampson 1996

    原文:http://research.microsoft.com/en-us/um/people/blampson/58-consensus/Acrobat.pdf

    译者:phylips@bmy 2012-11-18

    译文:http://duanple.blog.163.com/blog/static/709717672012102185013508/

    [序:关于这篇文章,其实之前在“A brief history of Consensus, 2PC and Transaction Commit”中有过一些介绍,它最重要的意义在于使得Paxos算法为理论研究领域的科学家们所重视,并最终使得Leslie Lamport那篇“The Part-Time Parliament”从故纸堆里重见天日。 read more

Older Posts
Newer Posts

全站热门

  • 分布式系统领域经典论文翻译集 - 16,791 views
  • AddressSanitizer&ThreadSanitizer原理与应用 - 7,980 views
  • 分布式领域经典论文译序 - 6,142 views
  • 线性一致性理论 - 4,642 views
  • About - 4,620 views
  • Paxos Made Live(译) - 4,056 views
  • 深度探索分布式理论经典论文 - 3,796 views
  • 【google论文二】Google文件系统(上) - 3,699 views
  • Avro: 大数据的数据格式(zz) - 3,406 views
  • Google论文、开源与云计算 - 3,336 views

分类目录

  • linux
  • 分布式系统
  • 思维训练
  • 技术专题
  • 文思
  • 未分类
  • 流年
  • 离奇的code
  • 程序设计语言
  • 算法与acm
  • 网络及内核
  • 计算机科学与人物
  • 设计模式
  • 读书笔记
  • 转载
  • 闲时思考
  • 高性能计算

近期文章

  • NewSQL Basis
  • gdb基本工作原理
  • Jepsen测试
  • 性能优化工具:perf
  • 性能优化工具:gperftools

近期评论

  • 深度探索分布式理论经典论文 – duanple发表在《The Five-Minute Rule 20 Years Later(译)》
  • test – duanple发表在《Paxos Made Live(译)》
  • test – duanple发表在《分布式系统领域经典论文翻译集》
  • test – duanple发表在《Distributed Snapshots-Determining Global States of a Distributed System(译)》
  • test – duanple发表在《Solution of a Problem in Concurrent Programming Control(译)》

标签

bigtable distributed google hadoop hbase hive leveldb linux lsm-tree mapreduce master nosql paxos pregel python scale sql sstable 人面不知何处去 分布式 分布式系统 思维训练 技术专题 搜索与分布式 文思 服务器 未名湖畔 流年 离奇的code 程序设计语言 算法与acm 算法与acm 面试 线程 经典论文 经史子集 网络及内核 翻译 节点 计算机科学 论文 设计模式 读书笔记 闲时思考 集群 高性能计算

文章归档

  • 2021年6月
  • 2021年1月
  • 2020年12月
  • 2020年10月
  • 2019年8月
  • 2018年11月
  • 2018年9月
  • 2018年6月
  • 2015年1月
  • 2014年2月
  • 2013年11月
  • 2013年10月
  • 2013年9月
  • 2013年6月
  • 2013年5月
  • 2013年4月
  • 2013年3月
  • 2013年2月
  • 2013年1月
  • 2012年12月
  • 2012年11月
  • 2012年10月
  • 2012年9月
  • 2012年8月
  • 2012年7月
  • 2012年6月
  • 2012年5月
  • 2012年4月
  • 2012年1月
  • 2011年12月
  • 2011年11月
  • 2011年10月
  • 2011年9月
  • 2011年8月
  • 2011年7月
  • 2011年6月
  • 2011年5月
  • 2011年4月
  • 2011年3月
  • 2011年1月
  • 2010年12月
  • 2010年11月
  • 2010年10月
  • 2010年8月
  • 2010年7月
  • 2010年6月
  • 2010年5月
  • 2010年4月
  • 2010年3月
  • 2010年1月
  • 2009年12月
  • 2009年11月
  • 2009年10月
  • 2009年9月
  • 2009年8月
  • 2009年7月
  • 2009年6月
  • 2009年5月
  • 2009年4月
  • 2009年3月
  • 2009年2月
  • 2009年1月
  • 2008年12月
  • 2008年11月
  • 2008年10月
  • 2008年9月
  • 2008年8月
  • 2008年7月
  • 2008年6月
  • 2008年5月
  • 2008年4月
  • 2008年3月

功能

  • 登录
  • 文章RSS
  • 评论RSS
  • WordPress.org

业界大牛

  • James Hamilton
  • Werner Vogels

Copyright © 2018 Pixeldom Lite | Developed by ThemeBounce

Back to top | 京ICP备18037177号