読書メモ:データ指向アプリケーションデザイン(2)

www.oreilly.co.jp

読書メモ:データ指向アプリケーションデザイン(1) - yujioramaの日記 の続きで「1.3 スケーラビリティ」と 「1.4 メンテナンス性」。

目次

1.3 スケーラビリティ

スケーラビリティはシステムの性能問題の要因としてありふれている。 トラフィック量が増加したら、とか、扱うデータ量が増加したら、とか。

言い換えると「ワークロードの増加に対応できる能力」がスケーラビリティ。

1.3.1 負荷の表現

ワークロードの増加に対応するための選択肢を議論するには、客観的に表現できるようにしなければならない。

🟡🟡(リソースなど調整できる何か)を2倍にしたら🟨🟨(トラフィック量など観測できる何か)が2倍になる、みたいな。

システムのアーキテクチャによって適切な表現は異なる。

Web サーバーなら毎秒のリクエスト数、データベースなら読み書きの比率(なんでだ?)、キャッシュならヒット率、などなど。

Twitter を題材に、多数のユーザーをフォローしている人のタイムライン取得と、多数のユーザーにフォローされているユーザーの投稿における性能上の課題とその対応を解説されている。

www.infoq.com

1.3.2 パフォーマンスの表現

2種類の計測方法がある。

  • システムリソースを固定、負荷を増やしつつパフォーマンスの変化を計測する
  • パフォーマンスを固定、負荷を増やしつつ、システムリソースの変化を計測する

「パフォーマンス」の例

レスポンスタイムを判断するときは統計的な分布を評価しなければならない、とか、パーセンタイルという考え方の説明とか。

1.3.3 負荷への対処のアプローチ

一般論として、ある一定の負荷に対応できるアーキテクチャは、その10倍の負荷には対応できない。だからアーキテクチャから考え直さないといけない。

そして万能なアーキテクチャは存在しないので、要求を分析してどのようなワークロードがどれくらい発生するのか推定する必要がある。

1.4 メンテナンス性

ソフトウェアのコストは、初期の開発コストと運用中のメンテナンスコストの総和になる。

次のような設計原則に注意すれば実現できる、かもしれない。

  • 運用性
  • 単純性
  • 拡張性(進化性、修正容易性、プラスティシティ(追加可能性?))

1.4.1 運用性:運用担当者への配慮

Getting Real About Distributed System Reliability - Jay Kreps

劣悪な(あるいは完成度の低い)ソフトウェアの制約は、しばしば優れた運用によって回避できるが、運用が
悪ければ優れたソフトウェアも信頼性を保って動作することはできない

Windows Live のエンジニアが発表した論文のざっくりとした説明も紹介されてる。

James Hamilton: “On Designing and Deploying Internet-Scale Services,” at 21st Large Installation System Administration Conference (LISA), November 2007.

1.4.2 単純さ:複雑さの管理

何かしら対処しなければ時間とともに複雑化するのは当然。その複雑さによりいろいろな問題が引き起こされる。

  • メンテナンスが困難になると予算とスケジュールを超過しがち
  • 変更の際にバグを混入するリスクの上昇
  • 開発者の理解が追いつかない
    • 隠れた前提
    • 意図しない結果
    • 予想外のやりとり

「単純さ」を目指すのだけど、それは「機能を減らす」のではなく「偶発的に発生する複雑さを取り除く」ということ。

「偶発的に発生する複雑さ」というのは、結局実装の都合で生じた何かややこしい問題のこと。

それを解決する手段が抽象化。

しかし、分散システムの利用するさまざま優れたアルゴリズムには、いい感じの抽象が発見されていないものもある。

1.4.3 進化性:変更への配慮

アジリティが必要だということが書かれてたけど具体的な話はなかった。