2020年にTwitterで紹介されているのを見つけて読んだ Operations Anti-Patterns の邦訳が4月に出るそうです。
とても良い内容だったので事前におすすめしておきたい。
上層部がDevOpsに理解のない組織で働き、組織構造を変える権限を持っていない開発者であっても、チームにDevOpsを導入するための現実的な方法を紹介します。
重厚な承認プロセス、可視化されていない運用、プロセスの最後でのみ行われるソフトウェアテスト、ノイズだらけのアラート、インシデントから学習しない習慣、時間外のデプロイ、情報のため込みなどを取り上げ、ソフトウェアシステムの開発運用が滞るチームや組織に共通してみられる陥りがちな状況や犯しがちな間違いをアンチパターンとして紹介します。そして管理職やマネージャでなく、エンジニアが実行し、繰り返すことで改善できる具体的な行動を解説します。
組織で必要とされる変化を、エンジニアが行動することで実現する本書は、ソフトウェアシステムをよりよく開発運用したいエンジニア必携の一冊です。
O’Reilly Village/オラの村 - 4月新刊情報『システム運用アンチパターン』
紹介文からつらみが溢れていて良いですねー。「現実的」「具体的」というのは本当にそうで、この本の良いところです。
原著は Manning Publications から出てます。電子書籍で買うとLiveBookというブラウザで読める形式も使えるので自動翻訳使いつつ読めて便利でした。
LiveBookは一部試し読みできます。
Operations Anti-Patterns, DevOps Solutions
この本の特徴は一般の開発者に向けた改善方法の紹介ということです。私は開発者が全員で5名未満の小さな会社でのキャリアを2回経験しているのですが、そこでぶつかった問題と重なることの多い非常に泥臭い内容でした。DevOpsというとマネージャ向けの本は何冊か読んだんですが、この本ぐらい地に足のついた本は読んだことなかったです。
小さな会社の開発チームからメンバの増員、上場などを経ていく過程ではみんな同じような問題にぶつかって解決してきてると思うんですが、それがまとめられたことはあまり無かったんじゃないでしょうか。
開発プロセスがまだ固まっていない小さな会社ならこの本を読むことで良い習慣を知ることが出来ると思います。しかもそれはしゃらくさい意識高いものではなく、具体的ですぐ始められるテクです。開発プロセスがある程度固まっている大きめの会社でもいろんなトピックを紹介しているので抜けている部分が見つけられるかもしれません。
ユニークな本だと思います。
原著の目次を引用。つらみが透けて見えてきたら読んで後悔しないはずです(私は目次を見た時点で即買いしました)。
(追記:訳書の目次が公開されました O'Reilly Japan - システム運用アンチパターン)
- THE DEVOPS INGREDIENTS
- DevOpsの定義などの導入
- THE PATERNALIST SYNDROME
- 重すぎる承認プロセスについて
- OPERATIONAL BLINDNESS
- サービスの動きを知るためのカスタムメトリクスの作り方
- DATA INSTEAD OF INFORMATION
- ダッシュボードの具体的な作り方
- QUALITY AS A CONDIMENT
- テスト戦略
- ALERT FATIGUE
- アラートは多すぎると嗅覚疲労のように感じなくなる、適切なしきい値をどう決めるか
- アラート一次請けのローテーション、報酬をどう決めればいいか
- THE EMPTY TOOLBOX
- 作業の自動化をする場合の優先順位
- OFF-HOUR DEPLOYMENTS
- リリースサイクル、ステージング、切り戻し可能なデプロイ
- WASTING A PERFECTLY GOOD INCIDENT
- 障害のポストモーテム
- INFORMATION HOARDING: ONLY BRENT KNOWS
- 組織内の情報共有
- CULTURE BY DECREE
- 社内文化の醸成、人材採用など
- TOO MANY YARDSTICKS
- チームと全体の目標のズレ、タスクの優先順位
下は読んだときの感想ツイートです。章ごとに内容がわかれているのでつまみ食いできるのもいいところ。
10章だけまず読んだ。属人知識を文書化するだけでは伝達はされない、学習の習慣を作らないとダメ。そうだよな… ドキュメント書いたら読んでくれるもんだと思っていたわ…
— deltam (@deltam) December 2, 2020
6章アラート疲労。ノイズの多いアラートばっかだと無視するようになるから基準設けて調整、アラート一次請けスタッフのローテーションとその報酬どうしたらいいか。生々しいところである。
— deltam (@deltam) December 14, 2020
https://t.co/dH8oCsBFVD
— deltam (@deltam) January 5, 2021
3章Operational Blindness。CPU使用率やDisk容量だけ監視しててもサービスがちゃんと動いているかは分かりませんよ、カスタムメトリクス設定して健全性を定義しましょう。というのを具体的ケースで書いてて良い。
開発者個人の視点で書かれているので、ログ集約のSaaSの費用を会社が出したくないと言われたときにどう説得すると良いのかなど泥臭くて良い。
— deltam (@deltam) January 5, 2021
良い本だからどこか翻訳版出してくれんかなhttps://t.co/FpRqLgaF7C
待っていた翻訳が出た、めでたい! 英語だったから同僚に勧めにくかったけどこれで心置きなくオススメできます。
0 件のコメント:
コメントを投稿