本 : Effective Java 第3版

kawasin73 / knowledge

気になったツールやサイト、勉強した内容をまとめます。

9 stars 0 forks source link

本 : Effective Java 第3版 #33

Closed kawasin73 closed 3 years ago

kawasin73 commented 4 years ago

amazon

kawasin73 commented 4 years ago

2章オブジェクトの生成と消滅

item 1 : コンストラクタの代わりに static ファクトリメソッドを検討する

static factory method 自分自身を返り値にする public な static method

メリット

コンストラクタとは違い名前を持つことができる
- 同じ引数のシグニチャを持つコンストラクタは1つしか作れない
呼び出しの度にオブジェクトを生成する必要がない。
- Immutable やキャッシュ、シングルトンを実現できる
- オブジェクトの生成をクラス内にカプセル化できる。instance controlled
サブクラスも返せる
- private なサブクラスを返すなど、実装の詳細を隠蔽できる
入力パラメータに応じてサブクラスを変更できる
インターフェイスを提供するので実装を後回しにできる
- 拡張性がある

interface に static method を定義できるようになったのはJava 8 から。それ以前はインスタンス化不可能なクラスに static メソッドをつけていた

デメリット

public, protected のコンストラクタを持たないクラスのサブクラスは作れない
- 逆に継承よりもコンポジションを促すことになるので不幸中の幸い
static factory method は目立ちにくいので見つけにくい
- 命名規則を揃えることでわかりやすくする
  - from
  - of
  - valueOf
  - instance, getInstance
  - create, newInstance
  - get
  - new

サービスプロバイダフレームワーク

サービスインターフェース
- 実装を表す
プロバイダ登録 API
- プロバイダが実装を登録する
サービスアクセス API
- クライアントがサービスのインスタンスを得るために使う
サービスプロバイダインタフェース
- オプショナル
- サービスインターフェースの実装のインスタンス化を行うファクトリオブジェクト

Go の sql データベースのフレームワークとか

Java 6 以降は、java.util.ServiceLoader がサービスプロバイダフレームワークとして使える

item 2 : 多くのコンストラクタパラメータに直面したときにはビルダーを検討する

パラメータが多いと、コンストラクタも static ファクトリメソッドも使いづらい

テレスコーピングコンストラクタパターン
- Java でよく見かけたパターン。
- パラメータが 1, 2, 3, 4 ... 個と増えたコンストラクタを定義して、内部ではデフォルト値付きで一つ引数の多いコンストラクタを呼ぶ
- パラメータ数が多すぎると辛い
JavaBeans パターン
- 引数のないコンストラクタで初期化。デフォルト値を設定
- setter で値を設定していく
- 不整合な状態が生まれる。
- Immutable でない
- freeze() されるまで動かさないなどの工夫がある
Builder パターン
- Builder オブジェクトのコンストラクタでは必須パラメータをとる。
- setter は Builder 自身を返すことで連鎖呼び出しができる
- 個々のパラメータの validation は Builder の setter で行う
- 複数のパラメータの関連の validation はコンストラクタ内で行う
  - IllegalArgumentException
- 抽象 Builder もできる
  - ジェネリクスを使っていて複雑・・・。

デメリット

Builder オブジェクト自体の生成コスト
コード量が多くなってしまう。
- パラメータが4つ以上など多い場合にのみ使う
- ただし、成長した後も考慮する

item 3 : private のコンストラクタか enum 型でシングルトン特性を強制する

シングルトンにするとテストが大変。

実現方法

その1
- private コンストラクタ
- public static final のクラスフィールドに初期化
- API からシングルトンであることが明確
その2
- private コンストラクタ
- private static final のクラスフィールドに初期化
- getter を public にする
- APIを変えることなくあとでシングルトンを変更することができる
  - 例えばスレッドレベルで別々のインスタンスを返したりとか
- ジェネリックのシングルトンファクトリをかける？
- メソッド参照を使える

private なコンストラクタであっても AccessibleObject.setAccessible メソッドを使ってリクフレクションにより呼び出すことができてしまう。防ぐためにはコンストラクタでチェックして例外を throw する。

Serializable にするためには注意が必要。
- 全てのインスタンスフィールドに transient を宣言する
- readResolve() メソッドを提供する

enum を使ってシングルトンを提供すると便利。Serializable やリフレクションの問題は存在しない。ただし、あるクラスを継承したシングルトンは enum にはできない。

item 4 : private のコンストラクタでインスタンス化不可能を強制する

static なフィールドとメソッドのみを提供したいとき。関数をグルーピングしたいときなどに使える

インスタンス化することは想定していないことを明示する

public class UtilityClass {
  private UtilityClass() {
    throw new AssertionError();
  }
}

コメントをつけないと混乱する可能性がある

final について

https://qiita.com/ryo2132/items/eb9a63f2b107c1d6b25c

class の final
- 継承の禁止
method の final
- override の禁止
field の final
- 再代入の禁止

item 5 : 資源を直接結びつけるよりも依存性注入を選ぶ

静的なユーティリティクラスとシングルトンは、下層の資源でパラメータ化された振る舞いを持つクラスに対しては不適です。

コンストラクタで依存先を注入する。

メリット

テストが容易になる。
依存先を共有できる。

依存資源としてファクトリオブジェクトを渡す応用もある。Java にはファクトリとして Supplier<T> インターフェースがある。

item 6 : 不必要なオブジェクトの生成を避ける

immutable であると再利用しやすい。

文字列の初期化で new String() で生成するとオブジェクト生成コストがかかる。単に ”hello” と生成すると同じオブジェクトを使い回す。

static factory method と相性がいい。初期化コストが高いものはキャッシュして使い回す方がいい

lazy initialization はそれほど効果がないらしい？

自動ボクシング (autoboxing) : primitive がボクシングされたデータ型に変換されてしまうこと

long は Long がボクシングしている Long に long を足そうとすると、long が Long に変換されてオブジェクト生成が発生する。

ただし、JVM でのオブジェクト生成のコストは小さいものと考えたほうがいい。初期化処理が小さいオブジェクトは、自分でオブジェクトプールを管理するより JVM に任せたほうがいい。

item 50 では防御的コピーを取り上げる。これはこことは真逆。

item 7 : 使われなくなったオブジェクト参照を取り除く

obsolete reference : 使われなくなった参照

連鎖的に参照が残ってしまって大きなメモリリークに繋がることも。

解決策：使い終わったら明示的に null を代入して参照を外す。

メモリ管理が間違っていたときに NullPointerException で早期に発見できる。

通常は null を設定するのではなく変数をスコープ外に出すだけで十分。逆に null を代入して回るのは複雑になりがち。

原因

クラスが独自のメモリを管理している
キャッシュ
- 外部でキーを保持するときは WeakHashMap が有効。
- 古いものから削除する (LinkedHashMap.removeEldestEntry())
リスナーやコールバック
- 登録したコールバックを解除する API がないとき
- weak reference で解決

Heap profiler などを使って見つけることになる。

item 8 : ファイナライザとクリーナーを避ける

finalizer は予想不可能であり危険。クリーナーは Java 9 から導入された finalizer の代わり。クリーナーは独自のクリーナースレッドを指定できる。メモリ以外の資源の回収のためには、try-with-resources や try-finally を使う。

ファイナライザのダメなところ

実行タイミングは予期不能。
実行は保証されていない。
キャッチされない例外は握り潰される
実行には深刻なパフォーマンスのペナルティがある
ファイナライザ攻撃 : セキュリティ問題
- 回避するためには、クラスに final の何もしないファイナライザを実装する

ファイルなどの資源の終了処理は、 AutoCloseable をクラスに実装する。ただし、2重 close を防ぐ（ IllegalStateException ）などの対応は必要。これを try-with-resources ブロックから使ってもらう。

ファイナライザやクリーナーの使い道

close メソッドの呼び忘れに対するセーフティネット。ただしコスト的に見合うかを検討する必要はある。

ネイティブピア（Java が管理しないネイティブのオブジェクト）の開放。重要性が高くない場合は finalizer を使うのもあり。

クリーナーを使うときは、循環参照を避けるために Runner を static なクラスにする必要がある。

item 9 : try-finally よりも try-with-resources を選ぶ

try-finally はうまくいかない。2つ目のリソースがあるとネストしてしまい見通しが悪い。

Java 7 で try-with-resources 文が導入された。 AutoCloseable インターフェイスを実装すると対応できる。

try (InputStream in = new FileInputStream(src);
     OutputStream out = new FileOutputStream(dest)) {
  // ...
}

複数のリソースの確保にも対応している。ログの隠蔽問題についてもスタックとレースに隠蔽された表記が追加されるため、わかりやすくなる。

kawasin73 commented 4 years ago

3章すべてのオブジェクトに共通のメソッド

Object のオーバーライドされる前提のメソッド

equals
hashCode
toString
clone
finalize

item 10 : equals をオーバーライドするときは一般契約に従う

オーバーライドしないときはインスタンス自身とのみ equals は true になる

オーバーライドする必要のない場合

クラスの個々のインスタンスが本質的に一意である
論理的等価性 (logical equality) の検査を提供する必要がない
スーパークラスが既に equals をオーバーライドしておりこの振る舞いが正しい
クラスがプライベートであり equals が呼ばれないことがわかっている

equals は論理的等価性の概念を持っているときに実装する。一般には値クラス

equals メソッドが実装する同値関係

反射的 : x.equals(x) = true
対称的 : x.equals(y) = true <=> y.equals(x) = true それ以外は false
- case insensitive な string と普通の string の比較の場合。型が同じかを検査する
推移的 : x.equals(y) = true, y.equals(z) = true => x.equals(z) = true
整合的 : x.equal(y) の結果は何度呼び出しても一貫している
- 外部の資源に依存していると一貫性がなくなったりする
null 以外のオブジェクトは equals(null) に false を返す
- NullPointerException ではなく false を返す
- 明示的に null チェックをするよりも、instanceof で弾いた方が簡潔

インスタンス化可能なクラスを拡張して equals の契約を守ったまま値要素を追加する方法はない

つまり、equals を一回 override したクラスを継承してもう一度 override はできないということ。

回避策としては継承を使わずにコンポジションを使う。

java.sql.Timestamp は java.util.Date を拡張しているがここでの対称性を守れていないので混ぜると危険。

高品質の equals メソッドのコツ

自分自身のオブジェクトであるかを == によって検査すると、高コストな比較処理を省くことができる
型の検査のために instanceof を使う
正しい型にキャストする
significant (意味のある) フィールド同士を比較する
- float, double 以外は ==
- Float.compare(float, float), Double.compare(double, double)
- 比較の順序はコストが小さくなるようにする
- lock フィールドなどの論理的状態の一部でないものは比較しない

対称的、推移的、整合的の３つを保証する単体テストを書く

注意事項

equals を override するときは hashCode をオーバーライドする
equals の引数は Object のまま

大抵は、Google の AutoValue を使えば自動生成できる。

TODO: AutoValue

item 11 : equals をオーバーライドするときは、常に hashCode をオーバーライドする

HashMap や HashSet でうまく動かなくなる

hashCode の一般契約

equals の比較に利用される情報に変更がなければ hashCode は一貫した値を返す
- 再起動した時に同じである必要はない
equals が true なら hashCode は同じ
equals が false の時に hashCode が必ず異なっている必要はない

ハッシュ化の方法はいくつかある。31 を掛ける方法など。(31 の掛け算は JVM では最適化されてたりする) 衝突の少ないハッシュ関数は、com.google.common.hash.Hashing を参照。 Objects.hash() 関数はパフォーマンスは良くないが簡単に利用できる。計算コストが高い場合はキャッシュ化も考える

hashCode の内部実装に依存させないために仕様を定義しない。それによって利用側に柔軟性を強制できる

item 12 : toString を常にオーバーライドする

toString には全ての興味のある情報を含めるべき。

toString の結果の形式を定義する場合は、文字列からインスタンスを生成する static ファクトリメソッドを作ると便利。一方で定義すると変更できなくなってしまう。形式を定義する場合でもしない場合でもその旨をコメントに明記する。

item 4 の static ユーティリティクラスには不要。enum もデフォルトのものが優秀なので新たに定義する必要はない。

item 13 : clone を注意してオーバーライドする

Cloneable インターフェイスはあるが、失敗している。clone は Object の protected メソッドである。が、clone は使われているので理解する必要がある。

慣習で、clone は super.clone を呼び出して得るべき

clone の返り値の型はそのサブクラスにできる。（共変戻り値型 / covariant return type）

super.clone は、Cloneable を実装していない時には、CloneNotSupportedException を発生させるので、try-catch が必要。ただし、catch はされないことが前提となる。

内部で可変な参照を持っているときは、参照先も clone することを気をつける。再代入になるので final が使えない

public な clone メソッドを作る場合は、throw も外すと良い

他の手段として、コピーコンストラクタ、コピーファクトリがある。この形式では HashSet を TreeSet に変換する変換コンストラクタなども実現できる。

配列は、clone を使うべきであるが、それ以外では推奨されない。

item 14 : Comparable の実装を検討する

Comparable インターフェイスには、compareTo がある。順序を表し、ソートなどの既存のアルゴリズムに簡単に統合できるようになる。

一般契約

オブジェクトが指定されたものよりも小さい、等しい、大きいに応じて、負の整数、ゼロ、正の整数を返す。比較できない場合は、ClassCastException をスロー
equals でいう反射的、対称的、推移的な要件を満たす

クラスをまたがって動作しないので equals に比べれば楽。equals と同じように継承して override するとうまく動かない。

Float や Double などの基本型では、 <, > ではなく compare を使う

コンパレータ構築メソッド（comparator construction method）を使うと簡潔に実装できる。

引き算で compareTo を実装することは整数のオーバーフローや浮動小数点数算術の副作用の危険があるため推奨されない。Integer.compare か、Comparator を使う。

kawasin73 commented 4 years ago

4章クラスとインターフェース

item 15 : クラスとメンバーへのアクセス可能性を最小限にする

情報の隠蔽、カプセル化を実現する。外部に公開することが少ないと、内部の実装を変更しても外部への影響が小さくなる（最適化が容易になる）。

トップレベルのクラス、インターフェイスでは、public をつけた時のみパブリックになる。それ以外はパッケージプライベート。

パッケージプライベートなクラスが１つのクラスからのみ利用されている場合は、ネストしたクラスにすることで可視性を狭められる。

private
パッケージプライベート（何もつけない）
- パッケージ内からはアクセス可能
protected
- public なクラスの protected は外部に公開されているので後方互換性の義務が発生する
public

基本的に全て private にして、うまくいかない時に適切なレベルを選ぶ。 Serializable を実装するとプライベートなフィールドが公開 API の中に漏れてしまう。

サブクラスのメソッドはスーパークラスの可視性を狭めてはいけない。コンパイルエラーになる。

テスト容易性のために private をパッケージプライベートにしてもいいが、それ以上の公開は許されない。

インスタンスフィールドは public にするべきではない。外部から変更されてスレッドセーフではなくなる。また型の変更ができなくなる

static フィールドも同様に public にするべきではないが、大文字+スネークケースで構成される定数は例外

配列の中身は可変であることに注意。基本的に public にするべきではない。

Java 9 からはモジュールシステムが追加されている。モジュールはパッケージをグループ化する仕組み。モジュール内の公開されていない public と protected はモジュール外からはアクセスできない。

item 16 : public のクラスでは、public のフィールドでハンク、アクセッサーメソッドを使う

final であれば害は少ない。

item 17 : 可変性を最小限にする

Immutable なクラスを提供するための５つのクラス

オブジェクトの状態を変更するためのメソッドを提供しない
- mutator を作らない
クラスを拡張できないようにする。サブクラスはない
- final で実現できる
- コンストラクタを private にして static ファクトリメソッドを提供
  - パッケージ外からはプライベートになる。
  - 複数の実装クラスを提供でき、柔軟性が上がる。
- サブクラスであるときは防御的コピーをせざるをえない
全てのフィールドを final にする
全てのフィールドを private にする
可変コンポーネントに対する独占的アクセスを保証する

操作の結果は関数の返り値として新しいオブジェクトが生成されて返ってくる。関数的な方法。手続き的な方法ではない。関数名が動詞ではなく、前置詞である。

可変クラスは、状態遷移をするため管理が複雑になる。不変クラスはスレッドセーフになる。不変で共有できるため、キャッシュもできる。

コピーしても全く同じものがコピーされるだけなので意味がない。防御的コピー、clone メソッド、コピーコンストラクタは必要ない。

不変クラスの実装で内部表現を共有することもできる。

欠点は、個々の異なる値に対して別のオブジェクトを生成してしまうこと。コストの大きな変換処理ではステップごとにオブジェクト生成してしまう。解決策１：複数ステップを１ステップにまとめた変換メソッドを提供解決策２：public の可変コンパニオンクラス（StringBuilder など）

パフォーマンスのために、externally visible な変更をしないという制約のもとで上の５つの規則を緩めることができる。（内部での一貫性のあるキャッシュなど）

基本的にフィールドは、private final にすることが望ましい。

item 18 : 継承よりもコンポジションを選ぶ

パッケージをまたがって、具象クラスから継承することは危険。メソッド呼び出しとは異なり、継承はカプセル化を破る。サブクラスはスーパークラスの実装に依存するため、スーパークラスの実装の変更に弱い。新しいメソッドがスーパークラスに追加された時に実装もれが発生したりする。

コンポジションにして、メソッド呼び出しを forwarding する。

forwarding クラスを実装すると使いまわせる。

用語：wrapper, decorator pattern, delegation

ラッパークラスの欠点：callback framework には向いていない。子クラスはラッパーの存在を知らないので自分自身を登録してラッパーを回避してしまう。（SELF 問題）

メソッド呼び出しのオーバーヘッドやラッパーのオーバーヘッドは大きな問題にはならない。

subclass は subtype である。is-a 関係が成り立っていない時はコンポジションを使う。Java では Stack-Vector や Properties-Hashtable は間違っている。

継承によってスーパークラスの API を引き継ぐことになる。APIが欠陥を持っているときにその欠陥が伝播させられる。

item 19 : 継承のために設計及び文書化する、でなければ継承を禁止する

オーバーライド可能なメソッドの self-use を文書化する
- final でない、public, protected なメソッド
Javadoc の @implSpec に実装要件を記述する。
- メソッドが何をするのか、どのように行うかを記述。カプセル化を破ってしまうことにはなる
protected を使って、内部動作へのフックを提供する
継承のために設計されたクラスをテストするには、３つ程度サブクラスを書いてみる。
- 後方互換性のために一度 public にしたものは変えられなくなるので慎重にテストする
スーパークラスのコンストラクタはオーバーライド可能なメソッドを呼び出してはいけない
- オーバーライドされた時にサブクラスのコンストラクタは完了していないのでエラーになる可能性がある
継承前提のクラスは、Cloneable と Serializable を継承すると大変
文書化されていない、継承前提に設計されていない場合は、サブクラス化を禁止する。
- final
- private コンストラクタ

item 20 : 抽象クラスよりもインターフェースを選ぶ

Java 8 で default メソッドが導入され、abstract クラスと interface は同じ機能を持つ。ただし、Java は単一継承なので抽象クラスは使いづらい。

interface は既存のクラスに簡単に追加できる。
ミックスインの実現に理想的
interface は階層を持たない型フレームワークの構築ができる
ラッパークラスでも使える
ただし、default メソッドの利用には制限もある
- Object の equals などのメソッドにデフォルトメソッドを提供できない
- interface はインスタンスフィールドや public でない static メンバーは持てない

interface の制約を回避するために、抽象骨格実装（skeletal implementation）クラスは interface と abstract クラスの長所を組み合わせる。Template Method パターン。命名の慣習として、Abstract<Interface_name> がよく使われる。

item 21 : 将来のためにインターフェースを設計する

Java8 より前は default メソッドがなかったので interface へのメソッドの追加は即コンパイルエラー。デフォルトメソッドでメソッドの追加は可能になったが、全ての継承された先において安全な実装であるとは言えない。

デフォルトメソッドによって interface へのメソッドの追加は可能であるが、避けるべきで、最初に慎重に設計する方が大事。

item 22 : 型を定義するためだけにインターフェースを使う

定数インターフェイス（メソッドのないインターフェイス）はアンチパターン。インターフェイスの趣旨に反しているから java.io.ObjectStreamConstants は例外

定数は、クラスや enum、ユーティリティクラスなどで定数は提供するべき。

数値の中の _ は無視されるから見やすくするために使うのが良い。

item 23 : タグ付きクラスよりもクラス階層を選ぶ

タグ付きクラスは、内部に type などの具象を表すフラグを持っておき、switch 文などで動作を分岐するようなクラス。サブタイプを使うことでわかりやすく、効率的になる。

item 24 : 非 static のメンバークラスよりも static のメンバークラスを選ぶ

nested class は4種類

static member class
- 他の static なものと同じ可視性。
nonstatic member class
- enclosing instance と暗黙的に関連づけられ、インスタンスのメソッドやフィールドにアクセスできる
- インスタンス化には enclosing instance が必須。インスタンス化後に関連づけは変更できない。
anonymous class
- 小さな関数オブジェクトで使われていたが、現在ではラムダを使う方がいい
- 10 行以下の小さな実装であることが可読性が良い。
- static ファクトリメソッド内の実装で使うくらい
local class
- 4つの中で一番使われない。
- ローカル変数と同じスコープで宣言する

item 25 : ソースファイルを単一のトップレベルのクラスに限定する

Java の仕様としては可能だが、重複定義された時の挙動は未定義。わざわざややこしいことはしない！

kawasin73 commented 4 years ago

5章ジェネリックス

Java 5 以降でジェネリクスが使えるジェネリクスがキャストよりもいい点は、エラーが実行時ではなくコンパイル時に発生すること

item 26 : 原型を使わない

１つ以上の型パラメータを持つクラスやインターフェイスを、ジェネリッククラス、ジェネリックインターフェイスと呼ぶ。まとめてジェネリック型。

List<E> -> List<String> では

formal type parameter : 仮型パラメータ
- E
actual type parameter : 実型パラメータ
- String
raw type : 原型
- List
- ジェネリックスが導入される前のコードとの互換性のためにある。ただしこれだけで利用することは型が無視されるので推奨されない。
- 原型とジェネリクスの相互互換性のために erasure (イレイジャ) を使う

要素型がわからないような場合は、原型ではなく、unbounded wildcard type (非境界ワイルドカード型) を使う。 List<?>

Collection<?> には null 以外のオブジェクトを入れることができない。read only? によって型を守っている？

クラスリテラルでは原型を使わないといけない。クラスリテラル (List.class) にパラメータ型は使えない。

instanceof でも原型を使うことが望ましい。ただし型検査をした後は、Set<?> などの非境界ワイルドカード型にキャストして使う。

item 27 : 無検査警告を取り除く

頑張って無検査警告を解決していこう。

diamond operator (ダイアモンド演算子) <> で型推論がされる。

確実に安全で警告を取り除けないときは、 @SuppressWarnings("unchecked") アノテーションをつける。ただし最小のスコープで。return 文は宣言ではないのでつけられないから、ローカル変数を宣言してつける。コメントをつけることも重要。

item 28 : 配列よりもリストを選ぶ

配列は covariant (共変) である。Sub[] が Super[] のサブクラス
- 具象化されている。（reified）
ジェネリックスは invariant (不変)。
- イレイジャで実装されている (erasure)。コンパイル時にのみ型制約を強制。実行時には型情報が破棄されている。これにより原型と互換性がある

ジェネリック配列の生成はコンパイルエラーになる。可変長引数では配列が生成されるので注意が必要。解決策もある。

配列よりもコレクション型の List を使った方がいい。

配列とコレクション型を一緒に使おうとするとコンパイルエラーや警告が発生する。その時は配列をリストに変換すると良い。（パフォーマンスは若干劣化するが安全になる）

item 29 : ジェネリック型を使う

Objectを扱いキャスト前提であるクラスを後から互換性を保ったままジェネリック型に変換できる。

Object 型をパラメータ型に置き換える。エラーに対処していく。 E[] の生成でエラーになるときは、Object[] を生成して E[] にキャストするか、Object[] で保持して利用時に E にキャストするか。

ジェネリック型の中で private であれば配列を使うのもあり。

型パラメータに基本型（int, float など）を使うことはできず、ボクシングした型を使う

item 30 : ジェネリックメソッドを使う

メソッドでの型パラメータの宣言は、メソッドの修飾子と戻り値型の間に。

ジェネリックシングルトンファクトリ : 恒等関数の生成などで使い回しを表現するときに便利

recursive type bound (再帰型境界) : <E extends Comparable<E>>

item 31 : API の柔軟性向上のために境界ワイルドカードを使う

パラメータ化された型は不変である。時々これが不自由になる時がある。

bounded wildcard type (境界ワイルドカード型) : Iterable<? extends E> E のサブクラスをパラメータ型にとる Iterable, Iterable<? super E> E が継承しているスーパークラスをパラメータ型にとる Iterable

PECS : producer - extends , consumer - super Get&Put 原則

注意点：戻り値型として境界ワイルドカード型を使わない。

明示的型引数（Java 8 より前では必要）

Set<Number> numbers = Union.<Number>union(integers, doubles);

型パラメータがメソッド宣言中に１度しか現れない時は、ワイルドカードで置き換えることができる。（API がシンプルになる）一方で、List<?> へは代入ができないので型パラメータを使った private メソッドで処理をする。（逆に複雑なような気もする。）それによって API は綺麗になる。広く使われるような API では特に有効

item 32 : ジェネリックスと可変長引数を注意して組み合わせる

ジェネリックスと可変長引数は Java 5 で同時に追加されたが協調しない。

本来はジェネリックの可変長引数はコンパイルエラーにするべきだが、利便性が高いため Java はこの不整合を受け入れている。

@SafeVarargs アノテーションをメソッドにつけることで型安全であることを明示する。パラメータ化された型の可変長引数を持つメソッドでは必ずつけるようにする。 static か final か private でのみ使える。オーバーライドされないために

安全であるためには以下が必要

メソッドがパラメータを上書きしない
パラメータ配列への参照をエスケープさせていないつまり、パラメータ配列を参照の受け渡しのためだけに使えばセーフ。

ジェネリクスのパラメータ配列はコンパイル時は Object[] に割り当てられるため、バグの温床になる。

代替手段として、可変長パラメータではなくリストを受け取るようにする。

item 33 : 型安全な異種コンテナを検討する

ジェネリクスの主な用途 : Set や Map などのコレクション、ThreadLocal, AtomicReference などの単一要素コンテナ

クラスリテラル (Class<String> , String.class で得られる)をキーとして使う。

型安全異種コンテナ（typesafe heterogeneous container）

public class Favorites {
  private Map<Class<?>, Object> favorites = new HashMap<>();
  public <T> void putFavorite(Class<T> type, T instance) {
    favorites.put(Objects.requireNonNull(type), instance);
  }
  public <T> T getFavorite(Class<T> type) {
    return type.cast(favorites.get(type));
  }
}

type.cast() で動的キャストが可能。この Favorites は原型を使うことで壊れるが、無検査警告がコンパイル時に出るので気づける。put 時に type.cast(instance) で検査することで実行時型安全検査ができ、原型に対処できる。

具象化不可能型には使えない。List<String>.class は文法エラー。

境界型トークンを使うことで型を制約することができる。 Class クラスは asSubclass でキャストできる。

kawasin73 commented 4 years ago

6章 enum とアノテーション

item 34 : int 定数の代わりに enum を使う

列挙型 (enumerated type) : 固定数の定数から成り立つ型

enum が Java に追加される前は、int enum パターンが使われていた。しかし、型安全ではない、変更に弱い、デバッグが辛い、名前空間がないなどのデメリットが多い。

String enum パターンもある。ハードコードされると typo に気づけないなどさらに悪手。

大人しく enum 型を使おう。

enum はクラスとして実装されており、それぞれの値はシングルトンの public static final 定数。別の値を紛れ込ませることができない。

enum にはメソッドを追加できる。コンストラクタを定義してフィールド値を設定することもできる。ただし immutable にするのが望ましい。

values() メソッドで宣言されている順序で配列を受け取れる。

値を減らした時は、それを使っていないクライアントプログラムは問題ないが、使っているプログラムはリコンパイルでエラーになる。

値によって振る舞いを変えたいときに switch(this) 文で切り替えることは、throw AssertionError が必要な上に変更に弱い。constant-specific class body (定数固有クラス本体) を持つことで定数ごとにメソッドをオーバーライドして定義する。constant-specific method implemetation (定数固有メソッド実装)と呼ばれる。オーバーライドされるメソッドは抽象メソッドとして enum 内に定義する。

enum は定数名を定数自身へ変換する valueOf(String) メソッドを自動生成する。 toString を実装するなら fromString も実装することを検討する。

enum のコンストラクタは定数変数を除いて static フィールドへアクセスできない。（初期化されていないから）enum のコンストラクタから他の enum にアクセスできないので注意。

複数の重複する振る舞いがあるメソッドは定数固有メソッド実装では冗長。 strategy enum (戦略 enum) を使うとエレガントに解決できる。同じ振る舞いをするグループを別の enum で定義してそちらに処理を移譲し、元の enum のデータ定義でグループを定義する。

外部の enum などに対しては switch 文を使う。

item 35 : 序数の代わりにインスタンスフィールドを使う

enum の実体は int 値と関連づいており、ordinal() メソッドで取得できるが、これに依存すると保守が大変。代わりにインスタンスフィールドに定義することで保守が楽になる。

item 36 : ビットフィールドの代わりに EnumSet を使う

ビットフィールドは、ビット和操作によって集合を表せるので便利だが、int enum 以上のデメリットがある。ビット幅を固定するので変更ができない、printable でない。

java.util.EnumSet が解決する。Set インタフェースを実装している。内部ではビットベクトルを保持している。

java 9 の時点では immutable な EnumSet に対応していないのが弱点

item 37 : 序数インデックスの代わりに EnumMap を使う

配列のインデックスに ordinal() の値を使うのは良くない。配列はジェネリックスとの相性が悪い。数値はラベルを手動でつけないといけない。誤った int 値の利用は実装者の責任。

java.util.EnumMap では enum をキーに使える。EnumMap は内部的には配列を使っているので十分速い。使うときはコンストラクタに Class オブジェクトを渡す必要がある。

ストリーミングでは、groupingBy に EnumMap を組み合わせることで最適化できる。

item 38 : 拡張可能な enum をインタフェースで模倣する

enum 型を外部から直接拡張するすることはできないし、継承して拡張することもできない。

共通した interface を実装した enum を用いることで同じ API で使えるため enum を拡張できるようになる。

enum の継承はできないのでメソッドの共有はできないが、interface のデフォルトメソッドとして定義することで重複を防ぐことができる。

item 39 : 命名パターンよりもアノテーションを選ぶ

命名パターンの欠点

typo で何も行われない（明確に失敗しない）。気づけない可能性がある。
適切なプログラム要素にだけそれらが使われるようにする方法がない？
パラメータを渡す良い方法がない

アノテーションで解決する。JUnit はリリース 4 から採用。

メタアノテーション：アノテーションに対するアノテーション

Retention
- RetentionPolicy.RUNTIME : そのアノテーションが実行時に保持される
Target
- ElementType.METHOD : そのアノテーションがメソッドに対してのみ付与できる

パラメータなしの static のメソッドに対してのみ付与することは強制できないためコメントに書いている。強制するためにはアノテーションプロセッサを書く必要がある。(javax.annotation.processing)

パラメータを持たないアノテーションは、マーカーアノテーション。

リフレクションができる。Method.invoke() でメソッドを実行。実行中のエラーは InvocationTargetException に Wrap されて送出される。

アノテーションインタフェースに value() を指定することでパラメータを受け取れる。コンパイル時にはアノテーションパラメータは正しかったけど、実行時に例外型を表すクラスファイルがなかった場合、TypeNotPresentException が発生する。アノテーションパラメータは配列にすることで複数受け取れる。設定する時は単一要素を指定することもできるし、{}でカンマ区切りを囲って複数指定もできる。

@Repeatable にコンテナアノテーション型を指定することで同じアノテーションを同時に複数設定できるようになる。 getAnnotationsByType() では正しく振舞うが、isAnnotationPresent() は単一のアノテーション型をコンテナアノテーション型を区別し、コンテナアノテーション型であるかどうかをチェックするので正しく振る舞わない。

item 40 : 常に Override アノテーションを使う

@Override をつけると、オーバーライドではなくオーバーロードしてしまったバグにコンパイラが気づく。

オーバーライドするメソッドが抽象クラスの抽象メソッドの場合は Override をつける必要はない。インターフェイスのメソッドの実装に @Override をつけるのも良い。

item 41 : 型を定義するためにマーカーインタフェースを使う

マーカーインタフェース : メソッドを持たない interface

マーカーインタフェースのマーカーアノテーションにない長所

マークされたクラスのインスタンス実装している型を定義する
- 型によるコンパイル時のチェックが可能
- Serializable インターフェースがお手本だが、ObjectOutputStream.write メソッドは
マーカーインタフェースの方がより厳密に型を制限する

マーカーアノテーションの長所

アノテーション機構を使っている
クラスやインタフェース以外の要素に適用できる

kawasin73 commented 4 years ago

7章ラムダとストリーム

Java 8 で関数型インタフェース、ラムダ、メソッド参照が追加された

item 42 無名クラスよりもラムダを選ぶ

単一の抽象メソッドを持つインターフェイスを無名クラスとして使って関数オブジェクトを表していた。これを関数型インタフェースと呼ぶ。無名クラスはラムダ式で置き換えることができる。

ラムダでは型は省略できる。型を明示することでプログラムが明瞭になるわけでなければ型は省略するのが良い。コンパイラが型推論できなかった時に型をつける。

item26 : 原型を使わない
item29 : ジェネリック型を選ぶ
item30 : ジェネリックメソッドを選ぶこれらはラムダ式で型推論が正しく動くために重要

enum の定数固有クラス本体でのメソッド定義よりも、ラムダを使った enum インスタンスフィールドの方が簡潔に表せる。ただし、式の中身が簡潔な場合。また、enum のコンストラクタからは enum のインスタンスフィールドにアクセスできない。

ラムダでは1行が理想。長くても３行。

ラムダは抽象クラス、複数のメソッドを持つインタフェースには対応していない。無名クラスが対応している。ラムダでの this はエンクロージングインスタンスを表す。

ラムダはシリアライズを確実に行えない。

item 43 : ラムダよりもメソッド参照を選ぶ

メソッド参照はラムダよりも簡潔な関数オブジェクト生成方法。ラムダにできなくてメソッド参照にできることはない。

メソッド参照の種類

メソッド参照の種類	例	同等のラムダ
static	`Integer::parseInt`	`str -> Integer.parseInt(str)`
バウンド	`Instant.now()::isAfter`	`Instant then = Instant.now(); t -> then.isAfter(t)`
アンバウンド	`String::toLowerCase`	`str -> str.toLowerCase()`
クラスコンストラクタ	`TreeMap<K,V>::new`	`() -> new TreeMap<K,V>()`
配列コンストラクタ	`int[]::new`	`len -> new int[len]`

item 44 : 標準の関数型インタフェースを使う

ラムダなどの関数オブジェクトを受け入れるために独自のインタフェースを定義するのではなく、標準の java.util.function パッケージに定義してあるインタフェースを利用する。

全部で 43 個定義されているが、以下の 6 個の基本インタフェースを覚えれば応用できる

インタフェース	関数のシグニチャ	例
`UnaryOperator<T>`	`T apply(T t)`	`String::toLowerCase`
`BinaryOperator<T>`	`T apply(T t1, T t2)`	`BigInteger::add`
`Predicate<T>`	`boolean test(T t)`	`Collection::isEmpty`
`Function<T,R>`	`R apply(T t)`	`Arrays::asList`
`Supplier<T>`	`T get()`	`Instant::now`
`Consumer<T>`	`void accept(T T)`	`System.out::println`

それぞれに基本データ型の int long double について派生型がある

2 個の引数をとる BiPredicate<T,U>, BiFunction<T,U,R>, BiConsumer<T,U> がある。

Supplier には boolean を返す BooleanSupplier がある

ボクシングされた基本データの関数型インターフェースではなく、基本データ型の関数型インターフェイスを使うことが望ましい。大量のデータをボクシングすることはパフォーマンスに良くない

あえて標準の関数型インタフェースを使うのではなく独自に宣言した方がいい場合（例 Comparator<T> と ToIntBiFunction<T,T>）

広く使われて説明的な名前から恩恵を得られる
インタフェースに関連づけられた強い制約を持っている
特別なデフォルトメソッドから恩恵を得られる

@FunctionalInterface アノテーションによって関数型インタフェースであることを明示できる

関数型インタフェースを使ったメソッドを定義するときは、同じ引数の位置に関数型インタフェースを定義するメソッドを複数定義すると使う側が不便。

item 45 : ストリームを注意して使う

ストリーム : データ要素の有限あるいは無限なシーケンス
ストリームパイプライン : データ要素に対する複数ステージの計算

ストリームパイプラインには中間操作と終端操作がある。

ストリームパイプラインは遅延して評価される（lazily）。評価は終端操作が呼び出されるまで開始されないし、終端操作を完了させるために必要のないデータ要素は計算されない。

ストリームパイプラインは parallel メソッドを呼び出すと並列実行される。

ストリームを乱用することで逆に読みにくくなる。
ラムダには型をつけないのでパラメータの命名は重要。
ストリームパイプラインの可読性にとって、ヘルパーメソッドを使うことはループのコードよりも重要である。パイプラインには一時変数がないから。
char 値を処理するためにストリームは使うべきではない
全てのループをストリームに変換するのではなく、意味がある時にだけストリームを使う

コードブロック（ループ）にできてラムダ（関数オブジェクト）にできないこと

スコープ外のローカル変数を読みだしたり修正する
return, break, continue

ストリームが得意なこと

均一に要素のシーケンスを変換する
要素のシーケンスをフィルターする
単一操作を使って要素のシーケンスをまとめる
要素をグルーピング
要素の検索

ストリームでは値を別の値にマッピングすると古い値は失われるので複数のステージの値を使う処理には向いていない。元の値を復元できる場合は対処できる。

ストリーム要素の変数名は複数名詞が望ましい。

ぶっちゃけ、ループを使うかストリームを使うかは好み

item 46 : ストリームで副作用のない関数を選ぶ

Collectors を使おう！

純粋関数 : 結果が入力だけに依存している関数

forEach はストリームの計算結果を表示する処理に使うべき

collect() によって Collection に変換できる。コレクターは toList(), toSet(), toCollection(collectionFactory)。最後のは独自のコレクションを設定するために使う。コレクターに様々な条件を定義して Collection を生成する。

読みやすくするために、Collectors の全てのメンバーを static import するのが慣習

Collectors の 36 このメソッドのほとんどはマップへ集約するためのもの。

toMap() は一番シンプルだがキーが重複した時に IllegalStateException をスローする。それを防ぐために様々なマージ方法がある。 3つの引数がある場合は、3つ目の BinaryOperator がマージ結果を返す。 4つの引数がある場合、4つ目の引数は特定のマップ実装の利用を指定する。

groupingBy()は分類関数に基づくカテゴリーごとにグループ化したマップに変換する。

引数が１つのシンプルな場合、マップの値はリスト。値を変えたい時は、ダウンストリームコレクターを第2引数に指定する。counting() は個数に変換する。ただし、counting() はダウンストリームコレクターとしての利用のみを想定している。そのほか様々なダウンストリームコレクターがある。第3引数にはマップファクトリを指定できる。

item 47 : 戻り値型として Stream よりも Collection を選ぶ

Stream は for-each ループとも合わせて利用されることを念頭におく必要がある。 Stream は Iterable に定義されるメソッドを全て定義しているので、 Iterable を extend することができない。そのため、for-each との連携は複雑になる。

public static <E> Iterable<E> iterableOf(Stream<E> stream) {
  return stream::iterator;
}

逆に Iterable から Stream に変換することも面倒臭い

public static <E> Stream<E> streamOf(Iterable<E> iterable) {
  return StreamSupport.stream(iterable.spliterator(), false);
}

Collection インタフェースは Iterable のサブタイプでかつ、stream メソッドを持っているので、Stream と for-each の両方に対応できる。 public メソッドの返り値としては Collection が好ましい。

ただし、シーケンスがメモリに収まらないような場合には AbstractList を利用してコレクションを実装することも検討する。

コレクションが無理なら自然な方を返す。

item 48 : ストリームを並列化するときは注意を払う

CPU 使用率が跳ね上がって高止まりして処理は進まない : 活性エラー (liveness failure)

パイプラインの並列化がパフォーマンスの向上につながらない場合

ソースが Stream.iterate
中間操作 limit が使われている

並列で実行する場合は余分に要素を処理して必要のない結果は捨てることで limit と共存する

見境なくストリームパイプラインを並列化しない。

並列化によるパフォーマンスの向上が得られるのはサブレンジへの分割が低いコストでできる以下の要素

ArrayList, HashMap, HashSet, ConcurrentHashMap のインスタンス
配列
int の range
long の range 分割は spliterator で抽象化される

また、これらの要素は順次処理で参照の局所性がある

終端処理が重い、順次行われる場合は並列化の恩恵は限定的。

リダクション (reduction) が最善の終端処理 : reduce, min, max, count, sum
短絡 (short-circuting) も適している : anyMatch, allMatch, noneMatch
可変リダクション (mutable reduction) は適していない : collect
- コレクションをまとめるオーバーヘッドが高くつくから

独自の Stream, Iterable, Collection の実装で並列化のパフォーマンスを上げるためには、 spliterator メソッドをオーバーライドしてチューニングする

Steram の仕様に厳密に従わなければ並列化した時の振る舞いが不安定になったりする。 forEach の代わりに forEachOrdered を使うと並列のストリームを遭遇順序 (encounter order) で走査することを保証できる

ストリーム中の要素数と１要素ごとに実行されるコードの行数の積が 10 万以上である時に並列化をするメリットがある。

並列化はあくまでも最適化であるため、最適化前と後で性能調査をする。また、実行は共有された fork-join プールを使うため、詰まると周りに迷惑をかける

乱数のストリームの並列化なら、ThreadLocalRandom ではなく、SplittableRandom を使う。

kawasin73 commented 4 years ago

8章メソッド

item 49 : パラメータの正当性を検査する

パラメータの値の制約をメソッドの初期段階で確認するエラーを発生させる。発生させるエラーは、IllegalArgumentException, IndexOutOfBoundsException, NullPointerException が多い。

public と protected の場合はスローされる例外を Javadoc の @throws に明記する。

NullPointerException などの全てのメソッドで発生しうる例外についてはクラスレベルで宣言することで、メソッドごとに重複して宣言しなくてもいい。 @Nullable アノテーションは標準ではなく、複数のアノテーションが同じ目的で使われることがあるのでオススメされない

java.util.Objects の便利な検査メソッド

Objects.requireNonNull で簡単に null 検査ができる
checkFromIndexSize, checkFromToIndex, checkIndex
- 独自のメッセージが設定できないなどあまり便利ではない

private メソッドの場合は引数に渡す値は管理されたものなので assert を使う。AssertionError を発生させる。java コマンドに -ea または -enableassertions をつけると有効になる。無効な場合のコストはない。

なるべく早いタイミングで値のバグを検出することは重要。特にコンストラクタでのチェックは重要。

正当性検査のコストが高い、現実的でない場合、正当性検査が処理の中で暗黙に行われる場合は、パラメータの検査をする必要はない。

例外翻訳 : item 73

そもそもパラメータに制約がない方がいい。

item 50 : 必要な場合、防御的にコピーする

クラスの不変式を破壊されないために防御的にプログラムする

不変でないオブジェクトをクラスの内部に注入された場合、外部から変更される可能性がある。不変でないオブジェクトはそのままフィールドに設定するのではなく、防御的にコピーする。正当性の検査はコピーしたオブジェクトに対して行う。渡されたオブジェクトは別スレッドから一時的に変更される可能性がある。無防備な時間（window of vulnerability）。TOCTOU 攻撃

clone() メソッドも Date などの final でないクラスの場合は信用できない。

内部の値を直接外部に露出させるのではなく、防御的にコピーする。こちらでは clone を使ってもいい。clone が override されていないことを保証できるから。ただし、一般にはコンストラクタや static ファクトリを使うのが良い。

内部の値へのアクセスをさせないということは不変クラス以外でも重要。

不変オブジェクトを使えばこの辺りは気にしなくてもいい。

パフォーマンスが問題になることがある。パッケージ内部でのみ使う場合などは妥協する。また、クライアントが要素を変更しないと信頼できる時。

item 51 : メソッドのシグニチャを注意深く設計する。

メソッド名を注意深く選ぶ
- 標準命名規約 : item 68
便利なメソッドを提供しすぎない
- メソッドを増やしすぎると使いづらくなる
長いパラメータのリストは避ける
- ４個以下が目標
- 特に同じ型が連続するのは順番が覚えられないし、コンパイルに成功してしまうのでよくない
- 対策
  - メソッドをサブセットに分割する
  - static メンバークラスとしてパラメータの集まりをヘルパークラスで定義する。
  - 2つの組み合わせで、Builder パターン
パラメータ型に関しては、クラスよりもインターフェイスを選ぶ (item 64)
- 具象型ではなく、インターフェイスを受け取るようにすると、汎用性が上がる。
boolean の意味が不明瞭な場合は、2つの要素を持つ enum を使う

item 52 : オーバーロードを注意して使う

オーバーロードは、同じメソッド名で引数の型が違うように定義すること

オーバーロードされたメソッドのうちどれが呼び出されるかはコンパイル時に決定する。

オーバーロードされたメソッドの選択は静的、オーバーライドされたメソッドの選択は動的

オーバーロードの対策としては、instanceof を使って実行時に型を検査する。

困惑させるようなオーバーロードの使用は避ける。メソッド名を変えて対応する

同じパラメータ数のメソッドのオーバーロードはしない
可変長引数のメソッドはオーバーロードしない writeInt writeDouble など

複数のコンストラクタがある場合全てオーバーロード。static ファクトリメソッドで対応できる。また、キャストすることで避けることもできる。

同じパラメータ数の場合は、明らかに異なる型同士にする。使うときは基本データ型の自動ボクシングに注意する。例：List.remove(int) と List.remove(Object)

関数型インターフェイスを受け取るオーバーロードはしない。ラムダが絡むとわかりにくくなる。

item 53 : 可変長引数を注意して使う

可変長引数は、渡された引数と同じ長さの配列を確保して詰める。引数は 0 個以上。 1つ以上の引数を受け取りたい場合は、コンパイル時のチェックが難しく、実行時エラーとして扱うことになる。 1つ以上の引数を受け取りたい場合は、独立の1つの引数として引数に定義してしまう。

static int min(int firstArg, int... remainingArgs);

メソッド呼び出しごとに配列を確保するためパフォーマンスが重要な場合には使えない。パフォーマンスが重要な場合は、0~3個までの引数に対応するオーバーロードしたメソッドを用意し、4つ以上については可変長引数で対応するようにする。 95%のメソッド呼び出しは3個以下の引数らしい。

item 54 : null ではなく、空コレクションか空配列を返す

クライアント側に null チェックを強制してしまい、複雑になってしまうのでよくない。また、null チェックを忘れた場合でも大抵の場合は要素があるのでバグに気付きにくい。

配列やリストオブジェクト確保のコストを気にするのは早すぎる最適化。また、パフォーマンスの課題になる場合は、同一の不変空コレクションを返すことで回避できる。Collections.emptyList()。ただし、不変空コレクションの利用は最適化であるため、パフォーマンスの計測が必要。

item 55 : オプショナルを注意して返す

値を返さないメソッドの方法

例外をスローする
- 例外のスローでは完全なスタックトレースが作成されるためコストがある
null を返す
- null チェックを呼び出し元に求める。忘れると NullPointerException

Java8 以降で Optional<T> が追加された。Optional.empty() と Optional.of(value)。of に null を渡すと NullPointerException が発生。Optional.ofNullable(value) では null だと空オプショナルを返す。 Optional を返すメソッドで null を返してはならない。

ストリームの終端操作の多くはオプショナルを返す。

利点

明示的。ユーザーに対応を強制する
- orElse() でデフォルト値を設定できる
- orElseThrow() で例外をスローする
  - ただし渡すのは生成コストを避けるために例外ファクトリ
- 必ず値があると保証できるときは get()
  - 値がないときは NoSuchElementException
- Supplier を受け取りデフォルト値の生成コストを遅延させる orElseGet()
- filter map flatMap ifPresent
- 以上で対応できないときは isPresent() で返る boolean 値で独自の処理を記述する

java9 で Optional に stream() メソッドが追加されてストリームに変換できるようになった。

コレクション、ストリーム、マップ、配列、オプショナルを含むコンテナ型はオプショナルで包むべきではない。

Optional 生成分のコストはあるのでパフォーマンスがシビアな場合は使わない。

基本データ型をボクシングして Optional にするのはコストが高いので OptionalInt, OptionalLong, OptionalDouble が提供されている。

キー、値、あるいはコレクションや配列の要素としてオプショナルを使うことは大抵適切でない。戻り値以外でオプショナルを使うことは少ない。

item 56 : 全ての公開 API 要素に対してドキュメントコメントを書く

Javadoc でコードにドキュメントコメントを埋め込むことでドキュメントを自動生成できる。

全ての公開されているクラス、インターフェース、コンストラクタ、メソッド、フィールドの宣言の前にドキュメントコメントを書かなければならない。シリアライズ可能なら、シリアライズ形式も。

public のクラスはデフォルトコンストラクタを使うべきではない。ドキュメントできないから。公開されていない要素についてもドキュメントコメントを書くことが望ましい。

メソッドに関するドキュメントコメント：メソッドとそのクライアント間の契約を簡潔に記述する
- どのように処理を行うかではなく、メソッドが何を行うか
- 事前条件
  - チェックされない例外に対する @throws タグによって記述
  - @param タグで影響を受けるパラメータと一緒に記述することもできる
- 事後条件
- 副作用
- @param, @return, @throws を書く。
  - メソッドの説明にある場合は @return を省略できる
  - @throws は if から始まる
- ピリオドで終わらない
- HTML タグを含めることもできる
- {@code} でコードを埋め込む。< などの HTML をエスケープできる。ただし、@ は自分でエスケープする必要がある。
- 自己利用パターンでは、@implSpec でサブクラスへの契約を示す
  - Java 9 の時点では無視されるので、-tag "implSpec:a:Implementation Reqquirements:" をコマンドラインに渡す
- {@literal} タグで囲むことでエスケープができる
  - ソースコードでも生成されたドキュメントでも読みやすくあるべき
- 最初の文は summary description
- ピリオドは文の終わりを示すため、それ以外の用法では (Mrs. など) {@literal}を使ってエスケープするべき
- ２人称命令形ではなく、３人称現在形を使う
クラス、インタフェース、フィールド
- summary description は名詞句であるべき
{@index} タグで用語の索引が使える
ジェネリックス、ジェネリックメソッド
- 全ての型パラメータを文書化する
enum
- 定数も文書化する。短い場合は１行でも OK
アノテーション
- 型自身だけでなく、全てのメンバーも文書化する。メンバーはフィールドのように名詞句で文書化
- 型自身については動詞句で文書化
パッケージレベルのドキュメントコメントは package-info.java に書くべき
モジュールレベルのドキュメントコメントは、module-info.java
スレッド安全性とシリアライズ可能性は必ず記述する
ドキュメントコメントがないときは継承して親のコメントを使う
- {@inheritDoc} : コメントの一部を継承できるが、使いにくい。
全ての要素だけでは不十分で全体のアーキテクチャなどをドキュメント化する必要がある場合もある

kawasin73 commented 4 years ago

9章プログラミング一般

item 57 : ローカル変数のスコープを最小限にする

ローカル変数が初めて使われた時に宣言する。（C の初期のように先頭にまとめない）
ローカル変数のスコープはブロック内。早く宣言することでスコープが大きくなってしまうことも。
宣言は初期化子を含むべき
- 例外は、try-catch で初期化するとき
for で使えるループ変数を使う。while でイテレータを使うとバグに繋がることも

item 58 : 従来の for ループよりも for-each ループを選ぶ

for-each ループはイテレータを隠蔽する。Iterable インタフェースを実装したオブジェクトに適用できる。配列も、コレクションも同じように扱える。 for-each ループはコンパイル時には for ループと同じようになるためペナルティはない。

for-each ループが使えない状況

破壊的フィルタリング
- コレクションの中身を取り除きながらループする
変換
- リストや配列の中身を置換する
並列イテレーション
- 複数のコレクションを並列に操作するとき

item 59 : ライブラリを知り、ライブラリを使う

標準ライブラリを使うことで、それを書いた専門家の知識と、それを自分よりも前に使った人々の経験を利用できる。
再利用することで工数を減らせる
パフォーマンスが勝手に改善することがある。
機能追加されることがある
共通のライブラリを使うことで外部からの人にも読みやすくなる。

特に重要なのは、java.lang, java.util, java.io とそのサブパッケージ

item 60 : 正確な答えが必要ならば、float と double を避ける

float と double は、主に科学計算と工学計算のために設計されている。正確とは限らないので、金銭計算には特に使うべきではない。金銭計算には BigDecimal か int, long を使う。

BigDecimal は不便で遅い。パフォーマンスが重要なら、int か long で小数点の位置を自分で管理しながら実装する。 9桁までは int, 18 桁までは long, それ以上は BigDecimal

item 61 : ボクシングされた基本データよりも基本データ型を選ぶ

両者の違い

同じ値だが異なるアイデンティティ
ボクシングされた基本データは null を取りうる
基本データ型の方が時間、空間的に効率的

ボクシングされた基本データに対する == はオブジェクトの比較を行うので間違えやすい。明示的にアンボクシングすれば解決。

ボクシングされた基本データと基本データ型を一緒に使うと、大抵の場合はアンボクシングされる。null では NullPointerException が発生する可能性がある。

ボクシングされた基本データの使い道

コレクション内の要素、キー、値
- 基本データ型は使えないため

item 62 : 他の型が適切な場所では、文字列を避ける

値型
enum
集合型
- 複数の構成要素からなるオブジェクトを文字列で表すとパースなどでバグになりやすい
capability
- 偽造できないキー

item 53 : 文字列結合のパフォーマンスに用心する

文字列の + は１行の生成や、小さな固定サイズの文字列の構築には向いている。しかし、一般に n 個の文字列を結合するのに O(n^2) の時間を必要とする。文字列は不変であるのでコピーが毎回走るから。

StringBuilder を使う。

item 64 : インタフェースでオブジェクトを参照する

パラメータ、戻り値、変数、フィールドは可能な限りインタフェース型で宣言する。具体的なクラスを参照するのはコンストラクタを呼ぶ時だけ。それによって柔軟性が得られる。

同じインタフェースを使う場合でもインタフェースで定義されている以上の契約に依存する場合は注意が必要。

インタフェース型がない場合はそのクラスで宣言するのも良い。

String などの値クラス
クラスに基づくフレームワーク
インタフェースを実装しているが追加のメソッドをクラスが提供している場合

item 65 : リフレクションよりもインタフェースを選ぶ

コアリフレクション機能 : java.lang.reflect

デメリット

コンパイル時の型検査の恩恵を失う
- 存在しないメソッドなどを呼び出そうとすると実行時エラー
コードが冗長になる
パフォーマンスが悪化

代表的な利用用途：コード解析ツール、依存性注入ツール大抵の場合はリフレクションは必要ない。

リフレクションでインスタンスの生成のみを行い、メソッドなどへのアクセスはインタフェースやスーパクラスを通して行う。

item 66 : ネイティブメソッドを注意して使う

JNI : Java Native Interface C や C++ のネイティブメソッドを呼ぶ

ネイティブメソッドの利用用途

プラットフォーム固有の機構へのアクセス
- 現在では Java が成長して必要なくなってきた
ネイティブコードのライブラリへのアクセス
パフォーマンス改善
- JVM が改善されているので必要ない。

デメリット

メモリ安全ではなくなる
移植性が低い
デバッグが困難
ネイティブコードの出入りにオーバーヘッドがあるので逆に遅くなることも
グルーコードがめんどくさい

item 67 : 注意して最適化する

馬鹿げた理由を含む他のどんな理由でもなく、効率の名の下に（必ずしも効率を達成するわけでもないのに）、さらにコンピューティングの罪が犯されている
- William A. Wulf
わずかな効率、例えば時間の約 97 % については忘れるべきである。時期尚早の最適化は、すべての悪の根源である
- Donald E. Knuth
最適化については2つの規則に従う。
- 規則１ : 最適化するな
- 規則２ : (専門家のみに対して) まだ最適化するな。すなわち、明瞭で最適化されていない答えを得るまでは
- M. A. Jackson

早すぎる最適化は悪。速いプログラムよりも優れたプログラムをパフォーマンスを制限するような設計はしない。モジュール間や外部とのやり取りの API やプロトコル。

可変なオブジェクトは防御的コピーを強制してしまう
具象型を API で使うと最適な型への変更ができなくなる
パフォーマンスのために設計を捻じ曲げるのはだめ
最適化するときは前後でパフォーマンスを測定する
プロファイラで計測してネックを探す。マイクロベンチマーク・フレームワークの jmh
Java は書いたコードと CPU の命令のギャップがあり、パフォーマンスの予測は難しい。最適化は計測したほうがいい。弱いパフォーマンスモデル

item 68 : 一般的に受け入れられている命名規則を守る

活字的命名規約 (typographical)

パッケージ名とモジュール名は、ピリオドで区切られた要素で階層的であるべき。逆順のドメイン。java, javax は例外。パッケージ名は 8 文字以下が好ましい

クラス、enum、インタフェース, アノテーション
- 大文字始まりのキャメルケース
メソッド、フィールド、ローカル変数
- 小文字始まりのキャメルケース
- ローカル変数は、省略文字も可
定数フィールド
- 大文字のスネークケース
型パラメータ
- 大文字１文字
- T : 任意の型
- E : コレクションの要素型
- K, V : マップのキーとバリュー
- X : 例外
- R : 戻り値
- T, U, V, T1, T2, T3 : 一連の任意の型

文法的命名規約 (grammatical)

enum, クラス, インターフェイス
- 単数名詞、名詞句
- インターファイスは、able や ible で終わる形容詞もある
インスタンス化できないユーティリティクラス
- 複数名詞
アノテーション
- 色々
メソッド
- 動詞あるいは（目的語を含む）動詞句
- boolean を返すときは、 is で始まる。稀に has で始まる。そのあとに形容詞句として機能する、名詞、名詞句、単語か句が続く
- boolean 以外の属性や機能を返すときは、get から始まるものか、それ自体の名詞を返す
- 別の型に変換するもの to で始まる。toString など。レシーバーオブジェクトの型とは異なるビューを返すときは、 as から始まる。asList など。基本データを返すとき、Value で終わる。intValue など

kawasin73 commented 4 years ago

10章例外

item 69 : 例外的状態にだけ例外を使う

例外にはオーバーヘッドがある。明示的に検査して避けられるなら低コストに検査をする。
try-catch ブロックによってJVM の最適化が妨げられる
配列ループの検査は JVM によって最適化されて低コストになったりする

制御フローとして例外を使わない。API を設計するときも、通常の制御フローに例外を使わない。検査メソッドを提供するべき。または、空のオプショナルか null を返して戻り値で区別する。並行処理の干渉の可能性があるときは戻り値での区別を選択する。大抵の場合は検査メソッドを提供するのがいい。検査メソッドを忘れて呼び出した時に例外を発生させるとバグに気付きやすくなる

item 70 : 回復可能な状態にはチェックされる例外を、プログラミングエラーには実行時例外を使う

3 種類の例外

チェックされる例外
実行時例外
エラー

呼び出し元が適切に回復できるような状況に対してはチェックされる例外を使う。catch を強制できる。これは呼び出しの結果としてエラーが起こる可能性があることを表明することになる。

後者2つはチェックされない例外。振る舞いは同じ。一般にはキャッチするべきではない。

プログラミングエラーを表す時に、実行時例外を使う。事前条件違反。プログラムエラーなのか、回復可能な状態を扱っているのかが必ずしも明らかではない。

エラーは、JVM のために予約されている。JVMの実行な不可能な場合、資源不足などで発生する。Error サブクラスは作らない。AssersionError 以外の Error をスローしない。

チェックされない例外は、RuntimeException をサブクラス化する。

追加の情報を付与するためにフィールドやメソッドを例外に実装する。文字列に含めない。

item 71 : チェックされる例外を不必要に使うのを避ける

チェックされる例外は使う側に負担。ストリームではチェックされる例外は使えない。

チェックされる例外は、適切に API を使った時に防ぐことができず、かつ、ユーザーがそれに対して何らかの有用な処理を行うことができる場合にのみ利用する。

新しくチェックされる例外を追加することは大きな変化であり、避けたい。オプショナルを返すことで回避可能。ただし、詳細な情報を返すことができない。例外がスローされるかを検査する boolean のメソッドを追加することで、チェックされる例外をチェックされない例外に変換する。ただし、並行処理での状態遷移の可能性に注意する

item 72 : 標準的な例外を使う

コードの再利用性は大切。

学習コストが低くなる
知らないコードが少なくなるので読みやすくなる
小さなメモリ量とクラスのロードに費やされる時間が少ない

Exception, RuntimeException, Throwable, Error を直接使わない。抽象クラスのように扱う。

よく再利用される例外

例外	使う機会
IllegalArgumentException	null ではないがパラメータ値が不適切
IllegalStateException	メソッド呼び出しに対してオブジェクト状態が不正
NullPointerException	パラメータ値が禁止されている null
IndexOutOfBoundsException	インデックスパラメータ値が範囲外
ConcurrentModificationException	禁止されているオブジェクトの並行した変更を検出
UnsupportedOperationException	オブジェクトがメソッドをサポートしていない

そのほかの既存の例外を再利用することも可。その例外のドキュメンテーションと矛盾しない、名前、セマンティックスに基づいている。また、既存の例外をサブクラス化して拡張するのも可。ただし、例外はシリアライズ可能であることに注意。

IllegalArgumentException と IllegalStateException の区別は、どんな引数を渡してもうまく動作しないときは IllegalStateException

item 73 : 抽象概念に適した例外をスローする

下位のレイヤーからの例外をそのまま再利用するのではなく、そのレイヤーの抽象度に適した例外に変換してスローする。実装の詳細で汚染されてしまう。例外翻訳（exception translation）

下位の例外のコンテキストが必要な場合、例外連鎖を行う。上位の例外が Throwable をコンストラクタで引き受ける時に可能。連鎖可能なコンストラクタを持たない場合は、Throwable の initCause を使う。

最善なのは、例外翻訳を乱用するのではなく、例外が発生しないように事前に検査をすること。または、上位レイヤで例外処理をして例外を発生させないこと。

item 74 : 各メソッドがスローする全ての例外を文書化する

@throws を使って Javadoc に各例外がスローされる条件を正確にドキュメント化する。スーパークラスをスローするような手抜きはダメ。main メソッドは例外で Exception をスローすると記述せざるを得ない。

チェックされない例外についてもドキュメント化することが賢明。事前条件を記述することにもなる。ただし、チェックされない例外については @throws に書いて、throws には追加しない (?)

インタフェースでもチェックされない例外を文書化することで一般契約の一部を表せる。

クラス内で共通の例外を発生させるときは、クラスのドキュメンテーションにかく。（NullPointerException）など

item 75 : 詳細メッセージをエラー記録情報に含める

スタックトレースには、例外の toString() の結果が含まれる。のちの分析のための情報（例外の原因となったすべてのパラメータとフィールドの値）をエラーの詳細情報に記録するべき。セキュリティに関わることは含めない。パスワードや鍵など不必要に長くしない。エンドユーザへのエラーメッセージと混同しない。パラメータを例外のコンストラクタで受け取ってメッセージを生成するのもあり。

item 76 : エラーアトミック性に努める

失敗したメソッド呼び出しはオブジェクトをそのメソッド呼び出しの前の状態になっているべき。（そのエラーが回復することを期待されているとき）

不変オブジェクトなら簡単。可変オブジェクトなら

変更の実行前にパラメータの正当性を検査する。
失敗する処理が内部状態を変更するよりも前に行われるように順序を工夫する
オブジェクトの一時コピーに対して操作を行い、完了後に置き換える。
エラーを検出して rollback する処理を追加する。（一般的ではない）
- 永続的な（ディスクに関連する）データ構造に対して行われる

エラーは一般に回復不能。エラーアトミック性を頑張る必要はない。エラーアトミック性が破られるようなときはドキュメンテーションする

item 77 : 例外を無視しない

空の catch ブロックはダメ。

無視することが適切な場合もある。回復が必要ない場合など。無視するときは、エラー変数名を ignored にして無視する理由などをコメントする

kawasin73 commented 4 years ago

11 章並行性

item 78 : 共有された可変データへのアクセスを同期する

synchronized 予約語によって相互排他（mutual exclusion）ができる。

相互排他によって、オブジェクトの不整合な状態がほかのスレッドに見えることを防ぐ。また、変更が確実に他のスレッドにも見えることを保証する。

Java では、long, double 以外の変数の読み書きは atomic である。読み出しで値が壊れることはないが、どのスレッドによって変更された値が読み出せるかはわからない。

メモリモデル : あるスレッドによる変更が他のスレッドからいつ、どのように見えるかを定義

Thread.stop は安全ではないから使ってはならない。boolean の値フィールドがアトミックに読み書きできるから、その値をポーリングして停止するかを判断する。ただし、synchronized を使わないと値の変更の伝搬が保証されないし、コンパイルの最適化でうまくいかないこともある。（巻き上げ hoisting）書き込みも読み込みも synchronized で同期する。

ただし、読み書きが atomic であるときは synchronized を通信効果のためだけに使うのは大げさ。volatile を使うことで相互排他はしないが、値の読み込みで最後に書き込まれた値が見えることを保証する。

ただし、nextSerialNumber++ は読み込みと書き込みを行うので排他制御が必要 (synchronized を使う)。 java.util.concurrent.atomic の AtomicLong を使うとvolatile の通信効果とアトミック性を lock-free で提供するので良い。

可変データを共有しないことでこれらの問題を回避できる。可変データを単一スレッドに閉じ込める。そのときは使い方をドキュメントに明示する。

再度オブジェクトを変更しない場合は、事実上不変（effectively immutable）として共有できる。

item 79 : 過剰な同期は避ける

過剰な同期は、パフォーマンス低下、デッドロック、予想外の振る舞いを引き起こす可能性がある

活性エラー（通信効果）と安全性エラー（データ不整合）を避けるために、同期されたメソッドやブロック内で制御をクライアントに譲らない。オーバーライドされるように設計されたメソッドや関数オブジェクトを同期された領域内で呼び出さない。それらのメソッドは異質（alien）である。

Java の synchronized は再入可能（reentrant）。同一スレッド内でネストしてロックを獲得することができる。ただし、別スレッドで synchronized を待ち合わせるとデッドロック。再入可能だが、活性エラーを安全性エラーに変える可能性がある。

異質な呼び出しを同期ブロックの外で行うことで解決する（オープンコール）。コピーを取るときは、コンカレントコレクションが提供する CopyOnWriteArrayList が便利。通常はパフォーマンスが悪いが、滅多に変更されずに走査されるだけの時には有用。

オープンコールは、デッドロックを避けるだけでなく、不必要に長いロックを防ぐ。

同期された領域内での処理は最小限にする。同期のコストは、ロックの獲得ではなく競合の方が大きい。

可変クラスを並行に使えるようにする方法

同期は行わず、クライアントが外部から同期できるようにする
内部的同期してクラスをスレッドセーフにする

基本は前者。後者に明確なメリットがない場合は、クラスは同期しないでスレッドセーフでないことをドキュメント化する。内部的に同期するときのヒント：ロック分割、ロックストライピング、非ブロッキング並行性制御

static なフィールドはグローバルである。

item 80 : スレッドよりもエグゼキュータ、タスク、ストリームを選ぶ

エグゼキュータサービスは便利。特定のタスクの待ち合わせ、すべてのタスクやあるタスクグループの待ち合わせなど様々なことができる。スレッドプールから、複数のエグゼキュータサービスを生成することもできる。

Executors.newCachedThreadPool : 小さいプログラムや軽い負荷のサーバ
- 負荷が高い場合はスレッドが大量に作られてしまう欠点
Executors.newFixedThreadPool : 固定数のスレッドを持つプールを提供する
独自に ThreadPoolExecutor を操作する。

Thread は処理の単位と実行する機構の2つの役割エグゼキュータサービスでは分離されている。処理の単位はタスクと呼ばれる。Runnable と Callable。Callable の方は値を返せるし例外をスローできる。実行する機構がエグゼキュータサービス

fork-join はタスクの steal をする

item 81 : wait と notify よりも並行処理ユーティリティを選ぶ

java.util.concurrent の高レベルのユーティリティ3つ

エグゼキュータフレームワーク
コンカレントコレクション
- List, Queue, Map などの高パフォーマンスな並行実装
- 内部でロックを取っているので外部でロックを取ることは無駄
- 複数のメソッド呼び出しをまとめることができない。単一のアトミック操作にまとめた状態依存変更操作（state-dependent modify operation）
- 同期されたコレクションより良い
  - Collections.synchronizedMap よりも ConcurrentHashMap
- ブロックする操作を提供していることもある
  - BlockingQueue の take()
シンクロナイザ
- スレッド同士がお互い待つことを可能にする
- CountDownLatch
  - よく使われる。使い捨てのバリア
  - コンストラクタに待ち合わせているスレッドの数を入れる。この回数 countDown が呼び出されるとブロックが解除
  - スレッドスタベーションデッドロックに注意。エグゼキュータのスレッド数が少ないとデッドロックする
    - エグゼキュータを正しく使うために thread interrupt は再発生させる
    - 高精度な時間間隔の計測。System.nanoTime
- Semaphore
- CyclicBarrier
  - あまり使われない
- Exchanger
  - あまり使われない
- Phaser
  - 最も強力なシンクロナイザ

wait と notify を使うとき

wait と notify は同期された領域内で使う必要がある。条件変数的な使い方

wait は条件を検査する while ループの中（wait ループイディオム）で使う。ループの外で呼び出してはいけない。活性を保証するために待ちの前に検査することは必要。安全性を保証するために待ちの後に検査することは必要。

item 82 : スレッド安全性を文書化する

synchronized が使われているからといってスレッド安全とは限らない。

スレッド安全性のレベル

不変 : immutable
- アノテーション : @Immutable
無条件スレッドセーフ : unconditionally thread-safe
- インスタンスは可変だが、外部同期を必要とせず使えるように内部に同期機構がある
- アノテーション : @ThreadSafe
条件付きスレッドセーフ : conditionally thread-safe
- メソッドによっては外部同期が必要
- 例としては、Collections.synchronized ラッパーが返すコレクション。イテレータは外部同期が必要
- 特にドキュメント化には注意が必要。
- アノテーション : @ThreadSafe
スレッドセーフでない : not thread-safe
- 並行して使うためには個々のメソッド呼び出しを外部同期する必要がある
- アノテーション : @NotThreadSafe
スレッド敵対 : thread-hostile
- メソッド呼び出しが外部同期で囲まれたとしても並行使用は安全でない
- static のデータを同期なしで変更する

一般にはクラスにドキュメントするが、特別なスレッド安全性特性を持つメソッドはメソッドコメントにドキュメントする。

enum の不変性をドキュメント化する必要はない。

Collections.synchronizedMap のように static ファクトリメソッドは返されるオブジェクトのスレッド安全性をドキュメント化する

誰もがアクセス可能なロックを使って長期間ロックを確保すると DoS に弱い。回避するためにプライベートロックオブジェクトを使う。final で宣言する。

private final Object lock = new Object();
public void foo() {
  synchronized(lock) {
    // do something
  }
}

ただし、条件付きスレッドセーフではドキュメント化する必要があるから使えない。

item 83 : 遅延初期化を注意して使う

lazy initialization 必要になるまで初期化を遅らせる。static フィールド、インスタンスフィールドの両方に適用可能。主な目的は最適化だが、初期化での循環を解決するための場合もある。

最適化であるので、パフォーマンス計測をする。

複数スレッドで使う場合は、スレッドセーフになるようにしないといけない。

循環を断ち切るためには、アクセサメソッドを synchronized にする。

static フィールドの遅延初期化は、遅延初期化ホルダー・クラス・イディオムを使う。クラスが使われるまでクラスが初期化されないことを利用している。

private static class FieldHolder {
  static final FieldType field = computeFieldValue();
}

private static FieldType getField() {
  return FieldHolder.field;
}

この時、アクセサは synchronized されないでいい。

インスタンスフィールドでは、二重チェックイディオムを使う。1回目はロックせずに検査し、初期化されていなかったらロックを取った上で再度検査する。ただし、volatile をつけることを忘れない。

private volatile FieldType field;

private FieldType getField() {
  FieldType result = field;
  if (result != null)
    return result;

  synchronized(this) {
    if (field == null)
      field = computeFieldValue();
    return field;
  }
}

result にコピーすることで field が１度しか読み込まれないようにする。これでパフォーマンスが向上することがある。派生形に synchronized を使わない単一チェックイディオムもある。

再計算されても良くて double, long 以外であれば volatile を取っても良い。きわどい単一チェックイディオムと呼ばれる。

item 84 : スレッドスケジューラに依存しない

プラットフォームによってスレッドスケジューラのポリシーは異なる可能性がある。移植性を保つために依存しない。

頑強で応答性がよく、移植可能なプログラムのために、実行可能なスレッドの平均数をプロセッサの数よりもはるかに大きくしない。スレッドスケジューラのできることがすくなくなる。有益な処理をしないときは、待たせる。ビジーウェイトをしない。

スレッドの CPU 時間が短いことの解決に Thread.yield を（スレッド実行権の放棄）使わない。スレッドの優先順位の調整は移植性がなくなるのでしない。

kawasin73 commented 4 years ago

12 章シリアライズ

item 85 : Java のシリアライズよりも代替手段を選ぶ

シリアライズのデメリット：見えないコンストラクタ、APIと実装間の曖昧な境界、セキュリティやパフォーマンス、正しさの問題

根本的な問題：攻撃対象領域が広すぎて保護できない。

シリアライズ可能な型をガジェットと呼ぶ。ディシリアライズに時間がかかるものを送りつける DoS 攻撃。

信頼できないバイトストリームをディシリアライズしない。クロスプラットフォーム構造化データ表現を使う。JSONや protobuf

どうしても避けられないときは、ディシリアライズフィルターを使う。 java.io.ObjectInputFilter。ブラックリストよりもホワイトリストを使う。

item 86 : Serializable を最新の注意を払って実装する

implements Serializable を追加するだけでシリアライズ可能になる。ただし、一度リリースされると互換性のために大変になる。 private なフィールドも含まれるために公開 API の一部になってしまう。

コスト

シリアルバージョン UID として知られるストリーム一意識別子
- クラスは serialVersionUID という static final の long フィールドを指定する。なければ自動生成されるので明示的に指定する必要がある。
バグやセキュリティーホール
- item 85
新しいバージョンのテストの負荷を増大させる

気をつけること

熟慮して決める
- 恩恵があるのか
継承のために設計されたクラスとインタフェースは Serializable を滅多に拡張するべきではない

サブクラスがシリアライズ可能であるためには継承元がシリアライズ可能であるか、パラメータなしのコンストラクタが必要。

内部クラスは Serializable にしない

item 87 : カスタムシリアライズ形式の使用を検討する

適切かどうかを最初に検討せずに、デフォルトのシリアライズ形式を受け入れてはいけない。

デフォルトのシリアライズ形式は、そのオブジェクト内に含まれるデータとそれに紐ずく到達可能なすべてのオブジェクトに含まれるデータを記述する。

オブジェクトの物理表現と論理的内容が同じ場合、デフォルトのシリアライズ形式はおそらく適切。

デフォルトのシリアライズ形式が適切であっても、不変式とセキュリティを保証するために多くの場合 readObject メソッドを提供しなければならない

デフォルトのシリアライズ形式を使うことのデメリット

公開 API が現在の内部表現に永久に拘束される
- @serial タグをフィールドのドキュメントに
- transient を宣言するとデフォルトのシリアライズ形式に含まれない。その場合デフォルト値に初期化される。
過剰な空間を消費する可能性がある
過剰な時間を消費する可能性がある
スタックオーバーフローの可能性がある

効率的な writeObject と readObject を提供する。同期にも気をつける明示的なシリアルバージョンUIDを宣言する

private static final long serialVersionUID = xxxxxxx;

食い違うと InvalidClassException が発生する

item 88 : 防御的に readObject メソッドを書く

readObject メソッドは実質的にもう１つの public のコンストラクタ。防御的コピーを使っている不変クラスでは、readObject でも引数の妥当性と防御的コピーをする必要がある。

不正なバイト列を防ぐために、readObject で不変式が満たされているか正当性の検査をする。不正な場合は、 InvalidObjectException また、防御的コピーもする

クラス内のオーバーライド可能なメソッドを呼び出してはいけない。

item 89 : インスタンス制御に対しては、 readResolve よりも enum 型を選ぶ

readResolve で単一インスタンスのみを再利用することを強制できる。無視されたインスタンスは GC される。

シングルトンのインスタンスの転送ではフィールドの値は必要ないから、transient と宣言する。然もなくば脆弱性

enum によって安全になる。

item 90 : シリアライズされたインスタンスの代わりに、シリアライズ・プロキシを検討する

Serializable を実装することはバグとセキュリティ問題の可能性を増大させる。コンストラクタ以外でインスタンス化されるから。

シリアライズ可能なクラスの private static のネストしたクラス（プロキシ）を導入。コンストラクタでは、一貫性検査や防御的コピーは必要ない。エンクロージングクラスに writeReplaace メソッドを追加して、プロキシを挟む。readObject は不変式の破壊を防ぐために潰す。プロキシクラスの readResolve でエンクロージングクラスに変換する。このときはエンクロージングクラスの public なインタフェースでインスタンス化する。

ユーザによって拡張可能なクラスとは互換性がない。循環を含むようなクラスとも互換性がない場合がある。

プロキシを使うことでパフォーマンスが犠牲になることがある。

kawasin73 / knowledge