이펙티브 자바 - item 6. 불필요한 객체 생성을 피하라

item 6. 불필요한 객체 생성을 피하라

이펙티브 자바 - item 6. 불필요한 객체 생성을 피하라

똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다. 특히 불변 객체는 언제든 재사용할 수 있다.

예시 1. 문자열 객체 생성

  String s = new String("example");

  String s = "example";

위의 코드는 String을 new로 생성하면 항상 새로운 객체를 만들게 된다.

아래의 코드는 새로운 인스턴스를 매번 만드는 대신 하나의 String 인스턴스를 재사용 한다. 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다

예시 2. static factory 메서드 사용하기

Boolean true1 = Boolean.valueOf("true");
Boolean true2 = Boolean.valueOf("true");

System.out.println(true1 == true2); // true

생성자대신 정적 팩터리 메서드를 제공하는 불변 클래스에서는 불필요한 객체 생성을 피할 수 있다. 생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 그렇지 않다.

예시 3. 비싼 객체의 캐싱

만드는데 메모리나 시간이 오래 걸리는 객체 즉 “비싼 객체”를 반복적으로 만들어야 한다면 캐싱해두고 재사용할 수 있는지 고려하는 것이 좋다.

public class RomanNumerals {
    static boolean isRomanNumeral(String s) {
        return s.matches("^(?=.)M*(C[MD]|D?C{0,3})" +
                "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})");
    }
}

String.matches 메서드가 만드는 정규표현식용 Pattern 인스턴스는 한 번 쓰고 버려져서 곧바로 가비지컬렉션 대상이 된다.

Pattern은 입력받은 정규표현식에 해당하는 유한 상태 머신을 만들기 때문에 인스턴스 생성비용이 비싸다.

메소드가 호출 될 때마다 Pattern객체가 생성되므로 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다.

개선코드

객체를 재사용해 개선한 예시이다.

public class RomanNumerals {
    private static final Pattern ROMAN = Pattern.compile("^(?=.)M*(C[MD]|D?C{0,3})" +
            "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})");

    static boolean isRomanNumeral(String s) {
        return ROMAN.matcher(s).matches();
    }
}

정규표현식을 표현하는 불변인 Pattern 인스턴스를 클래스 초기화 과정에서 직접 생성해 캐싱해두고 나중에 메서드가 호출될 때 이 인스턴스를 재사용한다.

위 코드로 성능 개선 뿐만 아니라 개선전에는 존재 조차도 몰랐던 Pattern 인스턴스를 static final 필드로 이름을 지어주어 코드의 의미가 더 훨씬 잘 드러난다.

생성비용이 비싼 객체라면 “캐싱” 방식을 고려해야 한다. 자주 쓰는 값이라면 static final로 초기에 캐싱해놓고 재사용하자.

예시 4. Adapter

어댑터는 인터페이스를 통해 뒤에 있는 객체로 연결해주는 view라 객체 당 하나씩만 만들면 충분하다.

Map map = new HashMap();
map.put("Hello", "World");

Set set1 = map.keySet();
Set set2 = map.keySet();

assertThat(set1).isSameAs(set2); // true

set1.remove("Hello");
System.out.println(set1.size()); // 1
System.out.println(set1.size()); // 1

예시로 Map 인터페이스의 keySet 메서드는 Map 객체 안의 키 전부를 담은 Set 인터페이스의 뷰를 반환한다. 하지만, 동일한 Map에서 호출하는 keySet 메서드는 같은 Map을 대변하기 때문에 가변이더라도 기능적으로 모두 동일하다. 따라서 반환한 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀌어 여러개를 생성할 필요가 없다.

예시 5. 오토박싱

불필요한 객체를 만들어내는 또 다른 예로 오토박싱을 들 수 있다.

private static long sum() {
    Long sum = 0L;
    for (long i = 0; i <= Integer.MAX_VALUE; i++)
        sum += i;
    return sum;
}

오토박싱은 기본 타입과 박싱된 기본 타입을 섞어 쓸 때 자동으로 상호 변환해주는 기술이다. 의미상으로는 별다를 것 없지만 성능에서는 그렇지 않다.

이 메서드는 정확한 답을 내긴 하지만 sum 변수를 long이 아니라 Long 타입으로 선언하여 불필요한 Long 인스턴스가 2^31개나 만들어지게 된다. (long 타입인 i가 Long 타입인 sum 인스턴스에 더해질 때마다) Long으로 선언된 변수를 long으로 바꾸면 훨씬 더 빠른 프로그램이 된다.

박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의하자.

주의

“객체 생성은 비싸니 피해야 한다”로 오해하면 안 된다.

요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않는다.프로그램의 명확성, 간결성, 기능을 위해 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일이다.

그렇다고 단순히 객체 생성을 피하기 위해 자신만의 객체 풀(pool)을 만들지는 말자. 물론 DB 커넥션 같은 경우 생성 비용이 워낙 비싸니 재사용 하는 편이 낫다. 하지만 일반적으로 자체 객체 풀은 코드를 헷갈리게 하고, 메모리 사용량을 늘리고, 성능을 떨어뜨린다.

요즘 JVM의 GC는 상당히 잘 최적화 되어서, 가벼운 객체를 다룰 때는 직접 만든 객체 풀보다 훨씬 빠르다.