[java] Java 8-목록을 변환하는 가장 좋은 방법 : map 또는 foreach?

나는 목록이 myListToParse내가 요소를 필터링하고 각 요소에 대해 방법을 적용하고, 다른 목록에 결과를 추가 할 myFinalList.

Java 8에서는 두 가지 방법으로 할 수 있음을 알았습니다. 나는 그들 사이의보다 효율적인 방법을 알고 싶습니다. 왜 한 가지 방법이 다른 방법보다 낫습니다.

세 번째 방법에 대한 제안이 열려 있습니다.

방법 1 :

myFinalList = new ArrayList<>();
myListToParse.stream()
        .filter(elt -> elt != null)
        .forEach(elt -> myFinalList.add(doSomething(elt)));

방법 2 :

myFinalList = myListToParse.stream()
        .filter(elt -> elt != null)
        .map(elt -> doSomething(elt))
        .collect(Collectors.toList()); 



답변

성능 차이에 대해 걱정하지 마십시오.이 경우 정상적으로 최소화됩니다.

방법 2가 바람직하기 때문에

  1. 람다 식 외부에 존재하는 컬렉션을 변경하지 않아도됩니다.

  2. 수집 파이프 라인에서 수행되는 여러 단계가 순차적으로 작성되기 때문에 더 읽기 쉽습니다. 먼저 필터 작업, 맵 작업, 결과 수집 (수집 파이프 라인의 이점에 대한 자세한 내용은 Martin Fowler의 우수한 기사 참조 )

  3. Collector사용 된 값을 바꾸면 값 수집 방법을 쉽게 변경할 수 있습니다 . 경우에 따라서는 직접 작성해야 할 수도 Collector있지만, 쉽게 재사용 할 수 있다는 이점이 있습니다.


답변

나는 두 번째 형식이 부작용이없고 병렬화하기가 더 쉽기 때문에 (병렬 스트림을 사용하면) 기존 답변에 동의합니다.

성능 측면에서는 병렬 스트림을 사용하기 시작할 때까지 동일한 것으로 보입니다. 이 경우 지도의 성능이 훨씬 향상됩니다. 마이크로 벤치 마크 결과 는 아래를 참조하십시오 .

Benchmark                         Mode  Samples    Score   Error  Units
SO28319064.forEach                avgt      100  187.310 ± 1.768  ms/op
SO28319064.map                    avgt      100  189.180 ± 1.692  ms/op
SO28319064.mapWithParallelStream  avgt      100   55,577 ± 0,782  ms/op

forEach 는 터미널 메서드이므로 void를 반환하므로 상태 저장 람다를 사용해야 하기 때문에 첫 번째 예제를 같은 방식으로 향상시킬 수 없습니다 . 그러나 병렬 스트림을 사용하는 경우에는 실제로 나쁜 생각 입니다.

마지막으로 두 번째 스 니펫은 메소드 참조 및 정적 가져 오기를 사용하여 훨씬 간결하게 작성 될 수 있습니다.

myFinalList = myListToParse.stream()
    .filter(Objects::nonNull)
    .map(this::doSomething)
    .collect(toList()); 


답변

스트림 사용의 주요 이점 중 하나는 선언적인 방식으로, 즉 기능적인 프로그래밍 스타일을 사용하여 데이터를 처리 할 수 ​​있다는 것입니다. 또한 멀티 스레딩 기능을 무료로 제공하므로 스트림을 동시에 만들기 위해 추가 멀티 스레딩 코드를 작성할 필요가 없습니다.

이 스타일의 프로그래밍을 탐색하는 이유를 가정하면 이러한 이점을 활용하기 위해 첫 번째 코드 샘플이 작동하지 않을 수 있습니다.이 foreach방법은 터미널로 분류되므로 부작용이 발생할 수 있습니다.

두 번째 방법은 맵 함수가 상태 비 저장 람다 함수를 수용 할 수 있기 때문에 함수형 프로그래밍 관점에서 선호됩니다. 보다 명확하게, map 함수에 전달 된 람다는

  1. 비 간섭 : 함수가 비 동시 (예 🙂 스트림의 소스를 변경해서는 안됨을 의미합니다 ArrayList.
  2. 병렬 처리를 수행 할 때 예기치 않은 결과를 피하기 위해 상태 비 저장 (스레드 스케줄링 차이로 인해 발생)

두 번째 접근 방식의 또 다른 이점은 스트림이 병렬이고 수집기가 동시적이고 정렬되지 않은 경우 이러한 특성은 수집을 동시에 수행하기 위해 축소 작업에 유용한 힌트를 제공 할 수 있다는 것입니다.


답변

당신이 사용하는 경우 이클립스 컬렉션을 당신이 사용할 수있는 collectIf()방법을.

MutableList<Integer> source =
    Lists.mutable.with(1, null, 2, null, 3, null, 4, null, 5);

MutableList<String> result = source.collectIf(Objects::nonNull, String::valueOf);

Assert.assertEquals(Lists.immutable.with("1", "2", "3", "4", "5"), result);

그것은 열심히 평가하고 스트림을 사용하는 것보다 약간 빠릅니다.

참고 : 저는 Eclipse Collections의 커미터입니다.


답변

나는 두 번째 방법을 선호합니다.

첫 번째 방법을 사용할 때 성능을 향상시키기 위해 병렬 스트림을 사용하기로 결정하면에 의해 요소가 출력 목록에 추가되는 순서를 제어 할 수 없습니다 forEach.

당신이 사용하는 경우 toList, 스트림 API는 병렬 스트림을 사용하는 경우에도 순서를 유지합니다.


답변

스트림에 toList 메소드가없는 이유에 대한 세 번째 옵션 -usingstream().toArray() -see 주석 이 있습니다 . forEach () 또는 collect ()보다 느리고 표현력이 떨어집니다. 나중에 JDK 빌드에서 최적화 될 수 있으므로 만일을 위해 여기에 추가하십시오.

가정 List<String>

    myFinalList = Arrays.asList(
            myListToParse.stream()
                    .filter(Objects::nonNull)
                    .map(this::doSomething)
                    .toArray(String[]::new)
    );

마이크로 마이크로 벤치 마크, 1M 엔트리, 20 % 널 및 doSomething ()의 간단한 변환

private LongSummaryStatistics benchmark(final String testName, final Runnable methodToTest, int samples) {
    long[] timing = new long[samples];
    for (int i = 0; i < samples; i++) {
        long start = System.currentTimeMillis();
        methodToTest.run();
        timing[i] = System.currentTimeMillis() - start;
    }
    final LongSummaryStatistics stats = Arrays.stream(timing).summaryStatistics();
    System.out.println(testName + ": " + stats);
    return stats;
}

결과는

평행:

toArray: LongSummaryStatistics{count=10, sum=3721, min=321, average=372,100000, max=535}
forEach: LongSummaryStatistics{count=10, sum=3502, min=249, average=350,200000, max=389}
collect: LongSummaryStatistics{count=10, sum=3325, min=265, average=332,500000, max=368}

잇달아 일어나는:

toArray: LongSummaryStatistics{count=10, sum=5493, min=517, average=549,300000, max=569}
forEach: LongSummaryStatistics{count=10, sum=5316, min=427, average=531,600000, max=571}
collect: LongSummaryStatistics{count=10, sum=5380, min=444, average=538,000000, max=557}

null과 필터가없는 병렬 (스트림은 SIZED) : toArrays는 이러한 경우에 최고의 성능을 가지며, .forEach()받는 ArrayList에서 “indexOutOfBounds”로 실패하고.forEachOrdered()

toArray: LongSummaryStatistics{count=100, sum=75566, min=707, average=755,660000, max=1107}
forEach: LongSummaryStatistics{count=100, sum=115802, min=992, average=1158,020000, max=1254}
collect: LongSummaryStatistics{count=100, sum=88415, min=732, average=884,150000, max=1014}


답변

방법 3 일 수 있습니다.

나는 항상 논리를 분리하는 것을 선호합니다.

Predicate<Long> greaterThan100 = new Predicate<Long>() {
            @Override
            public boolean test(Long currentParameter) {
                return currentParameter > 100;
            }
        };

        List<Long> sourceLongList = Arrays.asList(1L, 10L, 50L, 80L, 100L, 120L, 133L, 333L);
        List<Long> resultList = sourceLongList.parallelStream().filter(greaterThan100).collect(Collectors.toList());