[java] Java에서 InputStream을 읽고 문자열로 변환하는 방법은 무엇입니까?

java.io.InputStream객체 가있는 경우 해당 객체를 어떻게 처리하고 String?


InputStream텍스트 데이터가 포함되어 있고이를로 변환하려고 한다고 가정하면 이 String를 예를 들어 로그 파일에 쓸 수 있습니다.

를 가져 와서 InputStream변환 하는 가장 쉬운 방법은 무엇입니까 String?

public String convertStreamToString(InputStream is) {
    // ???
}



답변

이 작업을 수행하는 좋은 방법은 사용하는 아파치 평민을 IOUtils 을 복사 InputStreamStringWriter같은 … 뭔가

StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, encoding);
String theString = writer.toString();

또는

// NB: does not close inputStream, you'll have to use try-with-resources for that
String theString = IOUtils.toString(inputStream, encoding); 

또는 ByteArrayOutputStream스트림과 작가를 혼합하지 않으려는 경우 사용할 수 있습니다


답변

이 작업을 수행하는 11 가지 주요 방법을 찾은 다른 답변을 요약하십시오 (아래 참조). 그리고 몇 가지 성능 테스트를 작성했습니다 (아래 결과 참조).

InputStream을 문자열로 변환하는 방법 :

  1. 사용 IOUtils.toString(아파치의 Utils)

    String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
  2. 사용 CharStreams(구아바)

    String result = CharStreams.toString(new InputStreamReader(
          inputStream, Charsets.UTF_8));
  3. 사용 Scanner(JDK)

    Scanner s = new Scanner(inputStream).useDelimiter("\\A");
    String result = s.hasNext() ? s.next() : "";
  4. Stream API 사용 (Java 8) 경고 :이 솔루션 변환 다른 줄 바꿈 (같은 \r\n)에 \n.

    String result = new BufferedReader(new InputStreamReader(inputStream))
      .lines().collect(Collectors.joining("\n"));
  5. 사용하여 병렬 스트림 API (자바 8). 경고 :이 솔루션 변환 다른 줄 바꿈 (같은 \r\n)에 \n.

    String result = new BufferedReader(new InputStreamReader(inputStream)).lines()
       .parallel().collect(Collectors.joining("\n"));
  6. 사용 InputStreamReaderStringBuilder(JDK)

    final int bufferSize = 1024;
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    Reader in = new InputStreamReader(stream, StandardCharsets.UTF_8);
    int charsRead;
    while((charsRead = in.read(buffer, 0, buffer.length)) > 0) {
        out.append(buffer, 0, charsRead);
    }
    return out.toString();
  7. 사용 StringWriterIOUtils.copy(Apache Commons)

    StringWriter writer = new StringWriter();
    IOUtils.copy(inputStream, writer, "UTF-8");
    return writer.toString();
  8. 사용 ByteArrayOutputStreaminputStream.read(JDK)

    ByteArrayOutputStream result = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length;
    while ((length = inputStream.read(buffer)) != -1) {
        result.write(buffer, 0, length);
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return result.toString("UTF-8");
  9. BufferedReader(JDK) 사용 경고 : 이 솔루션은 다른 줄 바꿈 (예 🙂 \n\rline.separator시스템 속성 (예 : Windows의 경우 “\ r \ n”)으로 변환합니다.

    String newLine = System.getProperty("line.separator");
    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
    StringBuilder result = new StringBuilder();
    boolean flag = false;
    for (String line; (line = reader.readLine()) != null; ) {
        result.append(flag? newLine: "").append(line);
        flag = true;
    }
    return result.toString();
  10. 사용 BufferedInputStreamByteArrayOutputStream(JDK)

    BufferedInputStream bis = new BufferedInputStream(inputStream);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
        buf.write((byte) result);
        result = bis.read();
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return buf.toString("UTF-8");
  11. 사용 inputStream.read()StringBuilder(JDK). 경고 :이 솔루션은 러시아어 텍스트와 같이 유니 코드에 문제가 있습니다 (유니 코드가 아닌 텍스트에서만 올바르게 작동 함)

    int ch;
    StringBuilder sb = new StringBuilder();
    while((ch = inputStream.read()) != -1)
        sb.append((char)ch);
    reset();
    return sb.toString();

경고 :

  1. 솔루션 4, 5 및 9는 다른 줄 바꿈을 하나로 변환합니다.

  2. 솔루션 11은 유니 코드 텍스트에서 올바르게 작동하지 않습니다

성능 테스트

작은 String(길이 = 175), github의 url에 대한 성능 테스트 (모드 = 평균 시간, 시스템 = Linux, 점수 1,343이 가장 좋음) :

              Benchmark                         Mode  Cnt   Score   Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
 3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
 2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
 4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
 9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
 5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

big String(길이 = 50100), github의 url에 대한 성능 테스트 (모드 = 평균 시간, 시스템 = Linux, 점수 200,715가 가장 좋음) :

               Benchmark                        Mode  Cnt   Score        Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
 2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
 9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
 5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
 4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
 3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

그래프 (Windows 7 시스템의 입력 스트림 길이에 따른 성능 테스트)
여기에 이미지 설명을 입력하십시오

Windows 7 시스템의 입력 스트림 길이에 따른 성능 테스트 (평균 시간) :

 length  182    546     1092    3276    9828    29484   58968

 test8  0.38    0.938   1.868   4.448   13.412  36.459  72.708
 test4  2.362   3.609   5.573   12.769  40.74   81.415  159.864
 test5  3.881   5.075   6.904   14.123  50.258  129.937 166.162
 test9  2.237   3.493   5.422   11.977  45.98   89.336  177.39
 test6  1.261   2.12    4.38    10.698  31.821  86.106  186.636
 test7  1.601   2.391   3.646   8.367   38.196  110.221 211.016
 test1  1.529   2.381   3.527   8.411   40.551  105.16  212.573
 test3  3.035   3.934   8.606   20.858  61.571  118.744 235.428
 test2  3.136   6.238   10.508  33.48   43.532  118.044 239.481
 test10 1.593   4.736   7.527   20.557  59.856  162.907 323.147
 test11 3.913   11.506  23.26   68.644  207.591 600.444 1211.545


답변

표준 Java 라이브러리 만 사용하는 방법이 있습니다 (스트림은 닫히지 않으며 마일리지는 다를 수 있습니다).

static String convertStreamToString(java.io.InputStream is) {
    java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
    return s.hasNext() ? s.next() : "";
}

“Stupid Scanner tricks” 기사 에서이 트릭을 배웠습니다 . 이것이 작동하는 이유는 스캐너 가 스트림의 토큰을 반복 하기 때문에 “입력 경계의 시작”(\ A)을 사용하여 토큰을 분리하여 스트림의 전체 내용에 대해 하나의 토큰 만 제공하기 때문입니다.

입력 스트림의 인코딩에 대해 구체적이어야 Scanner하는 경우 사용할 문자 세트 (예 : “UTF-8”)를 나타내는 두 번째 인수를 생성자에 제공 할 수 있습니다 .

모자 팁도 야곱 에게 갔다.


답변

Apache Commons는 다음을 허용합니다.

String myString = IOUtils.toString(myInputStream, "UTF-8");

물론 UTF-8 이외의 다른 문자 인코딩을 선택할 수도 있습니다.

참조 : ( documentation )


답변

파일을 고려하면 먼저 java.io.Reader인스턴스를 가져와야합니다. 그런 다음 이것을 읽고 추가 할 수 있습니다 StringBuilder( StringBuffer여러 스레드에서 액세스하지 않으면 StringBuilder더 빠를 필요 가 없습니다 ). 여기서 트릭은 블록 단위로 작업하므로 다른 버퍼링 스트림이 필요하지 않다는 것입니다. 블록 크기는 런타임 성능 최적화를 위해 매개 변수화됩니다.

public static String slurp(final InputStream is, final int bufferSize) {
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    try (Reader in = new InputStreamReader(is, "UTF-8")) {
        for (;;) {
            int rsz = in.read(buffer, 0, buffer.length);
            if (rsz < 0)
                break;
            out.append(buffer, 0, rsz);
        }
    }
    catch (UnsupportedEncodingException ex) {
        /* ... */
    }
    catch (IOException ex) {
        /* ... */
    }
    return out.toString();
}


답변

사용하다:

InputStream in = /* Your InputStream */;
StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;

while ((read=br.readLine()) != null) {
    //System.out.println(read);
    sb.append(read);
}

br.close();
return sb.toString();


답변

Google 컬렉션 / 구아바를 사용하는 경우 다음을 수행 할 수 있습니다.

InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);

에 대한 두 번째 매개 변수 (예 : Charsets.UTF_8) InputStreamReader는 필요하지 않지만 일반적으로 인코딩을 알고 있으면이를 지정하는 것이 좋습니다.