java.io.InputStream
객체 가있는 경우 해당 객체를 어떻게 처리하고 String
?
InputStream
텍스트 데이터가 포함되어 있고이를로 변환하려고 한다고 가정하면 이 String
를 예를 들어 로그 파일에 쓸 수 있습니다.
를 가져 와서 InputStream
변환 하는 가장 쉬운 방법은 무엇입니까 String
?
public String convertStreamToString(InputStream is) {
// ???
}
답변
이 작업을 수행하는 좋은 방법은 사용하는 아파치 평민을 IOUtils
을 복사 InputStream
에 StringWriter
같은 … 뭔가
StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, encoding);
String theString = writer.toString();
또는
// NB: does not close inputStream, you'll have to use try-with-resources for that
String theString = IOUtils.toString(inputStream, encoding);
또는 ByteArrayOutputStream
스트림과 작가를 혼합하지 않으려는 경우 사용할 수 있습니다
답변
이 작업을 수행하는 11 가지 주요 방법을 찾은 다른 답변을 요약하십시오 (아래 참조). 그리고 몇 가지 성능 테스트를 작성했습니다 (아래 결과 참조).
InputStream을 문자열로 변환하는 방법 :
-
사용
IOUtils.toString
(아파치의 Utils)String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
-
사용
CharStreams
(구아바)String result = CharStreams.toString(new InputStreamReader( inputStream, Charsets.UTF_8));
-
사용
Scanner
(JDK)Scanner s = new Scanner(inputStream).useDelimiter("\\A"); String result = s.hasNext() ? s.next() : "";
-
Stream API 사용 (Java 8) 경고 :이 솔루션 변환 다른 줄 바꿈 (같은
\r\n
)에\n
.String result = new BufferedReader(new InputStreamReader(inputStream)) .lines().collect(Collectors.joining("\n"));
-
사용하여 병렬 스트림 API (자바 8). 경고 :이 솔루션 변환 다른 줄 바꿈 (같은
\r\n
)에\n
.String result = new BufferedReader(new InputStreamReader(inputStream)).lines() .parallel().collect(Collectors.joining("\n"));
-
사용
InputStreamReader
및StringBuilder
(JDK)final int bufferSize = 1024; final char[] buffer = new char[bufferSize]; final StringBuilder out = new StringBuilder(); Reader in = new InputStreamReader(stream, StandardCharsets.UTF_8); int charsRead; while((charsRead = in.read(buffer, 0, buffer.length)) > 0) { out.append(buffer, 0, charsRead); } return out.toString();
-
사용
StringWriter
및IOUtils.copy
(Apache Commons)StringWriter writer = new StringWriter(); IOUtils.copy(inputStream, writer, "UTF-8"); return writer.toString();
-
사용
ByteArrayOutputStream
및inputStream.read
(JDK)ByteArrayOutputStream result = new ByteArrayOutputStream(); byte[] buffer = new byte[1024]; int length; while ((length = inputStream.read(buffer)) != -1) { result.write(buffer, 0, length); } // StandardCharsets.UTF_8.name() > JDK 7 return result.toString("UTF-8");
-
BufferedReader
(JDK) 사용 경고 : 이 솔루션은 다른 줄 바꿈 (예 🙂\n\r
을line.separator
시스템 속성 (예 : Windows의 경우 “\ r \ n”)으로 변환합니다.String newLine = System.getProperty("line.separator"); BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream)); StringBuilder result = new StringBuilder(); boolean flag = false; for (String line; (line = reader.readLine()) != null; ) { result.append(flag? newLine: "").append(line); flag = true; } return result.toString();
-
사용
BufferedInputStream
및ByteArrayOutputStream
(JDK)BufferedInputStream bis = new BufferedInputStream(inputStream); ByteArrayOutputStream buf = new ByteArrayOutputStream(); int result = bis.read(); while(result != -1) { buf.write((byte) result); result = bis.read(); } // StandardCharsets.UTF_8.name() > JDK 7 return buf.toString("UTF-8");
-
사용
inputStream.read()
및StringBuilder
(JDK). 경고 :이 솔루션은 러시아어 텍스트와 같이 유니 코드에 문제가 있습니다 (유니 코드가 아닌 텍스트에서만 올바르게 작동 함)int ch; StringBuilder sb = new StringBuilder(); while((ch = inputStream.read()) != -1) sb.append((char)ch); reset(); return sb.toString();
경고 :
-
솔루션 4, 5 및 9는 다른 줄 바꿈을 하나로 변환합니다.
-
솔루션 11은 유니 코드 텍스트에서 올바르게 작동하지 않습니다
성능 테스트
작은 String
(길이 = 175), github의 url에 대한 성능 테스트 (모드 = 평균 시간, 시스템 = Linux, 점수 1,343이 가장 좋음) :
Benchmark Mode Cnt Score Error Units
8. ByteArrayOutputStream and read (JDK) avgt 10 1,343 ± 0,028 us/op
6. InputStreamReader and StringBuilder (JDK) avgt 10 6,980 ± 0,404 us/op
10. BufferedInputStream, ByteArrayOutputStream avgt 10 7,437 ± 0,735 us/op
11. InputStream.read() and StringBuilder (JDK) avgt 10 8,977 ± 0,328 us/op
7. StringWriter and IOUtils.copy (Apache) avgt 10 10,613 ± 0,599 us/op
1. IOUtils.toString (Apache Utils) avgt 10 10,605 ± 0,527 us/op
3. Scanner (JDK) avgt 10 12,083 ± 0,293 us/op
2. CharStreams (guava) avgt 10 12,999 ± 0,514 us/op
4. Stream Api (Java 8) avgt 10 15,811 ± 0,605 us/op
9. BufferedReader (JDK) avgt 10 16,038 ± 0,711 us/op
5. parallel Stream Api (Java 8) avgt 10 21,544 ± 0,583 us/op
big String
(길이 = 50100), github의 url에 대한 성능 테스트 (모드 = 평균 시간, 시스템 = Linux, 점수 200,715가 가장 좋음) :
Benchmark Mode Cnt Score Error Units
8. ByteArrayOutputStream and read (JDK) avgt 10 200,715 ± 18,103 us/op
1. IOUtils.toString (Apache Utils) avgt 10 300,019 ± 8,751 us/op
6. InputStreamReader and StringBuilder (JDK) avgt 10 347,616 ± 130,348 us/op
7. StringWriter and IOUtils.copy (Apache) avgt 10 352,791 ± 105,337 us/op
2. CharStreams (guava) avgt 10 420,137 ± 59,877 us/op
9. BufferedReader (JDK) avgt 10 632,028 ± 17,002 us/op
5. parallel Stream Api (Java 8) avgt 10 662,999 ± 46,199 us/op
4. Stream Api (Java 8) avgt 10 701,269 ± 82,296 us/op
10. BufferedInputStream, ByteArrayOutputStream avgt 10 740,837 ± 5,613 us/op
3. Scanner (JDK) avgt 10 751,417 ± 62,026 us/op
11. InputStream.read() and StringBuilder (JDK) avgt 10 2919,350 ± 1101,942 us/op
그래프 (Windows 7 시스템의 입력 스트림 길이에 따른 성능 테스트)
Windows 7 시스템의 입력 스트림 길이에 따른 성능 테스트 (평균 시간) :
length 182 546 1092 3276 9828 29484 58968
test8 0.38 0.938 1.868 4.448 13.412 36.459 72.708
test4 2.362 3.609 5.573 12.769 40.74 81.415 159.864
test5 3.881 5.075 6.904 14.123 50.258 129.937 166.162
test9 2.237 3.493 5.422 11.977 45.98 89.336 177.39
test6 1.261 2.12 4.38 10.698 31.821 86.106 186.636
test7 1.601 2.391 3.646 8.367 38.196 110.221 211.016
test1 1.529 2.381 3.527 8.411 40.551 105.16 212.573
test3 3.035 3.934 8.606 20.858 61.571 118.744 235.428
test2 3.136 6.238 10.508 33.48 43.532 118.044 239.481
test10 1.593 4.736 7.527 20.557 59.856 162.907 323.147
test11 3.913 11.506 23.26 68.644 207.591 600.444 1211.545
답변
표준 Java 라이브러리 만 사용하는 방법이 있습니다 (스트림은 닫히지 않으며 마일리지는 다를 수 있습니다).
static String convertStreamToString(java.io.InputStream is) {
java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
return s.hasNext() ? s.next() : "";
}
“Stupid Scanner tricks” 기사 에서이 트릭을 배웠습니다 . 이것이 작동하는 이유는 스캐너 가 스트림의 토큰을 반복 하기 때문에 “입력 경계의 시작”(\ A)을 사용하여 토큰을 분리하여 스트림의 전체 내용에 대해 하나의 토큰 만 제공하기 때문입니다.
입력 스트림의 인코딩에 대해 구체적이어야 Scanner
하는 경우 사용할 문자 세트 (예 : “UTF-8”)를 나타내는 두 번째 인수를 생성자에 제공 할 수 있습니다 .
모자 팁도 야곱 에게 갔다.
답변
Apache Commons는 다음을 허용합니다.
String myString = IOUtils.toString(myInputStream, "UTF-8");
물론 UTF-8 이외의 다른 문자 인코딩을 선택할 수도 있습니다.
참조 : ( documentation )
답변
파일을 고려하면 먼저 java.io.Reader
인스턴스를 가져와야합니다. 그런 다음 이것을 읽고 추가 할 수 있습니다 StringBuilder
( StringBuffer
여러 스레드에서 액세스하지 않으면 StringBuilder
더 빠를 필요 가 없습니다 ). 여기서 트릭은 블록 단위로 작업하므로 다른 버퍼링 스트림이 필요하지 않다는 것입니다. 블록 크기는 런타임 성능 최적화를 위해 매개 변수화됩니다.
public static String slurp(final InputStream is, final int bufferSize) {
final char[] buffer = new char[bufferSize];
final StringBuilder out = new StringBuilder();
try (Reader in = new InputStreamReader(is, "UTF-8")) {
for (;;) {
int rsz = in.read(buffer, 0, buffer.length);
if (rsz < 0)
break;
out.append(buffer, 0, rsz);
}
}
catch (UnsupportedEncodingException ex) {
/* ... */
}
catch (IOException ex) {
/* ... */
}
return out.toString();
}
답변
사용하다:
InputStream in = /* Your InputStream */;
StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;
while ((read=br.readLine()) != null) {
//System.out.println(read);
sb.append(read);
}
br.close();
return sb.toString();
답변
Google 컬렉션 / 구아바를 사용하는 경우 다음을 수행 할 수 있습니다.
InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);
에 대한 두 번째 매개 변수 (예 : Charsets.UTF_8) InputStreamReader
는 필요하지 않지만 일반적으로 인코딩을 알고 있으면이를 지정하는 것이 좋습니다.