[java] 문자열 길이를 기준으로 문자열 자르기

길이가 10자를 초과하면 문자열을 자르고 싶습니다.

문자열 길이가 12 ( String s="abcdafghijkl")이면 새 트림 된 문자열에가 포함 "abcdefgh.."됩니다.

어떻게하면 되나요?



답변

s = s.substring(0, Math.min(s.length(), 10));

Math.min이와 같이 사용 하면 문자열이 이미보다 짧은 경우 예외가 발생하지 않습니다 10.


노트:

  1. 위의 실제 트리밍을 수행합니다. 마지막 세 문자 (!)를 잘 리면 점으로 바꾸려면 Apache Commons를 사용하십시오 StringUtils.abbreviate.

  2. 문자열에 BMP 외부의 유니 코드 코드 포인트가 포함되어 있으면 1 이 잘못 작동 할 수 있습니다 . 예를 들어 이모티콘. 모든 유니 코드 코드 포인트에 대해 올바르게 작동하는 (더 복잡한) 솔루션은 @ sibnick ‘s solution을 참조하십시오 .


1-평면 0에없는 유니 코드 코드 포인트 (BMP)는에서 “대리 쌍”(즉, 두 char값)으로 표시 String됩니다. 이것을 무시함으로써, 우리는 10 개 미만의 코드 포인트로 트리밍하거나, 대리 쌍의 중간에서 (나쁘게) 잘릴 수 있습니다. 반면에 String.length()더 이상 유니 코드 텍스트 길이의 이상적인 측정 값이 아니므로이를 기반으로 트리밍하는 것이 잘못되었을 수 있습니다.


답변

StringUtils.abbreviateApache Commons Lang 라이브러리 에서 친구가 될 수 있습니다.

StringUtils.abbreviate("abcdefg", 6) = "abc..."
StringUtils.abbreviate("abcdefg", 7) = "abcdefg"
StringUtils.abbreviate("abcdefg", 8) = "abcdefg"
StringUtils.abbreviate("abcdefg", 4) = "a..."

Commons Lang3은 심지어 사용자 정의 문자열을 대체 마커로 설정할 수 있습니다. 이를 통해 예를 들어 단일 문자 줄임표를 설정할 수 있습니다.

StringUtils.abbreviate("abcdefg", "\u2026", 6) = "abcde…"


답변

StringUtils이를 수행 하는 Apache Commons 기능이 있습니다.

s = StringUtils.left(s, 10)

len 문자를 사용할 수 없거나 문자열이 null 인 경우 예외없이 문자열이 반환됩니다. len이 음수이면 빈 문자열이 반환됩니다.

StringUtils.left (null, ) = null
StringUtils.left (
, -ve) = “”
StringUtils.left ( “”, *) = “”
StringUtils.left ( “abc”, 0) = “”
StringUtils.left ( ” abc “, 2) =”ab ”
StringUtils.left (“abc “, 4) =”abc “

StringUtils. 왼쪽 JavaDocs

예의 : Steeve McCauley


답변

평소처럼 아무도 UTF-16 대리 쌍을 신경 쓰지 않습니다. 그들에 대해보십시오 : 실제로 사용되는 가장 일반적인 비 BMP 유니 코드 문자는 무엇입니까? org.apache.commons / commons-lang3의 저자도

이 샘플에서 올바른 코드와 일반적인 코드의 차이점을 확인할 수 있습니다.

public static void main(String[] args) {
    //string with FACE WITH TEARS OF JOY symbol
    String s = "abcdafghi\uD83D\uDE02cdefg";
    int maxWidth = 10;
    System.out.println(s);
    //do not care about UTF-16 surrogate pairs
    System.out.println(s.substring(0, Math.min(s.length(), maxWidth)));
    //correctly process UTF-16 surrogate pairs
    if(s.length()>maxWidth){
        int correctedMaxWidth = (Character.isLowSurrogate(s.charAt(maxWidth)))&&maxWidth>0 ? maxWidth-1 : maxWidth;
        System.out.println(s.substring(0, Math.min(s.length(), correctedMaxWidth)));
    }
}


답변

s = s.length() > 10 ? s.substring(0, 9) : s;


답변

또는 StringUtils가없는 경우이 방법을 사용할 수 있습니다.

public static String abbreviateString(String input, int maxLength) {
    if (input.length() <= maxLength)
        return input;
    else
        return input.substring(0, maxLength-2) + "..";
}


답변

문자열의 마지막 10자를 자르고 유지하는 방법을 찾고있는 경우를 대비하여.

s = s.substring(Math.max(s.length(),10) - 10);