[php] 잘못된 바이트 수 길이로 인해 손상된 직렬화 된 문자열을 복구하는 방법은 무엇입니까?

이미지 업로드 플러그인과 함께 Hotaru CMS를 사용하고 있습니다. 게시물에 이미지를 첨부하려고하면이 오류가 발생합니다. 그렇지 않으면 오류가 없습니다.

unserialize () [function.unserialize] : 오프셋 오류

문제가되는 코드 (오류가 **와 일치 함) :

/**
     * Retrieve submission step data
     *
     * @param $key - empty when setting
     * @return bool
     */
    public function loadSubmitData($h, $key = '')
    {
        // delete everything in this table older than 30 minutes:
        $this->deleteTempData($h->db);

        if (!$key) { return false; }

        $cleanKey = preg_replace('/[^a-z0-9]+/','',$key);
        if (strcmp($key,$cleanKey) != 0) {
            return false;
        } else {
            $sql = "SELECT tempdata_value FROM " . TABLE_TEMPDATA . " WHERE tempdata_key = %s ORDER BY tempdata_updatedts DESC LIMIT 1";
            $submitted_data = $h->db->get_var($h->db->prepare($sql, $key));
            **if ($submitted_data) { return unserialize($submitted_data); } else { return false; }** 
        }
    }

테이블의 데이터, 끝 비트에 이미지 정보가 있음을 알 수 있습니다. 저는 PHP 전문가가 아니므로 여러분이 어떻게 생각할지 궁금합니다.

tempdata_value :

a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";}

편집 : 직렬화 비트를 찾은 것 같습니다 …

/**
     * Save submission step data
     *
     * @return bool
     */
    public function saveSubmitData($h)
    {
        // delete everything in this table older than 30 minutes:
        $this->deleteTempData($h->db);

        $sid = preg_replace('/[^a-z0-9]+/i', '', session_id());
        $key = md5(microtime() . $sid . rand());
        $sql = "INSERT INTO " . TABLE_TEMPDATA . " (tempdata_key, tempdata_value, tempdata_updateby) VALUES (%s,%s, %d)";
        $h->db->query($h->db->prepare($sql, $key, serialize($h->vars['submitted_data']), $h->currentUser->id));
        return $key;
    }



답변

unserialize() [function.unserialize]: Error at offsetinvalid serialization data유효하지 않은 길이 로 인해

빠른 수정

당신이 할 수있는 것은 recalculating the length직렬화 된 배열의 요소입니다.

현재 직렬화 된 데이터

$data = 'a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";}';

재 계산이없는 예

var_dump(unserialize($data));

산출

Notice: unserialize() [function.unserialize]: Error at offset 337 of 338 bytes

재 계산

$data = preg_replace('!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'", $data);
var_dump(unserialize($data));

산출

array
  'submit_editorial' => boolean false
  'submit_orig_url' => string 'www.bbc.co.uk' (length=13)
  'submit_title' => string 'No title found' (length=14)
  'submit_content' => string 'dnfsdkfjdfdf' (length=12)
  'submit_category' => int 2
  'submit_tags' => string 'bbc' (length=3)
  'submit_id' => boolean false
  'submit_subscribe' => int 0
  'submit_comments' => string 'open' (length=4)
  'image' => string 'C:fakepath100.jpg' (length=17)

추천 .. 나

이런 종류의 빠른 수정을 사용하는 대신 … 질문을 업데이트 할 때 조언을 드리겠습니다.

  • 데이터 직렬화 방법

  • 저장 방법 ..

=============================== 편집 1 ================ ===============

오류

오류 때문에 큰 따옴표의 사용으로 생성 된 "대신 작은 따옴표 '이유 C:\fakepath\100.png로 전환되었다C:fakepath100.jpg

오류를 수정하려면

당신은 변경해야합니다 $h->vars['submitted_data'](꽤 분량의 주에서 ')

바꾸다

 $h->vars['submitted_data']['image'] = "C:\fakepath\100.png" ;

 $h->vars['submitted_data']['image'] = 'C:\fakepath\100.png' ;

추가 필터

serialize를 호출하기 전에이 간단한 필터를 추가 할 수도 있습니다.

function satitize(&$value, $key)
{
    $value = addslashes($value);
}

array_walk($h->vars['submitted_data'], "satitize");

UTF 문자가 있으면 실행할 수도 있습니다.

 $h->vars['submitted_data'] = array_map("utf8_encode",$h->vars['submitted_data']);

향후 직렬화 된 데이터에서 문제를 감지하는 방법

  findSerializeError ( $data1 ) ;

산출

Diffrence 9 != 7
    -> ORD number 57 != 55
    -> Line Number = 315
    -> Section Data1  = pen";s:5:"image";s:19:"C:fakepath100.jpg
    -> Section Data2  = pen";s:5:"image";s:17:"C:fakepath100.jpg
                                            ^------- The Error (Element Length)

findSerializeError 함수

function findSerializeError($data1) {
    echo "<pre>";
    $data2 = preg_replace ( '!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'",$data1 );
    $max = (strlen ( $data1 ) > strlen ( $data2 )) ? strlen ( $data1 ) : strlen ( $data2 );

    echo $data1 . PHP_EOL;
    echo $data2 . PHP_EOL;

    for($i = 0; $i < $max; $i ++) {

        if (@$data1 {$i} !== @$data2 {$i}) {

            echo "Diffrence ", @$data1 {$i}, " != ", @$data2 {$i}, PHP_EOL;
            echo "\t-> ORD number ", ord ( @$data1 {$i} ), " != ", ord ( @$data2 {$i} ), PHP_EOL;
            echo "\t-> Line Number = $i" . PHP_EOL;

            $start = ($i - 20);
            $start = ($start < 0) ? 0 : $start;
            $length = 40;

            $point = $max - $i;
            if ($point < 20) {
                $rlength = 1;
                $rpoint = - $point;
            } else {
                $rpoint = $length - 20;
                $rlength = 1;
            }

            echo "\t-> Section Data1  = ", substr_replace ( substr ( $data1, $start, $length ), "<b style=\"color:green\">{$data1 {$i}}</b>", $rpoint, $rlength ), PHP_EOL;
            echo "\t-> Section Data2  = ", substr_replace ( substr ( $data2, $start, $length ), "<b style=\"color:red\">{$data2 {$i}}</b>", $rpoint, $rlength ), PHP_EOL;
        }

    }

}

데이터베이스에 저장하는 더 좋은 방법

$toDatabse = base64_encode(serialize($data));  // Save to database
$fromDatabase = unserialize(base64_decode($data)); //Getting Save Format 


답변

나는 논평 할만한 평판이 충분하지 않기 때문에 위의 “정확한”답변을 사용하는 사람들이 이것을 보길 바랍니다.

PHP 5.5 이후 preg_replace ()의 / e 수정자는 완전히 사용되지 않으며 위의 preg_match는 오류가 발생합니다. PHP 문서는 대신 preg_match_callback을 사용하도록 권장합니다.

위에서 제안한 preg_match의 대안으로 다음 솔루션을 찾으십시오.

$fixed_data = preg_replace_callback ( '!s:(\d+):"(.*?)";!', function($match) {      
    return ($match[1] == strlen($match[2])) ? $match[0] : 's:' . strlen($match[2]) . ':"' . $match[2] . '";';
},$bad_data );


답변

unserialize()직렬화 된 데이터를 데이터베이스에 부적절하게 넣었 기 때문에 실패한 또 다른 이유 가 있습니다. 여기의 공식 설명을 참조 하십시오. 이후 serialize()반환 이진 데이터와 PHP 변수 방법을 인코딩 상관 없어, TEXT로 퍼팅 그래서, VARCHAR ()이 오류가 발생합니다.

솔루션 : 직렬화 된 데이터를 테이블의 BLOB에 저장하십시오.


답변

빠른 수정

직렬화 된 배열의 요소 길이 재 계산-사용하지 마십시오 (preg_replace) 더 이상 사용되지 않음-더 나은 preg_replace_callback 사용 :

편집 : 새 버전 지금은 단지 잘못되지 길이지만 또한 수정 행 구분 및 aczent와 올바른 문자를 계산 (덕분에 mickmackusa )

// New Version
$data = preg_replace_callback('!s:\d+:"(.*?)";!s', function($m) { return "s:" . strlen($m[1]) . ':"'.$m[1].'";'; }, $data);


답변

이 오류는 문자 세트가 잘못 되었기 때문에 발생합니다.

열린 태그 뒤에 문자 세트 설정 :

header('Content-Type: text/html; charset=utf-8');

그리고 데이터베이스에 charset utf8을 설정하십시오.

mysql_query("SET NAMES 'utf8'");


답변

멀티 바이트 문자 처리 와 함께 다음 함수를 사용하여 끊어진 직렬화 문자열을 수정할 수 있습니다 .

function repairSerializeString($value)
{

    $regex = '/s:([0-9]+):"(.*?)"/';

    return preg_replace_callback(
        $regex, function($match) {
            return "s:".mb_strlen($match[2]).":\"".$match[2]."\""; 
        },
        $value
    );
}


답변

public function unserializeKeySkills ($ string) {

    $output = array();
    $string = trim(preg_replace('/\s\s+/', ' ',$string));
    $string = preg_replace_callback('!s:(\d+):"(.*?)";!', function($m) { return 's:'.strlen($m[2]).':"'.$m[2].'";'; }, utf8_encode( trim(preg_replace('/\s\s+/', ' ',$string)) ));
    try {
        $output =  unserialize($string);
    } catch (\Exception $e) {
        \Log::error("unserialize Data : " .print_r($string,true));
    }
    return $output;
}